在 线 测 试 离 我 们 有 多 远? 语 言 在 线 测 试 调 研 报 告 陈 晓 红, 蔡 静 ( 北 京 外 国 语 大 学 网 络 教 育 学 院, 北 京 100089) 摘 要 : 本 文 是 一 篇 关 于 英 语 在 线 测 试 的 调 研 报 告, 由 三 部 分 组 成 第 一 部 分 介 绍 计 算 机 在 语 言 测 试 中 的 重 要 作 用 及 各 种 基 于 计 算 机 的 英 语 测 试 的 优 缺 点, 并 着 重 指 出 : 在 线 测 试 自 身 的 特 点 决 定 了 它 适 用 于 和 测 试 者 自 身 利 益 相 关 不 大 的 考 试, 如 自 我 评 估 和 诊 断 测 试 等 ; 听 力 和 阅 读 是 两 种 最 适 合 在 线 测 试 的 语 言 技 能 第 二 部 分 介 绍 和 分 析 欧 洲 委 员 会 的 一 个 语 言 在 线 测 试 系 统 DIALANG 第 三 部 分 展 望 英 语 在 线 测 试 的 未 来, 即 在 线 测 试 将 来 不 可 能 完 全 代 替 纸 笔 考 试, 而 是 作 为 传 统 测 试 的 一 种 补 充 手 段 关 键 词 : 在 线 测 试 ; 语 言 技 能 中 图 分 类 号 :H319 文 献 标 识 码 :A 1. 概 述 远 程 教 育 学 生, 特 别 是 网 络 教 育 的 学 生 经 常 问 这 样 一 个 问 题 : 为 什 么 我 们 不 可 以 坐 在 家 中, 挑 一 个 自 己 方 便 的 时 间 参 加 考 试 呢? 为 什 么 我 们 非 得 参 加 传 统 的 纸 笔 考 试 呢? 学 生 们 这 样 问 是 有 道 理 的 毕 竟, 他 们 在 日 常 的 学 习 过 程 中, 经 常 上 网, 而 且 作 业 和 论 文 都 是 上 网 完 成 的 如 果 测 试 和 学 习 者 日 常 学 习 不 吻 合, 必 定 会 影 响 到 测 试 的 结 果, 因 为 学 习 者 如 若 想 学 业 成 功 而 且 要 从 评 估 过 程 中 得 到 有 效 可 靠 的 结 果, 教 学 方 式 学 习 方 式 评 估 方 式 必 须 贯 通 一 致 (Atkinson & Davies, 2000) Russell 和 Haney 所 做 的 研 究 就 表 明 纸 介 的 开 放 式 问 题 会 使 习 惯 于 用 计 算 机 写 作 的 学 生 考 分 偏 低 然 而 学 生 们 心 目 中 的 那 种 在 任 何 时 间 任 何 地 点 都 可 以 进 行 的 在 线 测 试 目 前 还 无 法 实 现, 因 为 这 种 考 试 的 安 全 性 得 不 到 保 证, 从 而 其 效 度 信 度 都 会 受 到 质 疑 不 过, 随 着 IT 行 业 的 快 速 发 展, 计 算 机 会 在 语 言 测 试 中 起 到 越 来 越 重 要 的 作 用 目 前, 宽 带 网 的 浏 览 和 传 输 功 能 已 经 使 之 成 为 一 个 非 常 有 潜 力 的 测 试 工 具 为 了 使 大 家 对 在 线 测 试 了 解 得 更 加 清 楚, 本 文 简 单 介 绍 一 下 计 算 机 在 语 言 测 试 中 角 色 的 演 变 2. 计 算 机 在 语 言 测 试 中 角 色 的 演 变 2.1 阅 卷 机 机 器 在 语 言 测 试 中 的 使 用 可 以 追 溯 到 1935 年, 一 台 IBM805 机 器 被 用 于 批 改 客 观 试 题 以 节 省 人 工 和 削 减 大 规 模 考 试 中 的 阅 卷 费 用 由 于 这 些 高 效 的 阅 卷 机, 单 项 选 择 在 语 言 测 试 中 得 到 广 泛 应 用 谈 到 阅 卷 机,Glenn Flucher 甚 至 说 : 单 项 选 择 已 被 使 用 了 一 个 世 纪, 原 因 不 是 因 为 这 种 题 型 本 身 有 多 么 可 靠, 而 是 因 为 易 于 机 器 阅 卷 (2000) 2.2 基 于 计 算 机 的 测 试 (CBT) 计 算 机 的 软 硬 件 技 术 日 新 月 异, 技 术 成 本 一 直 呈 现 下 降 趋 势, 因 此 计 算 机 在 测 试 中 的 作 用 早 已 超 越 了 批 阅 客 观 题 的 工 具, 它 已 成 为 测 试 得 以 实 施 的 一 种 载 体 在 计 算 机 终 端 和 个
人 电 脑 上 进 行 的 测 试, 称 为 基 于 计 算 机 的 测 试 下 列 是 计 算 机 用 于 语 言 测 试 的 一 些 主 要 领 域 (Burstein, Frase, Ginther and Grant, 1997): 命 题 : 在 不 同 地 点 工 作 的 命 题 人 员 可 以 用 计 算 机 交 流 文 字 和 图 形 资 料 考 题 的 建 设 : 在 考 题 的 审 核 过 程 中, 通 过 使 用 计 算 机, 命 题 人 员 和 审 题 人 员 可 以 交 流 考 题 文 字 图 形 资 料 考 题 试 测 : 在 试 测 过 程 中, 试 测 者 的 答 案 存 储 在 计 算 机 里, 有 关 试 题 难 度 的 数 据 同 试 题 一 起 存 放 在 数 据 库 里 考 题 的 传 输 : 把 考 题 从 数 据 库 中 传 输 出 去, 包 括 提 取 和 储 存 应 试 者 的 答 案 对 应 试 者 身 份 的 确 认 包 括 在 此 过 程 中 试 题 的 管 理 : 储 存 和 更 新 考 题 考 题 的 批 改 及 把 测 试 者 的 答 案 转 变 为 分 数 考 题 解 析 : 分 数 的 解 析 报 告 分 数 : 提 供 分 数 及 相 关 信 息 很 明 显, 计 算 机 主 要 用 于 试 题 的 传 输 和 考 试 的 实 施 在 其 初 始 阶 段, 基 于 计 算 机 的 测 试 和 传 统 的 纸 笔 考 试 有 许 多 相 同 之 处, 两 者 都 是 建 立 在 传 统 的 测 试 理 论 基 础 上, 不 同 之 处 仅 是 在 于 考 试 实 施 的 载 体 不 同 James Brown 谈 到 基 于 计 算 机 的 测 试 时, 似 乎 有 点 过 分 乐 观 : 机 辅 语 言 测 试 的 两 个 主 要 优 点 是 : 一 机 辅 语 言 测 试 可 以 实 现 测 试 者 的 个 性 化 服 务, 甚 至 可 以 随 来 随 考 群 体 的 测 试 可 以 取 消, 其 组 织 上 的 局 限 性 也 可 以 克 服 二 考 试 的 时 间 限 制 可 以 取 消 学 生 需 要 用 多 少 时 间 做 题 都 可 以, 因 为 没 有 监 考 老 师 等 在 一 旁 (1997) 但 实 际 情 况 却 是, 没 有 监 考 老 师 的 参 与, 作 弊 现 象 难 以 避 免, 从 而 导 致 考 试 的 结 果 难 以 令 人 信 服 譬 如, 由 美 国 教 育 考 试 中 心 (ETS) 组 织 的 世 界 上 最 著 名 的 基 于 计 算 机 的 两 种 考 试 GRE 和 GMAT 仍 然 是 在 监 考 严 格 的 语 言 实 验 室 中 群 体 实 施, 考 试 的 时 间 也 有 明 确 的 限 制 同 纸 笔 考 试 相 比 较, 基 于 计 算 机 的 考 试 有 其 自 身 固 有 的 一 些 优 点, 如 考 试 易 于 实 施 试 题 易 于 批 改 等 基 于 计 算 机 的 考 试 的 另 一 大 优 点 是 考 试 者 可 以 得 到 即 时 的 反 馈, 从 而 得 知 自 己 的 学 业 是 否 取 得 了 进 步 此 外, 计 算 机 的 题 目 解 析 能 力 便 于 老 师 跟 踪 学 生 的 语 言 能 力 发 展, 更 好 地 理 解 学 生 的 问 题 在 哪 里 老 师 的 教 学 工 作 也 因 此 可 以 更 适 合 学 生 个 人 的 需 求, 有 利 于 教 学 相 长 尽 管 基 于 计 算 机 的 测 试 有 可 能 改 善 语 言 测 试 体 系, 但 它 现 阶 段 还 存 在 一 些 不 尽 如 人 意 之 处, 如 测 试 者 对 计 算 机 使 用 的 熟 练 程 度 会 影 响 测 试 结 果 Kirsch, Eignor, Taylor 等 人 的 研 究 表 明 参 加 托 福 机 考 的 测 试 者 中,16% 的 人 因 使 用 计 算 机 作 为 考 试 的 工 具, 成 绩 受 到 了 影 响 为 了 减 少 因 计 算 机 的 使 用 而 产 生 的 焦 虑,ETS 要 求 所 有 参 加 托 福 机 考 者, 在 考 试 前 必 须 参 加 一 次 面 授 辅 导 ;ETS 还 给 想 要 参 加 考 试 者 提 供 免 费 的 CD 盘 ;ETS 考 虑 到 打 字 速 度 对 测 试 者 的 影 响, 还 允 许 测 试 者 在 参 加 新 托 福 写 作 考 试 时, 在 手 写 或 打 印 所 写 的 文 章 之 间 做 选 择 基 于 计 算 机 测 试 的 另 一 局 限 在 于 它 通 常 只 能 测 试 听 和 读 两 项 技 能, 题 目 类 型 仅 限 于 单 项 选 择 和 简 单 的 填 空 题 由 于 基 于 计 算 机 的 测 试 不 便 包 括 开 放 型 的 题 目, 使 得 此 种 考 试 的 深 度 和 广 度 受 到 了 很 大 的 限 制 即 便 在 考 察 阅 读 技 巧 时, 也 未 能 尽 如 人 意 : 计 算 机 屏 幕 容 量 有 限, 阅 读 篇 章 和 题 目 经 常 分 屏 显 示, 致 使 记 忆 力 成 为 影 响 成 绩 的 一 个 重 要 因 素, 从 而 减 弱 了 对 阅 读 能 力 的 测 试 效 果 在 新 托 福 的 机 考 中, 对 测 试 者 口 语 和 写 作 的 评 估 依 旧 是 由 人 来 完 成 的 可 见, 在 现 阶 段, 计 算 机 对 测 试 者 在 口 语 和 写 作 方 面 的 评 估 效 果 还 不 甚 理 想
语 言 实 验 室 的 修 建 成 本 及 语 言 测 试 软 件 的 制 作 成 本 较 高, 阻 碍 了 基 于 计 算 机 的 测 试 的 发 展 好 的 语 言 测 试 软 件 通 常 需 要 测 试 专 家 和 软 件 专 家 的 通 力 合 作, 这 种 制 作 成 本 通 常 为 普 通 的 软 件 公 司 难 以 承 受, 因 此 许 多 市 售 的 测 试 软 件 或 者 难 于 操 作, 或 者 测 试 价 值 不 大 2.3 计 算 机 化 自 适 应 考 试 (CAT) 近 几 十 年 来, 计 算 机 化 自 适 应 考 试 (CAT) 是 基 于 计 算 机 测 试 的 一 个 重 要 发 展 在 这 种 考 试 中, 计 算 机 根 据 测 试 者 的 实 际 表 现, 动 态 地 提 供 题 项 (Reckase,1989) 在 传 统 的 纸 笔 考 试 中, 题 目 次 序 是 固 定 的, 所 有 的 测 试 者 必 须 回 答 一 样 的 问 题 在 固 定 的 考 试 时 间 内, 如 果 测 试 者 首 先 回 答 的 题 目 难 度 太 大, 而 没 有 时 间 回 答 简 单 的 题 目, 测 试 者 的 成 绩 就 会 受 到 影 响 就 此 而 言, 计 算 机 化 自 适 应 考 试 是 语 言 测 试 体 系 的 一 个 积 极 的 创 新, 它 实 质 上 是 一 种 个 性 化 的 测 试, 即 题 目 的 难 度 随 测 试 者 的 语 言 水 平 而 变 化 当 测 试 者 回 答 对 一 道 题 时, 下 道 题 目 的 难 度 就 会 增 加, 反 之 亦 然 这 种 个 性 化 的 测 试 也 会 提 高 考 试 的 安 全 性, 防 止 作 弊 的 发 生 此 测 试 方 法 基 于 这 样 一 种 认 识, 即 如 果 测 试 者 所 做 的 题 目 总 是 太 难 或 太 容 易, 他 或 她 的 语 言 水 平 不 会 得 到 真 实 的 反 映 只 有 当 题 目 的 难 度 和 测 试 者 的 语 言 水 平 相 当 时, 测 试 者 的 能 力 才 能 得 到 最 好 的 体 现 (Wainer,1990) 当 前, 计 算 机 化 自 适 应 考 试 运 用 题 目 反 应 理 论 (item response theory) 来 选 择 题 项 和 评 估 测 试 者 的 语 言 水 平 题 目 反 应 理 论 的 基 础 是 概 率 论, 即 计 算 某 个 人 做 对 某 个 题 目 的 可 能 性 (Dunkel, 1999) 当 一 个 人 的 语 言 能 力 和 题 目 难 度 相 当 时, 做 对 一 道 题 的 可 能 性 为 50% 测 试 者 的 考 试 成 绩 及 考 试 成 绩 所 反 映 的 能 力 可 以 用 题 目 特 征 曲 线 (item characteristic curve) 描 述 随 着 学 生 语 言 水 平 的 增 加, 答 对 的 可 能 性 也 在 增 加 (Alderson, Clapham, & Wall, 1995) 除 了 上 述 的 特 点, 计 算 机 化 自 适 应 考 试 还 有 两 大 优 点 节 省 时 间 和 测 试 范 围 宽 泛 它 在 设 计 之 初 的 目 的 就 是 替 换 令 人 生 畏 费 时 耗 力 的 常 规 考 试 考 试 的 时 间 可 以 事 先 设 定, 也 可 以 由 测 试 者 的 回 答 来 决 定 在 后 一 种 情 况 中, 一 旦 学 生 的 能 力 能 得 到 确 定, 考 试 也 就 随 之 结 束 一 般 说 来, 计 算 机 化 自 适 应 考 试 的 考 试 时 间 较 短, 考 试 的 题 目 数 量 也 较 少 考 试 时, 每 屏 仅 显 现 一 题, 这 会 在 某 种 程 度 上 降 低 学 生 测 试 时 的 焦 虑 和 挫 败 感 值 得 一 提 的 是, 在 计 算 机 化 的 考 试 中, 所 有 题 目 都 由 题 库 提 供 如 果 题 库 足 够 大, 计 算 机 化 的 考 试 就 可 以 测 试 从 水 平 很 低 到 水 平 很 高 的 各 种 应 试 者 这 点 是 非 自 适 应 考 试 无 法 达 到 的, 除 非 考 试 的 题 量 超 常 地 大 (Fulcher,2000) 然 而, 同 其 它 形 式 的 考 试 一 样, 计 算 机 化 自 适 应 考 试 也 存 在 一 些 缺 点 首 先, 建 立 计 算 机 化 自 适 应 考 试 题 库 费 时 耗 力 如 果 题 库 不 够 大, 题 目 使 用 频 率 过 高, 测 试 的 安 全 性 就 不 能 得 到 保 证, 或 者 测 试 群 体 的 面 会 非 常 狭 窄, 语 言 水 平 很 好 或 者 语 言 水 平 很 差 的 学 生 就 不 能 得 到 较 公 正 的 评 估 其 次, 既 然 每 个 测 试 者 所 考 的 题 目 都 不 同, 考 分 解 析 就 比 较 困 难, 需 要 做 大 量 的 调 查 研 究 再 次, 即 使 整 个 题 库 总 体 设 计 能 够 达 到 测 试 设 计 者 欲 评 估 的 语 言 能 力, 但 每 次 测 试 所 使 用 的 只 是 一 小 部 分 试 题, 此 部 分 试 题 能 否 真 实 地 反 映 测 试 者 的 语 言 水 平, 也 令 人 质 疑 最 后 值 得 一 提 的 是, 参 加 计 算 机 化 自 适 应 考 试 时, 测 试 者 无 法 跳 过 不 做 或 重 新 再 做 题 目 (Fulcher,2000) 当 测 试 者 发 现 做 错 了, 而 且 没 有 机 会 改 正 时, 会 感 到 非 常 失 望 2.4 在 线 测 试 (Testing on the Internet) 介 于 宽 带 网 对 信 息 的 快 速 的 传 输 功 能, 人 们 对 利 用 宽 带 网 进 行 测 试 的 期 望 值 越 来 越 高 通 过 宽 带 网, 试 题 可 以 传 输 到 世 界 各 地 在 基 于 网 络 的 考 试 中, 命 题 人 员 可 以 不 依 赖 软 件 专 业 人 士, 因 为 把 考 题 传 输 到 服 务 器 上 所 需 的 技 术 工 具, 相 对 容 易 掌 握, 软 件 上 只 需 一 个 标 准 浏 览 器, 硬 件 设 施 为 一 台 个 人 电 脑 输 入 密 码, 命 题 人 员 把 题 目 传 输 到 平 台 上, 储 存 在 数 据 库 里 学 生 可 以 凭 密 码 进 入 平 台, 从 数 据 库 中 取 出 信 息 学 生 的 答 案 可 以 在 本 地 机 上 批 改, 也 可 以 传 回 服 务 器 批 改 对 不 能 机 改 的 主 观 试 题, 学 生 的 答 案 可 以 通 过 网 络 以 电 子 邮 件 的 形 式 发 给 老 师 这 样 网 络 在 学 生 命 题 人 员 和 老 师 之 间 架 起 沟 通 的 桥 梁, 这 对 教 学 双 方 都 非
常 有 利 技 术 上 说 来, 如 果 计 算 机 可 以 成 功 地 连 接 到 英 特 网 上, 试 题 可 以 在 任 何 时 间 任 何 地 点 通 过 网 络 传 输 给 测 试 者 这 似 乎 对 远 程 教 育 的 学 习 者 和 教 育 者 都 是 一 件 好 事 然 而 在 线 测 试 的 发 展 被 CBT 或 者 CAT 自 身 所 存 在 的 一 些 缺 陷 所 阻 碍 网 络 可 以 把 图 片 视 听 材 料 包 括 在 试 题 中, 从 而 使 试 题 的 外 观 更 加 丰 富, 但 机 考 题 型 的 创 新 却 并 非 易 事, 不 可 能 在 短 期 内 得 以 实 现 除 了 如 服 务 器 失 败 或 浏 览 器 不 配 套 的 问 题, 基 于 网 络 的 考 试 还 有 一 个 致 命 的 缺 陷, 即 安 全 问 题 2003 年, 由 于 试 题 泄 露 问 题,ETS 决 定 把 中 国 大 陆 台 湾 香 港 及 南 韩 机 考 的 GRE 改 回 纸 笔 考 试 的 GRE 考 虑 到 网 络 传 输 信 息 的 快 捷 便 利, 基 于 网 络 的 考 试 在 安 全 性 方 面 受 到 的 压 力 比 基 于 计 算 机 的 考 试 更 大 这 里 所 说 的 安 全 性 不 仅 仅 指 试 题 的 安 全, 还 包 括 试 题 评 判 的 安 全 性 及 测 试 者 身 份 的 确 定 等 只 有 待 形 形 色 色 危 及 考 试 的 安 全 问 题 得 到 解 决 时, 基 于 网 络 的 考 试 才 可 能 用 于 大 规 模 的 与 测 试 者 利 益 相 关 紧 密 的 考 试 中 为 此, 即 使 是 ETS 这 样 的 有 实 力 的 考 试 机 构, 也 没 有 使 用 网 络 来 传 输 试 题 不 过, 如 果 我 们 能 从 一 个 全 新 的 角 度 来 看 待 测 试, 基 于 网 络 的 测 试 又 是 对 传 统 纸 笔 测 试 的 一 种 很 好 的 发 展 如 果 学 生 不 是 只 为 了 分 数 而 考 试, 而 是 把 测 试 视 为 检 查 学 业 进 展, 激 励 自 己 不 断 进 步 的 一 种 手 段, 那 基 于 网 络 的 测 试 会 在 测 试 领 域 扮 演 重 要 角 色 这 种 测 试 适 用 于 和 测 试 者 利 益 相 关 不 大 考 试 中, 如 诊 断 测 试 自 测 等 在 参 加 这 些 考 试 时, 测 试 者 没 有 必 要 作 弊, 考 试 的 安 全 性 可 以 得 到 很 好 的 保 障 恰 如 Carsten Roever 所 言 : 基 于 网 络 的 测 试 是 否 适 合 用 于 某 个 考 试, 取 决 于 此 种 考 试 的 功 利 性 有 多 大 通 常 说 来, 考 试 越 是 和 测 试 者 的 利 益 相 关 不 大, 基 于 网 络 的 测 试 越 是 适 用 (2001) 下 面, 介 绍 一 下 欧 盟 委 员 会 的 一 个 在 线 测 试 体 系 DIALANG 3.DIALANG 在 线 测 试 体 系 DIALANG 在 线 测 试 体 系 是 建 立 在 欧 洲 委 员 会 欧 共 体 评 估 标 准 上 的 语 言 诊 断 测 试 资 金 由 欧 盟 提 供, 系 统 的 目 的 是 对 欧 洲 14 种 语 言 提 供 有 效 的 水 平 诊 断 3.1 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准 欧 洲 委 员 会 是 这 样 描 绘 欧 共 体 语 言 评 估 标 准 的 这 是 一 个 非 常 实 用 的 工 具, 它 明 确 了 学 习 的 不 同 阶 段 应 该 达 到 的 标 准, 它 可 以 评 估 在 不 同 国 家 进 行 的 语 言 教 学 的 效 果 它 在 欧 洲 各 国 课 程 改 革 及 国 际 教 育 联 合 会 对 语 言 证 书 的 比 较 中, 使 用 频 率 越 来 越 高 最 近, 欧 洲 委 员 会 通 过 决 议, 推 荐 用 它 作 为 建 立 对 各 种 语 言 进 行 评 估 的 工 具 (2001) 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准 对 语 言 教 学 和 测 试 人 员 非 常 有 用, 文 件 中 描 述 了 交 际 所 需 的 能 力, 相 关 知 识 和 技 能, 不 同 的 交 际 场 合 和 领 域 它 已 成 为 在 欧 洲 各 国 评 估 语 言 能 力 的 一 个 标 准 按 照 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准, 语 言 能 力 分 为 六 个 层 次 : A1 破 门 :90 学 时 A2 上 路 :180-200 学 时 B1 入 门 :375-400 学 时 B2 良 好 :750 学 时 C1 熟 练 使 用 :1500 学 时 C2 精 通 :3000 学 时
3.2 测 试 流 程 在 DIALANG 测 试 中, 考 察 内 容 有 5 个 方 面 : 语 法 结 构 听 读 写 考 试 的 流 程 如 下 : 选 择 考 试 : 应 试 者 从 5 种 考 试 内 容 中, 选 择 一 种 分 级 测 试 : 分 级 测 试 的 内 容 为 测 试 者 决 定 一 些 动 词 是 否 是 语 言 中 确 实 存 在 的, 还 是 伪 造 的 分 级 测 试 帮 助 测 试 者 了 解 自 己 掌 握 语 言 程 度 的 大 概 状 况 自 我 评 估 : 测 试 者 根 据 所 给 的 描 述, 对 自 己 的 语 言 能 力 进 行 自 我 评 估 如 果 在 此 阶 段, 测 试 者 对 自 己 的 能 力 估 计 过 高, 或 估 计 过 低,DIALANG 测 试 系 统 会 在 考 试 后 的 反 馈 中 指 出 语 言 测 试 : 在 此 阶 段, 测 试 者 做 自 己 选 择 的 测 试 内 容 如 果 测 试 者 跳 过 分 级 测 试 和 自 我 评 估 两 个 选 做 步 骤, 测 试 题 就 有 可 能 会 太 难 或 太 简 单 测 试 者 必 须 完 成 全 部 测 试 题, 否 则 不 能 得 到 任 何 结 果 反 馈 : 测 试 者 完 成 测 试 后, 就 可 以 得 到 答 案 和 反 馈 意 见, 也 可 以 重 新 选 择 其 它 的 测 试 内 容 3.3 DIALANG 在 线 测 试 体 系 的 优 缺 点 作 为 一 个 在 线 测 试 体 系,DIALANG 的 优 点 如 下 : 首 先, 它 是 一 个 非 赢 利 的 测 试 体 系, 语 言 学 习 者 可 以 随 时 随 地 参 加 考 试 ; 其 次, 它 是 一 个 多 语 言 的 测 试 系 统 ; 再 次, 它 对 语 言 的 自 学 者 特 别 有 用, 因 为 它 可 以 相 对 真 实 地 反 映 学 习 者 的 语 言 能 力 ; 最 后, 它 对 测 试 者 的 语 言 水 平 分 技 能 进 行 测 试, 并 提 供 针 对 各 项 语 言 技 能 的 反 馈 DIALANG 测 试 体 系 目 前 还 在 实 验 阶 段, 自 身 还 存 在 许 多 弱 点 其 一 考 试 时 间 没 有 限 定, 不 利 于 对 阅 读 能 力 的 评 估, 因 为 众 所 周 知, 阅 读 速 度 是 阅 读 能 力 的 一 个 重 要 组 成 部 分 ; 其 二, 该 测 试 体 系 包 括 对 写 作 技 能 的 测 试, 题 型 仍 旧 为 选 择 填 空 等, 写 作 能 力 是 否 能 这 样 来 评 估, 令 人 质 疑 ; 其 三 如 服 务 器 失 灵 等 技 术 问 题, 也 会 阻 碍 测 试 者 顺 利 答 题 4. 在 线 测 试 的 未 来 从 上 述 分 析 不 难 看 出, 宽 带 网 未 来 可 能 成 为 一 个 主 要 的 考 试 载 体 不 过, 在 线 测 试 即 使 在 未 来 也 不 可 能 完 全 代 替 纸 介 考 试, 但 它 是 纸 介 考 试 的 一 种 很 好 的 补 充 因 为, 在 线 测 试 自 身 就 是 一 个 矛 盾 体 : 一 方 面, 它 最 大 的 优 点 就 是 在 任 何 时 间 任 何 地 点 都 可 以 进 行 的 自 适 应 考 试 ; 另 一 方 面, 一 旦 它 用 于 和 测 试 者 自 身 利 益 联 系 紧 密 的 考 试 中, 就 必 须 在 监 考 严 格 的 教 室 中 进 行, 因 此 也 就 丧 失 了 它 的 优 势 而 且 在 可 以 预 见 的 未 来, 说 和 写 也 很 难 由 机 器 来 评 估 可 以 说, 在 线 测 试 取 代 传 统 的 考 试 犹 如 机 器 人 代 替 人 类 一 样 遥 不 可 及 在 语 言 学 家 可 以 把 语 言 的 认 知 过 程 变 成 计 算 机 可 以 理 解 的 程 序 之 前, 试 题 的 开 发 者 只 能 充 分 认 识 在 线 测 试 的 特 点, 将 它 用 于 和 测 试 者 利 益 相 关 不 大 的 考 试 中 参 考 文 献 [1]Alderson, J.C., Clapham, C. & Wall, D. Language Test Construction and Evaluation[M], Cambridge University Press, 1995. [2]Atkingson, T and Davies, G. Computer Aided Assessment and Language Learning[J], ICLT4LT, 2000. [3]Brown, James Dean, Computers in Language Testing: Present Research and Some Future Directions [J]. Language Learning & Technology, Vol.1, 1997, [4]Burstein, J., Frase, L., Ginther, A., &Grant, L. Technologies for Language Assessment[J]. Annual
Review of Applied Linguistics, 1997. [5]Council of Europe. Common European Framework of Reference: Learning, Teaching, Assessment[M]. Cambridge University Press, 2001. [6]Dunkel, Patricia A. Considerations in Developing or Using Second/Foreign Language Proficiency Computer-adaptive Tests [J]. Language Learning & Technology, 1999. [7]Fulcher, Glenn. Computers in Language Testing[M]. IATEFL Publications, 2000 [8]Reckase, M.D. Adaptive Testing: the Evolution of a Good Idea [J] Educational Measurement: Issues and Practice. 1989(8). [9]Roever, Carsten. Web-Based Language Testing[J]. Language Learning & Technology, 2001(5). [10]Russell, M.& Haney, W. Testing writing on computers: an experiment comparing student performance on tests conducted via computer and via paper-and-pencil[j]. Education Policy Analysis Archives, 1997, 5 (3). [11]Wainer, H. Computer Adaptive Testing: A Primer[M]. Hillsdale: Lawrence Erlbaum Associates, 1990. A Survey on Language Online Testing CHEN Xiaohong, CAI Jing (Institute of Online Education, Beijing Foreign Studies University, Beijing 100089, China) Abstract: This article is a survey of language online testing. It consists of three parts. The first part describes how computers get increasingly involved in language tests and the advantages and limitations of all kinds of computer-based testing. It is argued that due to its characteristics, online testing is now most suitable for zero-stakes testing situations, such as diagnostic tests, test preparation and self-assessment; among the four language skills, listening and reading are the two language skills which can be tested online. The second part contributes to a detailed introduction and analysis of DIALANG project a diagnostic testing system whose assessment criteria are based on the proficiency levels of the Common European Framework of the Council of Europe. The third part envisages the future of English online testing, i.e. online testing can be a good alternative to paper-based tests but cannot fully replace it. Key words:online testing;language skills 收 稿 日 期 :2004-11-27; 本 刊 修 订 稿 :2004-12-04 作 者 简 介 : 陈 晓 红 蔡 静, 北 京 外 国 语 大 学 网 络 教 育 学 院 讲 师, 英 语 硕 士, 研 究 方 向 : 英 语 教 学