Microsoft Word - 3906.doc



Similar documents
作 主 动 追 求 知 识 获 取 技 能, 在 心 理 和 生 理 上 都 非 常 积 极 的 个 体 (Zimmerman & Pons, 1986) 在 此 期 间, 自 我 效 能 感 (self-efficacy) 自 我 控 制 (self-control) 自 我 管 理 (self-

臺南市102學年度市立國民小學教師聯合甄選簡章(草案)

<4D F736F F D20B1E5C3CEC4C8CBB6CABFB1CFD2B5C2DBCEC42E646F63>

104

致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也

<4D F736F F D20B169B2FAB5D3A5FEA4E55FBEC7AEC9ABD8C4B32E646F63>

从语用的角度看口语水平测试

致理技術學院99學年度大學部新生手冊

Microsoft Word doc

会议手册.indd

申請國外學校研究所建議

目 录

/ / /

第 三 四 题 要 求 考 生 首 先 在 45 秒 内 阅 读 一 段 短 文, 随 后 短 文 隐 去, 播 放 一 段 与 短 文 有 关 的 对 话 或 课 堂 演 讲 最 后, 要 求 考 生 根 据 先 前 阅 读 的 短 文 和 播 放 的 对 话 或 课 堂 演 讲 回 答 相 关

70 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract Over the past few years, it became more obvious that students with low level of English language competence in

豐佳燕.PDF


从调查统计( 表 1) 可以看出 工科学生英语学习关注目标在不同阶段存在较大差异 外在目标主要关注就业和专业发 展 尤其毕业后认为英语学习的目标应该为专业发展的达到了 90% ; 内在目标学生主要关注的是拓展知识和跨文化认知 且 在校生对内在目标的关注远低于毕业生 调查 2 语言技能 我们对南京工程

Microsoft Word doc

(Cohen R. J. 2005),,,,,,,,, ( Testing),,,,,,,,,,, ( ),,,,,,,,,,,,,, 85

TWGHs S

Microsoft Word - 科學教育學刊-33期-全文 doc

全民台語能力分級認證測驗

外国语学院简报

声 明 本 人 郑 重 声 明 : 此 处 所 提 交 的 硕 士 学 位 论 文 基 于 等 级 工 鉴 定 的 远 程 考 试 系 统 客 户 端 开 发 与 实 现, 是 本 人 在 中 国 科 学 技 术 大 学 攻 读 硕 士 学 位 期 间, 在 导 师 指 导 下 进 行 的 研 究

Microsoft Word doc

全 民 英 檢 中 級 口 說 模 擬 測 驗 GEPT-1 67 全 民 英 檢 中 級 寫 作 模 擬 測 驗 全 民 英 檢 中 級 閱 讀 模 擬 測 驗 GEPT-2 GEPT-3 全 民 英 檢 中 級 聽 力 模 擬 測 驗 GEPT-4 68 全 民 英 檢 中 高 級 口 說 模

Microsoft Word - 04-內文-02.doc

XML XML XMPP XML XML Schema XML XML,,, XML,

2011年南臺灣教育論壇

1對外華語文詞彙教學的策略研究_第三次印).doc

苗 栗 三 山 國 王 信 仰 及 其 地 方 社 會 意 涵 The Influences and Implications of Local Societies to Three Mountain Kings Belief, in Taiwan Miaoli 研 究 生 : 林 永 恩 指 導

Microsoft Word - 19王建华.doc

语 用 能 力 测 试 工 具 的 效 度 和 信 度 研 究 在 20 世 纪 90 年 代, 赫 德 森, 德 特 默 和 布 朗 (Hudson,Detmer & Brown, 1992,1995) 最 具 有 典 范 性 的 研 究 提 出 了 六 种 测 试 语 用 能 力 的 方 法,

44 深 圳 信 息 职 业 技 术 学 院 学 报 第 10 卷 业 实 际 进 出 口 单 证 样 本 的 演 示 与 讲 解, 导 致 学 生 在 学 校 看 到 的 都 是 过 时 的 单 据 演 练 的 陈 旧 的 工 作 流 程, 走 上 工 作 岗 位 后, 一 旦 遇 到 实 际 问

Microsoft Word tb 赵宏宇s-高校教改纵横.doc

Microsoft Word - 簡章_2016春中小學生_160309


66 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract This study aimed to analyze the implementing outcomes of ability grouping practice for freshman English at a u

《医学英语》教学大纲

Integration of English-Chinese Word Segmentation and Word Alignment

a a a 1. 4 Izumi et al Izumi & Bigelow b

STEAM STEAM STEAM ( ) STEAM STEAM ( ) 1977 [13] [10] STEM STEM 2. [11] [14] ( )STEAM [15] [16] STEAM [12] ( ) STEAM STEAM [17] STEAM STEAM STEA

. 3. MOOC 2006 MOOC Automated Text Marker 2014 e-rater Yigal et al MOOC Coursera Edx 97

Wuhan Textile University M. A. S Dissertation Emotional Design of Home Textile Based on the Chinese Traditional Culture Wedding Bedding for Example Ca

11-3-Cover-1

102

第一章

考試學刊第10期-內文.indd

A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

事故的共性原因: 行为、知识、习惯

网上公布

ARCLE No.2

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of


三、四級日文讀解試題之分析及其教學啟示

Microsoft Word - S.3 guide book 15-16

. 1 4 Web PAD

...1 Abstract

六 到 八 歲 兒 童, 設 計 並 發 展 一 套 以 van Hiele 幾 何 思 考 層 次 理 論 為 基 礎 的 悅 趣 化 學 習 數 位 教 材, 取 名 為 米 德 玩 形 狀, 同 時 探 討 低 年 級 學 童 在 使 用 本 數 位 教 材 之 後, 在 平 面 幾 何 的


Microsoft Word - Students-app_2014

WTO

Microsoft Word - gentest doc

F4ChoiceOfSubjects2008

紋 (2002) 之 研 究 結 果 發 現, 目 前 有 15% 以 上 身 心 健 全 的 學 生, 由 於 種 種 因 素, 無 法 受 惠 於 主 流 數 學 教 學 中 的 教 材 和 教 法, 導 致 學 生 在 數 學 學 習 的 挫 敗, 因 此 我 們 應 該 更 認 真 思 考

Microsoft Word tb 何颖

荨荨 % [3] [4] 86%( [6] 27 ) Excel [7] 27 [8] 2 [9] K2 [2] ; Google group+ 5 Gmail [2] 2 fxljwcy 3E [22] 2 2 fxljzrh 2D [23] 3 2 fxzphjf 3D 35

社科网-论文在线

标题

生 活 法 强 调 通 过 设 计 复 制 具 体 语 言 使 用 环 境 的 考 试 来 达 到 测 试 真 实 性 比 如 要 考 查 学 生 的 口 语 能 力, 教 师 就 需 要 设 计 一 个 仿 真 的 语 言 运 用 实 景, 如 给 同 学 或 老 师 打 电 话 到 超 市 购

伍 超 額 比 序 項 目 採 計 說 明 一 志 願 序 積 分 : 採 計 上 限 30 分 ( 一 ) 依 據 學 生 選 擇 志 願 學 校 群, 至 多 可 選 填 3 志 願 學 校 群, 每 志 願 學 校 群 內 可 選 填 10 所 學 校 作 為 同 一 志 願 學 校 群, 最

台灣華語文能力測驗的發展與現況

東莞工商總會劉百樂中學

在 应 用 实 践 上 指 导 性 建 议 ( 黄 白,2008) 近 几 年 来, 国 家 政 府 在 教 育 方 面 高 度 重 视 教 育 信 息 化 工 作, 相 继 出 台 一 系 列 政 策 文 件 和 规 范 来 促 进 和 推 动 信 息 技 术 在 教 育 教 学 领 域 的 广

Shanghai International Studies University THE STUDY AND PRACTICE OF SITUATIONAL LANGUAGE TEACHING OF ADVERB AT BEGINNING AND INTERMEDIATE LEVEL A Thes

第 七 届 中 国 英 语 教 学 国 际 研 讨 会 中 国 英 汉 语 比 较 研 究 会 英 语 教 学 研 究 分 会 ( 原 中 国 英 语 教 学 研 究 会 ) 将 于 2014 年 10 月 日 在 南 京 举 办 第 七 届 中 国 英 语 教 学 国 际 研 讨 会

English Language

FOREIGN LANGUAGE RESEARCH 2018 No. 1 Serial No. 200 * H319 A DOI /j. cnki /h

Your Paper's Title Starts Here: Please Center

XXX专业本科人才培养方案

Microsoft Word 定版

一、中心要闻 二、重大项目进展情况 三、学术讲座 四、学术交流 五、人才培养 六、《现代外语》2007年第2期目录 七、会议信息


A B A 18 A a 2007b

2011_1_核红.indd

10 湖 南 人 文 科 技 学 院 学 报 总 第 118 期 国 山 河 为 目 的 游 记 ; 表 达 自 己 对 新 中 国 新 国 民 新 道 德 新 思 想 期 盼 与 希 望 的 书 信 等 等, 都 是 蔡 东 藩 的 论 说 范 围 但 不 论 何 种 题 材, 其 取 材 立 论

英语系


台灣童謠主題教學運用於幼稚園之研究




PowerPoint 簡報

small fire indd

Microsoft Word - 建構企業訓練之課程發展模式.doc

% 30% % % % %

Microsoft Word doc

Microsoft Word - 01李惠玲ok.doc

McGraw-Hill School Education Group Physics : Principles and Problems G S 24

Transcription:

在 线 测 试 离 我 们 有 多 远? 语 言 在 线 测 试 调 研 报 告 陈 晓 红, 蔡 静 ( 北 京 外 国 语 大 学 网 络 教 育 学 院, 北 京 100089) 摘 要 : 本 文 是 一 篇 关 于 英 语 在 线 测 试 的 调 研 报 告, 由 三 部 分 组 成 第 一 部 分 介 绍 计 算 机 在 语 言 测 试 中 的 重 要 作 用 及 各 种 基 于 计 算 机 的 英 语 测 试 的 优 缺 点, 并 着 重 指 出 : 在 线 测 试 自 身 的 特 点 决 定 了 它 适 用 于 和 测 试 者 自 身 利 益 相 关 不 大 的 考 试, 如 自 我 评 估 和 诊 断 测 试 等 ; 听 力 和 阅 读 是 两 种 最 适 合 在 线 测 试 的 语 言 技 能 第 二 部 分 介 绍 和 分 析 欧 洲 委 员 会 的 一 个 语 言 在 线 测 试 系 统 DIALANG 第 三 部 分 展 望 英 语 在 线 测 试 的 未 来, 即 在 线 测 试 将 来 不 可 能 完 全 代 替 纸 笔 考 试, 而 是 作 为 传 统 测 试 的 一 种 补 充 手 段 关 键 词 : 在 线 测 试 ; 语 言 技 能 中 图 分 类 号 :H319 文 献 标 识 码 :A 1. 概 述 远 程 教 育 学 生, 特 别 是 网 络 教 育 的 学 生 经 常 问 这 样 一 个 问 题 : 为 什 么 我 们 不 可 以 坐 在 家 中, 挑 一 个 自 己 方 便 的 时 间 参 加 考 试 呢? 为 什 么 我 们 非 得 参 加 传 统 的 纸 笔 考 试 呢? 学 生 们 这 样 问 是 有 道 理 的 毕 竟, 他 们 在 日 常 的 学 习 过 程 中, 经 常 上 网, 而 且 作 业 和 论 文 都 是 上 网 完 成 的 如 果 测 试 和 学 习 者 日 常 学 习 不 吻 合, 必 定 会 影 响 到 测 试 的 结 果, 因 为 学 习 者 如 若 想 学 业 成 功 而 且 要 从 评 估 过 程 中 得 到 有 效 可 靠 的 结 果, 教 学 方 式 学 习 方 式 评 估 方 式 必 须 贯 通 一 致 (Atkinson & Davies, 2000) Russell 和 Haney 所 做 的 研 究 就 表 明 纸 介 的 开 放 式 问 题 会 使 习 惯 于 用 计 算 机 写 作 的 学 生 考 分 偏 低 然 而 学 生 们 心 目 中 的 那 种 在 任 何 时 间 任 何 地 点 都 可 以 进 行 的 在 线 测 试 目 前 还 无 法 实 现, 因 为 这 种 考 试 的 安 全 性 得 不 到 保 证, 从 而 其 效 度 信 度 都 会 受 到 质 疑 不 过, 随 着 IT 行 业 的 快 速 发 展, 计 算 机 会 在 语 言 测 试 中 起 到 越 来 越 重 要 的 作 用 目 前, 宽 带 网 的 浏 览 和 传 输 功 能 已 经 使 之 成 为 一 个 非 常 有 潜 力 的 测 试 工 具 为 了 使 大 家 对 在 线 测 试 了 解 得 更 加 清 楚, 本 文 简 单 介 绍 一 下 计 算 机 在 语 言 测 试 中 角 色 的 演 变 2. 计 算 机 在 语 言 测 试 中 角 色 的 演 变 2.1 阅 卷 机 机 器 在 语 言 测 试 中 的 使 用 可 以 追 溯 到 1935 年, 一 台 IBM805 机 器 被 用 于 批 改 客 观 试 题 以 节 省 人 工 和 削 减 大 规 模 考 试 中 的 阅 卷 费 用 由 于 这 些 高 效 的 阅 卷 机, 单 项 选 择 在 语 言 测 试 中 得 到 广 泛 应 用 谈 到 阅 卷 机,Glenn Flucher 甚 至 说 : 单 项 选 择 已 被 使 用 了 一 个 世 纪, 原 因 不 是 因 为 这 种 题 型 本 身 有 多 么 可 靠, 而 是 因 为 易 于 机 器 阅 卷 (2000) 2.2 基 于 计 算 机 的 测 试 (CBT) 计 算 机 的 软 硬 件 技 术 日 新 月 异, 技 术 成 本 一 直 呈 现 下 降 趋 势, 因 此 计 算 机 在 测 试 中 的 作 用 早 已 超 越 了 批 阅 客 观 题 的 工 具, 它 已 成 为 测 试 得 以 实 施 的 一 种 载 体 在 计 算 机 终 端 和 个

人 电 脑 上 进 行 的 测 试, 称 为 基 于 计 算 机 的 测 试 下 列 是 计 算 机 用 于 语 言 测 试 的 一 些 主 要 领 域 (Burstein, Frase, Ginther and Grant, 1997): 命 题 : 在 不 同 地 点 工 作 的 命 题 人 员 可 以 用 计 算 机 交 流 文 字 和 图 形 资 料 考 题 的 建 设 : 在 考 题 的 审 核 过 程 中, 通 过 使 用 计 算 机, 命 题 人 员 和 审 题 人 员 可 以 交 流 考 题 文 字 图 形 资 料 考 题 试 测 : 在 试 测 过 程 中, 试 测 者 的 答 案 存 储 在 计 算 机 里, 有 关 试 题 难 度 的 数 据 同 试 题 一 起 存 放 在 数 据 库 里 考 题 的 传 输 : 把 考 题 从 数 据 库 中 传 输 出 去, 包 括 提 取 和 储 存 应 试 者 的 答 案 对 应 试 者 身 份 的 确 认 包 括 在 此 过 程 中 试 题 的 管 理 : 储 存 和 更 新 考 题 考 题 的 批 改 及 把 测 试 者 的 答 案 转 变 为 分 数 考 题 解 析 : 分 数 的 解 析 报 告 分 数 : 提 供 分 数 及 相 关 信 息 很 明 显, 计 算 机 主 要 用 于 试 题 的 传 输 和 考 试 的 实 施 在 其 初 始 阶 段, 基 于 计 算 机 的 测 试 和 传 统 的 纸 笔 考 试 有 许 多 相 同 之 处, 两 者 都 是 建 立 在 传 统 的 测 试 理 论 基 础 上, 不 同 之 处 仅 是 在 于 考 试 实 施 的 载 体 不 同 James Brown 谈 到 基 于 计 算 机 的 测 试 时, 似 乎 有 点 过 分 乐 观 : 机 辅 语 言 测 试 的 两 个 主 要 优 点 是 : 一 机 辅 语 言 测 试 可 以 实 现 测 试 者 的 个 性 化 服 务, 甚 至 可 以 随 来 随 考 群 体 的 测 试 可 以 取 消, 其 组 织 上 的 局 限 性 也 可 以 克 服 二 考 试 的 时 间 限 制 可 以 取 消 学 生 需 要 用 多 少 时 间 做 题 都 可 以, 因 为 没 有 监 考 老 师 等 在 一 旁 (1997) 但 实 际 情 况 却 是, 没 有 监 考 老 师 的 参 与, 作 弊 现 象 难 以 避 免, 从 而 导 致 考 试 的 结 果 难 以 令 人 信 服 譬 如, 由 美 国 教 育 考 试 中 心 (ETS) 组 织 的 世 界 上 最 著 名 的 基 于 计 算 机 的 两 种 考 试 GRE 和 GMAT 仍 然 是 在 监 考 严 格 的 语 言 实 验 室 中 群 体 实 施, 考 试 的 时 间 也 有 明 确 的 限 制 同 纸 笔 考 试 相 比 较, 基 于 计 算 机 的 考 试 有 其 自 身 固 有 的 一 些 优 点, 如 考 试 易 于 实 施 试 题 易 于 批 改 等 基 于 计 算 机 的 考 试 的 另 一 大 优 点 是 考 试 者 可 以 得 到 即 时 的 反 馈, 从 而 得 知 自 己 的 学 业 是 否 取 得 了 进 步 此 外, 计 算 机 的 题 目 解 析 能 力 便 于 老 师 跟 踪 学 生 的 语 言 能 力 发 展, 更 好 地 理 解 学 生 的 问 题 在 哪 里 老 师 的 教 学 工 作 也 因 此 可 以 更 适 合 学 生 个 人 的 需 求, 有 利 于 教 学 相 长 尽 管 基 于 计 算 机 的 测 试 有 可 能 改 善 语 言 测 试 体 系, 但 它 现 阶 段 还 存 在 一 些 不 尽 如 人 意 之 处, 如 测 试 者 对 计 算 机 使 用 的 熟 练 程 度 会 影 响 测 试 结 果 Kirsch, Eignor, Taylor 等 人 的 研 究 表 明 参 加 托 福 机 考 的 测 试 者 中,16% 的 人 因 使 用 计 算 机 作 为 考 试 的 工 具, 成 绩 受 到 了 影 响 为 了 减 少 因 计 算 机 的 使 用 而 产 生 的 焦 虑,ETS 要 求 所 有 参 加 托 福 机 考 者, 在 考 试 前 必 须 参 加 一 次 面 授 辅 导 ;ETS 还 给 想 要 参 加 考 试 者 提 供 免 费 的 CD 盘 ;ETS 考 虑 到 打 字 速 度 对 测 试 者 的 影 响, 还 允 许 测 试 者 在 参 加 新 托 福 写 作 考 试 时, 在 手 写 或 打 印 所 写 的 文 章 之 间 做 选 择 基 于 计 算 机 测 试 的 另 一 局 限 在 于 它 通 常 只 能 测 试 听 和 读 两 项 技 能, 题 目 类 型 仅 限 于 单 项 选 择 和 简 单 的 填 空 题 由 于 基 于 计 算 机 的 测 试 不 便 包 括 开 放 型 的 题 目, 使 得 此 种 考 试 的 深 度 和 广 度 受 到 了 很 大 的 限 制 即 便 在 考 察 阅 读 技 巧 时, 也 未 能 尽 如 人 意 : 计 算 机 屏 幕 容 量 有 限, 阅 读 篇 章 和 题 目 经 常 分 屏 显 示, 致 使 记 忆 力 成 为 影 响 成 绩 的 一 个 重 要 因 素, 从 而 减 弱 了 对 阅 读 能 力 的 测 试 效 果 在 新 托 福 的 机 考 中, 对 测 试 者 口 语 和 写 作 的 评 估 依 旧 是 由 人 来 完 成 的 可 见, 在 现 阶 段, 计 算 机 对 测 试 者 在 口 语 和 写 作 方 面 的 评 估 效 果 还 不 甚 理 想

语 言 实 验 室 的 修 建 成 本 及 语 言 测 试 软 件 的 制 作 成 本 较 高, 阻 碍 了 基 于 计 算 机 的 测 试 的 发 展 好 的 语 言 测 试 软 件 通 常 需 要 测 试 专 家 和 软 件 专 家 的 通 力 合 作, 这 种 制 作 成 本 通 常 为 普 通 的 软 件 公 司 难 以 承 受, 因 此 许 多 市 售 的 测 试 软 件 或 者 难 于 操 作, 或 者 测 试 价 值 不 大 2.3 计 算 机 化 自 适 应 考 试 (CAT) 近 几 十 年 来, 计 算 机 化 自 适 应 考 试 (CAT) 是 基 于 计 算 机 测 试 的 一 个 重 要 发 展 在 这 种 考 试 中, 计 算 机 根 据 测 试 者 的 实 际 表 现, 动 态 地 提 供 题 项 (Reckase,1989) 在 传 统 的 纸 笔 考 试 中, 题 目 次 序 是 固 定 的, 所 有 的 测 试 者 必 须 回 答 一 样 的 问 题 在 固 定 的 考 试 时 间 内, 如 果 测 试 者 首 先 回 答 的 题 目 难 度 太 大, 而 没 有 时 间 回 答 简 单 的 题 目, 测 试 者 的 成 绩 就 会 受 到 影 响 就 此 而 言, 计 算 机 化 自 适 应 考 试 是 语 言 测 试 体 系 的 一 个 积 极 的 创 新, 它 实 质 上 是 一 种 个 性 化 的 测 试, 即 题 目 的 难 度 随 测 试 者 的 语 言 水 平 而 变 化 当 测 试 者 回 答 对 一 道 题 时, 下 道 题 目 的 难 度 就 会 增 加, 反 之 亦 然 这 种 个 性 化 的 测 试 也 会 提 高 考 试 的 安 全 性, 防 止 作 弊 的 发 生 此 测 试 方 法 基 于 这 样 一 种 认 识, 即 如 果 测 试 者 所 做 的 题 目 总 是 太 难 或 太 容 易, 他 或 她 的 语 言 水 平 不 会 得 到 真 实 的 反 映 只 有 当 题 目 的 难 度 和 测 试 者 的 语 言 水 平 相 当 时, 测 试 者 的 能 力 才 能 得 到 最 好 的 体 现 (Wainer,1990) 当 前, 计 算 机 化 自 适 应 考 试 运 用 题 目 反 应 理 论 (item response theory) 来 选 择 题 项 和 评 估 测 试 者 的 语 言 水 平 题 目 反 应 理 论 的 基 础 是 概 率 论, 即 计 算 某 个 人 做 对 某 个 题 目 的 可 能 性 (Dunkel, 1999) 当 一 个 人 的 语 言 能 力 和 题 目 难 度 相 当 时, 做 对 一 道 题 的 可 能 性 为 50% 测 试 者 的 考 试 成 绩 及 考 试 成 绩 所 反 映 的 能 力 可 以 用 题 目 特 征 曲 线 (item characteristic curve) 描 述 随 着 学 生 语 言 水 平 的 增 加, 答 对 的 可 能 性 也 在 增 加 (Alderson, Clapham, & Wall, 1995) 除 了 上 述 的 特 点, 计 算 机 化 自 适 应 考 试 还 有 两 大 优 点 节 省 时 间 和 测 试 范 围 宽 泛 它 在 设 计 之 初 的 目 的 就 是 替 换 令 人 生 畏 费 时 耗 力 的 常 规 考 试 考 试 的 时 间 可 以 事 先 设 定, 也 可 以 由 测 试 者 的 回 答 来 决 定 在 后 一 种 情 况 中, 一 旦 学 生 的 能 力 能 得 到 确 定, 考 试 也 就 随 之 结 束 一 般 说 来, 计 算 机 化 自 适 应 考 试 的 考 试 时 间 较 短, 考 试 的 题 目 数 量 也 较 少 考 试 时, 每 屏 仅 显 现 一 题, 这 会 在 某 种 程 度 上 降 低 学 生 测 试 时 的 焦 虑 和 挫 败 感 值 得 一 提 的 是, 在 计 算 机 化 的 考 试 中, 所 有 题 目 都 由 题 库 提 供 如 果 题 库 足 够 大, 计 算 机 化 的 考 试 就 可 以 测 试 从 水 平 很 低 到 水 平 很 高 的 各 种 应 试 者 这 点 是 非 自 适 应 考 试 无 法 达 到 的, 除 非 考 试 的 题 量 超 常 地 大 (Fulcher,2000) 然 而, 同 其 它 形 式 的 考 试 一 样, 计 算 机 化 自 适 应 考 试 也 存 在 一 些 缺 点 首 先, 建 立 计 算 机 化 自 适 应 考 试 题 库 费 时 耗 力 如 果 题 库 不 够 大, 题 目 使 用 频 率 过 高, 测 试 的 安 全 性 就 不 能 得 到 保 证, 或 者 测 试 群 体 的 面 会 非 常 狭 窄, 语 言 水 平 很 好 或 者 语 言 水 平 很 差 的 学 生 就 不 能 得 到 较 公 正 的 评 估 其 次, 既 然 每 个 测 试 者 所 考 的 题 目 都 不 同, 考 分 解 析 就 比 较 困 难, 需 要 做 大 量 的 调 查 研 究 再 次, 即 使 整 个 题 库 总 体 设 计 能 够 达 到 测 试 设 计 者 欲 评 估 的 语 言 能 力, 但 每 次 测 试 所 使 用 的 只 是 一 小 部 分 试 题, 此 部 分 试 题 能 否 真 实 地 反 映 测 试 者 的 语 言 水 平, 也 令 人 质 疑 最 后 值 得 一 提 的 是, 参 加 计 算 机 化 自 适 应 考 试 时, 测 试 者 无 法 跳 过 不 做 或 重 新 再 做 题 目 (Fulcher,2000) 当 测 试 者 发 现 做 错 了, 而 且 没 有 机 会 改 正 时, 会 感 到 非 常 失 望 2.4 在 线 测 试 (Testing on the Internet) 介 于 宽 带 网 对 信 息 的 快 速 的 传 输 功 能, 人 们 对 利 用 宽 带 网 进 行 测 试 的 期 望 值 越 来 越 高 通 过 宽 带 网, 试 题 可 以 传 输 到 世 界 各 地 在 基 于 网 络 的 考 试 中, 命 题 人 员 可 以 不 依 赖 软 件 专 业 人 士, 因 为 把 考 题 传 输 到 服 务 器 上 所 需 的 技 术 工 具, 相 对 容 易 掌 握, 软 件 上 只 需 一 个 标 准 浏 览 器, 硬 件 设 施 为 一 台 个 人 电 脑 输 入 密 码, 命 题 人 员 把 题 目 传 输 到 平 台 上, 储 存 在 数 据 库 里 学 生 可 以 凭 密 码 进 入 平 台, 从 数 据 库 中 取 出 信 息 学 生 的 答 案 可 以 在 本 地 机 上 批 改, 也 可 以 传 回 服 务 器 批 改 对 不 能 机 改 的 主 观 试 题, 学 生 的 答 案 可 以 通 过 网 络 以 电 子 邮 件 的 形 式 发 给 老 师 这 样 网 络 在 学 生 命 题 人 员 和 老 师 之 间 架 起 沟 通 的 桥 梁, 这 对 教 学 双 方 都 非

常 有 利 技 术 上 说 来, 如 果 计 算 机 可 以 成 功 地 连 接 到 英 特 网 上, 试 题 可 以 在 任 何 时 间 任 何 地 点 通 过 网 络 传 输 给 测 试 者 这 似 乎 对 远 程 教 育 的 学 习 者 和 教 育 者 都 是 一 件 好 事 然 而 在 线 测 试 的 发 展 被 CBT 或 者 CAT 自 身 所 存 在 的 一 些 缺 陷 所 阻 碍 网 络 可 以 把 图 片 视 听 材 料 包 括 在 试 题 中, 从 而 使 试 题 的 外 观 更 加 丰 富, 但 机 考 题 型 的 创 新 却 并 非 易 事, 不 可 能 在 短 期 内 得 以 实 现 除 了 如 服 务 器 失 败 或 浏 览 器 不 配 套 的 问 题, 基 于 网 络 的 考 试 还 有 一 个 致 命 的 缺 陷, 即 安 全 问 题 2003 年, 由 于 试 题 泄 露 问 题,ETS 决 定 把 中 国 大 陆 台 湾 香 港 及 南 韩 机 考 的 GRE 改 回 纸 笔 考 试 的 GRE 考 虑 到 网 络 传 输 信 息 的 快 捷 便 利, 基 于 网 络 的 考 试 在 安 全 性 方 面 受 到 的 压 力 比 基 于 计 算 机 的 考 试 更 大 这 里 所 说 的 安 全 性 不 仅 仅 指 试 题 的 安 全, 还 包 括 试 题 评 判 的 安 全 性 及 测 试 者 身 份 的 确 定 等 只 有 待 形 形 色 色 危 及 考 试 的 安 全 问 题 得 到 解 决 时, 基 于 网 络 的 考 试 才 可 能 用 于 大 规 模 的 与 测 试 者 利 益 相 关 紧 密 的 考 试 中 为 此, 即 使 是 ETS 这 样 的 有 实 力 的 考 试 机 构, 也 没 有 使 用 网 络 来 传 输 试 题 不 过, 如 果 我 们 能 从 一 个 全 新 的 角 度 来 看 待 测 试, 基 于 网 络 的 测 试 又 是 对 传 统 纸 笔 测 试 的 一 种 很 好 的 发 展 如 果 学 生 不 是 只 为 了 分 数 而 考 试, 而 是 把 测 试 视 为 检 查 学 业 进 展, 激 励 自 己 不 断 进 步 的 一 种 手 段, 那 基 于 网 络 的 测 试 会 在 测 试 领 域 扮 演 重 要 角 色 这 种 测 试 适 用 于 和 测 试 者 利 益 相 关 不 大 考 试 中, 如 诊 断 测 试 自 测 等 在 参 加 这 些 考 试 时, 测 试 者 没 有 必 要 作 弊, 考 试 的 安 全 性 可 以 得 到 很 好 的 保 障 恰 如 Carsten Roever 所 言 : 基 于 网 络 的 测 试 是 否 适 合 用 于 某 个 考 试, 取 决 于 此 种 考 试 的 功 利 性 有 多 大 通 常 说 来, 考 试 越 是 和 测 试 者 的 利 益 相 关 不 大, 基 于 网 络 的 测 试 越 是 适 用 (2001) 下 面, 介 绍 一 下 欧 盟 委 员 会 的 一 个 在 线 测 试 体 系 DIALANG 3.DIALANG 在 线 测 试 体 系 DIALANG 在 线 测 试 体 系 是 建 立 在 欧 洲 委 员 会 欧 共 体 评 估 标 准 上 的 语 言 诊 断 测 试 资 金 由 欧 盟 提 供, 系 统 的 目 的 是 对 欧 洲 14 种 语 言 提 供 有 效 的 水 平 诊 断 3.1 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准 欧 洲 委 员 会 是 这 样 描 绘 欧 共 体 语 言 评 估 标 准 的 这 是 一 个 非 常 实 用 的 工 具, 它 明 确 了 学 习 的 不 同 阶 段 应 该 达 到 的 标 准, 它 可 以 评 估 在 不 同 国 家 进 行 的 语 言 教 学 的 效 果 它 在 欧 洲 各 国 课 程 改 革 及 国 际 教 育 联 合 会 对 语 言 证 书 的 比 较 中, 使 用 频 率 越 来 越 高 最 近, 欧 洲 委 员 会 通 过 决 议, 推 荐 用 它 作 为 建 立 对 各 种 语 言 进 行 评 估 的 工 具 (2001) 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准 对 语 言 教 学 和 测 试 人 员 非 常 有 用, 文 件 中 描 述 了 交 际 所 需 的 能 力, 相 关 知 识 和 技 能, 不 同 的 交 际 场 合 和 领 域 它 已 成 为 在 欧 洲 各 国 评 估 语 言 能 力 的 一 个 标 准 按 照 欧 洲 委 员 会 欧 共 体 语 言 评 估 标 准, 语 言 能 力 分 为 六 个 层 次 : A1 破 门 :90 学 时 A2 上 路 :180-200 学 时 B1 入 门 :375-400 学 时 B2 良 好 :750 学 时 C1 熟 练 使 用 :1500 学 时 C2 精 通 :3000 学 时

3.2 测 试 流 程 在 DIALANG 测 试 中, 考 察 内 容 有 5 个 方 面 : 语 法 结 构 听 读 写 考 试 的 流 程 如 下 : 选 择 考 试 : 应 试 者 从 5 种 考 试 内 容 中, 选 择 一 种 分 级 测 试 : 分 级 测 试 的 内 容 为 测 试 者 决 定 一 些 动 词 是 否 是 语 言 中 确 实 存 在 的, 还 是 伪 造 的 分 级 测 试 帮 助 测 试 者 了 解 自 己 掌 握 语 言 程 度 的 大 概 状 况 自 我 评 估 : 测 试 者 根 据 所 给 的 描 述, 对 自 己 的 语 言 能 力 进 行 自 我 评 估 如 果 在 此 阶 段, 测 试 者 对 自 己 的 能 力 估 计 过 高, 或 估 计 过 低,DIALANG 测 试 系 统 会 在 考 试 后 的 反 馈 中 指 出 语 言 测 试 : 在 此 阶 段, 测 试 者 做 自 己 选 择 的 测 试 内 容 如 果 测 试 者 跳 过 分 级 测 试 和 自 我 评 估 两 个 选 做 步 骤, 测 试 题 就 有 可 能 会 太 难 或 太 简 单 测 试 者 必 须 完 成 全 部 测 试 题, 否 则 不 能 得 到 任 何 结 果 反 馈 : 测 试 者 完 成 测 试 后, 就 可 以 得 到 答 案 和 反 馈 意 见, 也 可 以 重 新 选 择 其 它 的 测 试 内 容 3.3 DIALANG 在 线 测 试 体 系 的 优 缺 点 作 为 一 个 在 线 测 试 体 系,DIALANG 的 优 点 如 下 : 首 先, 它 是 一 个 非 赢 利 的 测 试 体 系, 语 言 学 习 者 可 以 随 时 随 地 参 加 考 试 ; 其 次, 它 是 一 个 多 语 言 的 测 试 系 统 ; 再 次, 它 对 语 言 的 自 学 者 特 别 有 用, 因 为 它 可 以 相 对 真 实 地 反 映 学 习 者 的 语 言 能 力 ; 最 后, 它 对 测 试 者 的 语 言 水 平 分 技 能 进 行 测 试, 并 提 供 针 对 各 项 语 言 技 能 的 反 馈 DIALANG 测 试 体 系 目 前 还 在 实 验 阶 段, 自 身 还 存 在 许 多 弱 点 其 一 考 试 时 间 没 有 限 定, 不 利 于 对 阅 读 能 力 的 评 估, 因 为 众 所 周 知, 阅 读 速 度 是 阅 读 能 力 的 一 个 重 要 组 成 部 分 ; 其 二, 该 测 试 体 系 包 括 对 写 作 技 能 的 测 试, 题 型 仍 旧 为 选 择 填 空 等, 写 作 能 力 是 否 能 这 样 来 评 估, 令 人 质 疑 ; 其 三 如 服 务 器 失 灵 等 技 术 问 题, 也 会 阻 碍 测 试 者 顺 利 答 题 4. 在 线 测 试 的 未 来 从 上 述 分 析 不 难 看 出, 宽 带 网 未 来 可 能 成 为 一 个 主 要 的 考 试 载 体 不 过, 在 线 测 试 即 使 在 未 来 也 不 可 能 完 全 代 替 纸 介 考 试, 但 它 是 纸 介 考 试 的 一 种 很 好 的 补 充 因 为, 在 线 测 试 自 身 就 是 一 个 矛 盾 体 : 一 方 面, 它 最 大 的 优 点 就 是 在 任 何 时 间 任 何 地 点 都 可 以 进 行 的 自 适 应 考 试 ; 另 一 方 面, 一 旦 它 用 于 和 测 试 者 自 身 利 益 联 系 紧 密 的 考 试 中, 就 必 须 在 监 考 严 格 的 教 室 中 进 行, 因 此 也 就 丧 失 了 它 的 优 势 而 且 在 可 以 预 见 的 未 来, 说 和 写 也 很 难 由 机 器 来 评 估 可 以 说, 在 线 测 试 取 代 传 统 的 考 试 犹 如 机 器 人 代 替 人 类 一 样 遥 不 可 及 在 语 言 学 家 可 以 把 语 言 的 认 知 过 程 变 成 计 算 机 可 以 理 解 的 程 序 之 前, 试 题 的 开 发 者 只 能 充 分 认 识 在 线 测 试 的 特 点, 将 它 用 于 和 测 试 者 利 益 相 关 不 大 的 考 试 中 参 考 文 献 [1]Alderson, J.C., Clapham, C. & Wall, D. Language Test Construction and Evaluation[M], Cambridge University Press, 1995. [2]Atkingson, T and Davies, G. Computer Aided Assessment and Language Learning[J], ICLT4LT, 2000. [3]Brown, James Dean, Computers in Language Testing: Present Research and Some Future Directions [J]. Language Learning & Technology, Vol.1, 1997, [4]Burstein, J., Frase, L., Ginther, A., &Grant, L. Technologies for Language Assessment[J]. Annual

Review of Applied Linguistics, 1997. [5]Council of Europe. Common European Framework of Reference: Learning, Teaching, Assessment[M]. Cambridge University Press, 2001. [6]Dunkel, Patricia A. Considerations in Developing or Using Second/Foreign Language Proficiency Computer-adaptive Tests [J]. Language Learning & Technology, 1999. [7]Fulcher, Glenn. Computers in Language Testing[M]. IATEFL Publications, 2000 [8]Reckase, M.D. Adaptive Testing: the Evolution of a Good Idea [J] Educational Measurement: Issues and Practice. 1989(8). [9]Roever, Carsten. Web-Based Language Testing[J]. Language Learning & Technology, 2001(5). [10]Russell, M.& Haney, W. Testing writing on computers: an experiment comparing student performance on tests conducted via computer and via paper-and-pencil[j]. Education Policy Analysis Archives, 1997, 5 (3). [11]Wainer, H. Computer Adaptive Testing: A Primer[M]. Hillsdale: Lawrence Erlbaum Associates, 1990. A Survey on Language Online Testing CHEN Xiaohong, CAI Jing (Institute of Online Education, Beijing Foreign Studies University, Beijing 100089, China) Abstract: This article is a survey of language online testing. It consists of three parts. The first part describes how computers get increasingly involved in language tests and the advantages and limitations of all kinds of computer-based testing. It is argued that due to its characteristics, online testing is now most suitable for zero-stakes testing situations, such as diagnostic tests, test preparation and self-assessment; among the four language skills, listening and reading are the two language skills which can be tested online. The second part contributes to a detailed introduction and analysis of DIALANG project a diagnostic testing system whose assessment criteria are based on the proficiency levels of the Common European Framework of the Council of Europe. The third part envisages the future of English online testing, i.e. online testing can be a good alternative to paper-based tests but cannot fully replace it. Key words:online testing;language skills 收 稿 日 期 :2004-11-27; 本 刊 修 订 稿 :2004-12-04 作 者 简 介 : 陈 晓 红 蔡 静, 北 京 外 国 语 大 学 网 络 教 育 学 院 讲 师, 英 语 硕 士, 研 究 方 向 : 英 语 教 学