第 44 卷 第 4 期 2016 年 8 月 J. Jianghan Univ.(Nat. Sci. Ed.) Vol.44 No.4 Aug. 2016 数 据 挖 掘 在 体 育 院 校 计 算 机 等 级 考 试 成 绩 分 析 中 的 应 用 研 究 刘 钟 情 ( 成 都 体 育 学 院 信 息 技 术 中 心, 四 川 成 都 610000) 摘 要 : 为 了 提 高 体 育 院 校 学 生 计 算 机 等 级 考 试 过 级 率, 使 用 Weka 平 台, 采 用 Apriori 关 联 规 则 对 成 都 体 育 学 院 13 级 部 分 班 级 的 计 算 机 基 础 一 和 基 础 二 课 程 学 生 平 时 测 试 成 绩 及 平 时 测 试 次 数 期 末 卷 面 成 绩 计 算 机 等 级 考 试 成 绩 进 行 数 据 挖 掘 分 析, 获 取 了 一 些 有 益 的 分 析 结 果, 对 提 高 计 算 机 基 础 课 程 的 教 学 效 果 起 到 一 定 的 指 导 作 用 关 键 词 : 数 据 挖 掘 ;Apriori 算 法 ;Weka; 体 育 院 校 ; 关 联 规 则 ; 成 绩 分 析 中 图 分 类 号 :TP311 文 献 标 志 码 :A 文 章 编 号 :1673-0143(2016)-0377-05 DOI:10.16389/j.cnki.cn42-1737/n.2016.04.015 Application of Data Mining in Computer Grade Examinations in Sports Colleges and Universities LIU Zhongqing (Information Technology Center,Chengdu Sport Institute,Chengdu 610000,Sichuan,China) Abstract:In order to improve the level of computer grade examinations of students in sports colleges and universities,weka software and Apriori are used to do data mining on the data including the courses of computer basic one and basic two with students usually test scores and usually test times,the results in the final exam,computer grade test scores of some classes in Chengdu Sport Institute,thus some beneficial analysis results are obtained to improve the teaching effect of computer basic course. Keywords:data mining;apriori algorithm;weka;sports colleges and universities;association rules; performance analysis 0 引 言 近 年 来, 计 算 机 技 能 已 经 成 为 衡 量 体 育 院 校 学 生 素 质 的 重 要 方 面, 对 于 学 生 而 言, 计 算 机 一 级 和 二 级 证 书 也 得 到 了 很 多 用 人 单 位 的 认 可 因 此, 计 算 机 基 础 课 程 也 日 益 受 到 体 育 院 校 的 重 视 由 于 各 方 面 的 原 因, 学 生 的 等 级 考 试 过 级 率 普 遍 不 高 因 此, 各 种 针 对 提 高 体 育 院 校 学 生 计 算 机 等 级 考 试 的 研 究 也 随 之 而 来 以 笔 者 所 在 的 成 都 体 育 学 院 为 例, 为 了 提 高 学 生 计 算 机 基 础 课 程 的 学 习 积 极 性, 教 研 室 主 任 沈 乐 君 副 教 授 开 发 了 大 规 模 随 机 化 考 试 系 统, 系 统 可 按 章 节 知 识 点 内 容 为 计 算 机 基 础 课 程 随 机 生 成 试 题, 便 于 任 课 教 师 随 堂 考 试, 从 而 提 高 教 学 效 果 近 两 年 来, 教 研 室 老 师 已 形 成 计 算 机 收 稿 日 期 :2016-04 - 20 作 者 简 介 : 刘 钟 情 (1982 ), 女, 助 教, 硕 士, 研 究 方 向 : 计 算 机 应 用
378 总 第 44 卷 基 础 一 和 基 础 二 平 时 测 试 5 次 的 惯 例 目 前 对 于 学 生 计 算 机 基 础 课 程 成 绩 的 计 算 方 式 是 : 该 门 课 总 评 成 绩 为 期 末 卷 面 分 的 60%+ 学 生 平 时 分 的 40%, 学 生 平 时 5 次 测 试 作 为 计 算 机 基 础 课 程 平 时 分 的 主 要 打 分 依 据, 学 期 末 分 析 总 评 成 绩 的 最 低 分 最 高 分 平 均 分 及 格 人 数 各 分 数 段 的 人 数 而 对 于 学 生 计 算 机 等 级 考 试 成 绩 则 只 简 单 地 统 计 各 班 及 各 任 课 教 师 的 学 生 通 过 人 数 这 种 成 绩 分 析 方 法 虽 然 能 一 定 程 度 上 纵 向 了 解 各 班 级 学 生 对 课 程 的 掌 握 程 度 但 使 用 随 机 化 考 试 系 统 有 没 有 提 高 学 生 的 等 级 考 试 过 级 率, 平 时 测 试 的 成 绩 平 时 测 试 的 次 数 学 生 期 末 卷 面 成 绩 与 学 生 计 算 机 等 级 考 试 成 绩 之 间 有 哪 些 必 然 联 系? 本 研 究 旨 在 使 用 数 据 挖 掘 技 术 找 出 学 生 计 算 机 平 时 测 试 成 绩 及 次 数 期 末 卷 面 成 绩 与 计 算 机 等 级 考 试 成 绩 之 间 的 潜 在 关 系, 从 而 为 提 高 学 生 的 计 算 机 等 级 考 试 过 级 率 提 供 依 据 1 数 据 挖 掘 与 Apriori 算 法 数 据 挖 掘 是 指 从 大 量 的 数 据 中 通 过 算 法 搜 索 隐 藏 于 其 中 信 息 的 过 程 将 先 进 的 数 据 挖 掘 技 术 引 [1] 入 教 育 考 试 数 据 分 析 领 域, 可 以 获 得 潜 在 规 律, 为 教 育 管 理 和 决 策 提 供 参 考 关 联 规 则 数 据 挖 掘 是 数 据 挖 掘 领 域 的 热 点 之 一 关 联 规 则 反 映 海 量 数 据 集 中 数 据 项 集 之 间 的 关 联 关 系 Apriori 算 法 是 第 一 个 关 联 规 则 挖 掘 算 法, 本 研 究 采 用 Apriori 算 法 对 计 算 机 基 础 课 程 的 平 时 测 试 成 绩 及 次 数 与 计 算 机 等 级 考 试 成 绩 之 间 进 行 关 联 规 则 挖 掘 Apriori 算 法 采 用 逐 层 搜 索 的 迭 代 方 法, 利 用 先 验 知 识 进 行 候 选 [2] 数 据 项 集 剪 枝, 缩 小 搜 索 范 围, 以 下 是 Apriori 算 法 产 生 频 繁 项 集 部 分 的 伪 代 码 k=1 F k={i i I σ({i}>=n minsup)} // 生 成 1 阶 频 繁 项 集 repeat k=k+1 C k=apriori-gen(f k-1) // 生 成 候 选 数 据 项 集 for 每 个 事 务 t T do C t=subset(c k,t) // 生 成 事 务 t 中 包 含 的 候 选 数 据 项 集 for 每 个 候 选 项 集 c C t do σ(c)= σ(c)+1 // 累 加 候 选 数 据 项 集 的 支 持 数 end for end for F k={c c C k σ(c)>= N minsup} // 生 成 k 阶 频 繁 项 集 until F k= result= F k 2 数 据 挖 掘 2.1 数 据 分 析 与 数 据 准 备 为 了 挖 掘 学 生 计 算 机 基 础 一 和 计 算 机 基 础 二 平 时 测 试 成 绩 及 次 数 期 末 考 试 卷 面 分 计 算 机 等 级 考 试 成 绩 之 间 的 关 联 规 则, 需 要 计 算 机 基 础 一 和 计 算 机 基 础 二 学 生 的 平 时 测 试 成 绩 及 次 数, 相 应 学 生 的 期 末 考 试 卷 面 分, 计 算 机 等 级 考 试 成 绩 由 于 计 算 机 基 础 课 的 平 时 测 试 成 绩 许 多 老 师 在 教 务 管 理 系 统 中 登 录 完 期 末 考 试 成 绩 之 后 就 删 掉 了, 只 能 从 少 数 任 课 老 师 那 里 取 得 还 存 留 的 部 分 班 级 平 时 测 试 成 绩 的 数 据 和 期 末 卷 面 成 绩, 相 应 班 级 的 计 算 机 等 级 考 试 成 绩 从 教 务 处 获 得 从 成 都 体 育 学 院 13 级 旅 游 管 理 和 13 级 经 济 管 理 班 提 取 54 位 学 生 计 算 机 基 础 二 平 时 测 试 和 期 末 卷 面 成 绩 及 计 算 机 二 级 等 级 考 试 数 据, 又 从 13 级 体 育 教 育 4 个 班 级 提 取 105 位 学 生 计 算 机 基 础 一 平 时 测 试 和 期 末 卷 面 成 绩 及 计 算 机 一 级 等 级 考 试 数 据 这 54 位 计 算 机 基 础 二 和 105 位 计 算 机 基 础 一 的 学 生 包 括 等 级 考 试 报 名 且 参 加 考 试 和 报 名 未 考 试 的 学 生, 且 所 有 被 抽 选 的 学 生 计 算 机 基 础 一 和 基 础 二 的 任 课 教 师 均 为 同 一 个 教 学 经 验 丰 富 的 老 师
2016 年 第 4 期 刘 钟 情 : 数 据 挖 掘 在 体 育 院 校 计 算 机 等 级 考 试 成 绩 分 析 中 的 应 用 研 究 379 2.2 数 据 预 处 理 将 学 生 姓 名 计 算 机 等 级 考 试 笔 试 机 试 成 绩 实 际 参 加 平 时 测 试 的 次 数 平 时 测 试 的 5 次 成 绩 期 [3] 末 卷 面 成 绩 合 并 至 同 一 数 据 表 中 由 于 计 算 机 基 础 一 等 级 考 试 只 有 机 试 没 有 笔 试, 且 计 算 机 基 础 一 和 计 算 机 基 础 二 的 平 时 5 次 测 验 的 评 分 细 则 不 同, 所 以 将 计 算 机 基 础 一 和 计 算 机 基 础 二 的 学 生 记 录 分 别 放 在 不 同 的 数 据 表 中 图 1 和 图 2 分 别 为 计 算 机 基 础 一 和 计 算 机 基 础 二 处 理 后 的 数 据 表 结 构 及 小 部 分 表 记 录 Fig. 1 图 1 计 算 机 基 础 一 数 据 表 Data of course of computer basic one Fig. 2 图 2 计 算 机 基 础 二 数 据 表 Data of course of computer basic two 2.3 数 据 转 换 为 适 应 Apriori 算 法 的 要 求, 需 要 对 计 算 机 基 础 一 和 基 础 二 数 据 表 数 据 进 行 数 据 转 换 将 姓 名 字 段 转 换 为 ID 字 段, 对 两 表 的 机 试 与 笔 试 成 绩 处 理 为 : 通 过 为 t, 不 通 过 设 置 为 f, 再 分 别 对 两 表 的 成 绩 字 段 first second third fourth fifth end 进 行 转 换, 按 照 设 置 的 相 应 转 换 规 则 进 行 转 换,n 表 示 优 秀,g 表 示 良 好,m 表 示 中 等,b 表 示 差,o 表 示 缺 考 比 如, 对 于 计 算 机 基 础 二 表 的 first 字 段,20 分 以 上 为 n,15~20 为 g,10~14 为 m,10 以 下 为 b, 缺 考 为 o, 其 他 字 段 转 换 规 则 依 此 类 推 计 算 机 基 础 一 数 据 表 的 转 换 方 法 与 计 算 机 基 础 二 一 致, 只 是 评 分 细 则 不 完 全 相 同 转 换 后 的 数 据 表 如 图 3 和 图 4 所 示 Fig. 3 图 3 转 换 后 的 计 算 机 基 础 一 数 据 表 Conversion data of course of computer basic one Fig. 4 图 4 转 换 后 的 计 算 机 基 础 二 数 据 表 Conversion data of course of computer basic two 2.4 数 据 挖 掘 结 果 分 析 数 据 挖 掘 算 法 在 Weka 平 台 上 实 现 Weka 是 由 新 西 兰 怀 卡 托 大 学 开 发 的 用 于 机 器 学 习 和 数 据 挖 [4-5] 掘 研 究 的 开 源 工 具, 能 够 运 行 于 几 乎 所 有 的 操 作 系 统 平 台 Weka 平 台 汇 集 了 很 多 当 今 最 前 沿 的 数 [6] 据 挖 掘 算 法, 能 处 理 分 类 聚 类 关 联 规 则 挖 掘 等 数 据 挖 掘 挖 掘 后 的 结 果 见 图 5 和 图 6
380 总 第 44 卷 对 计 算 机 基 础 一 关 联 分 析 规 则 解 读 为 : 第 1 条 规 则, 学 生 第 5 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 98; 第 2 条 规 则, 学 生 第 2 次 平 时 测 试 成 绩 为 中 等, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 97; 第 3 条 规 则, 学 生 第 4 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 95; 第 4 条 规 则, 学 生 一 级 等 级 考 试 机 试 通 过, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 94; 第 5 条 规 则, 学 生 第 3 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 93; 第 6 条 规 则, 学 生 第 2 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 93; 第 7 条 规 则, 学 生 期 末 考 试 卷 面 成 绩 为 中 等, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 92; 第 8 条 规 则, 学 生 一 级 等 级 考 试 通 过 且 第 3 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 92; 第 9 条 规 则, 学 生 第 5 次 平 时 测 试 成 绩 为 良 好, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 92; 第 10 条 规 则, 学 生 第 4 次 平 时 测 试 成 绩 为 优 秀, 则 其 平 时 测 试 次 数 为 5, 其 置 信 度 为 0. 91; 以 上 关 联 规 则 对 计 算 机 基 础 一 任 课 老 师 的 启 示 是 : 要 让 学 生 通 过 计 算 机 基 础 一, 必 须 让 其 参 加 5 次 平 时 测 试, 这 也 体 现 出 教 研 室 的 考 试 系 统 对 提 高 学 生 的 等 级 考 试 过 级 率 有 很 大 帮 助, 且 从 平 时 各 次 成 绩 的 档 次 大 致 可 以 预 测 其 等 级 考 试 的 通 过 情 况 Fig. 5 图 5 计 算 机 基 础 一 关 联 分 析 结 果 图 Associative analysis of course of computer basic one Fig. 6 图 6 计 算 机 基 础 二 关 联 分 析 结 果 图 Associative analysis of course of computer basic two 对 计 算 机 基 础 二 关 联 分 析 规 则 解 读 为 : 第 1 条 规 则, 计 算 机 二 级 笔 试 通 过 了, 则 计 算 机 二 级 机 试 一 定 通 过 了 ; 第 2 条 规 则, 第 一 次 平 时 测 试 结 果 为 良 好, 则 计 算 机 二 级 机 试 一 定 通 过 了 ; 第 3 条 规 则, 计 算 机 二 级 笔 试 通 过 了 并 且 平 时 测 试 了 5 次, 则 计 算 机 二 级 机 试 一 定 通 过 了 ; 第 4 条 规 则, 第 1 次 平 时 测 试 为 良 好 并 且 测 试 了 5 次, 则 计 算 机 二 级 机 试 一 定 通 过 了 前 4 条 规 则 都 说 明 : 凡 是 计 算 机 二 级 笔 试 通 过 了 的 学 生, 则 机 试 一 定 通 过 了, 且 机 试 通 过 与 否 与 第 1 次 平 时 测 试 成 绩 和 平 时 测 试 次 数 直 接 有 关 第 5 条 规 则, 第 1 次 平 时 测 试 成 绩 为 良 好, 则 参 加 了 5 次 测 试, 其 置 信 度 为 0. 97; 第 6 条 规 则, 计 算 机 二 级 机 试 通 过 并 且 第 1 次 测 试 通 过, 则 参 加 了 5 次 测 试, 其 置 信 度 为 0. 97; 第 7 条 规 则, 第 1 次 平 时 测 试 为 良 好, 则 计 算 机 二 级 机 试 必 通 过 并 且 测 试 了 5 次, 其 置 信 度 为 0. 97; 第 8 条 规 则, 参 加 了 5 次 平 时 测 试 的 学 生, 计 算 机 二 级 机 试 都 通 过 了, 其 置 信 度 为 0. 95; 第 9 条 规 则, 学 生 计 算 机 二 级 笔 试 通 过 了, 则 必 参 加 了 5 次 平 时 测 试, 其 置 信 度 为 0. 93; 第 10 条 规 则, 学 生 计 算 机 二 级 笔 试 通 过 了 并 且 机 试 通 过 了, 则 必 参
2016 年 第 4 期 刘 钟 情 : 数 据 挖 掘 在 体 育 院 校 计 算 机 等 级 考 试 成 绩 分 析 中 的 应 用 研 究 381 加 了 5 次 平 时 测 试, 其 置 信 度 为 0. 93 以 上 规 则 对 计 算 机 基 础 二 任 课 老 师 的 启 示 是 : 笔 试 通 过 比 机 试 通 过 率 低, 平 时 的 第 1 次 测 试 成 绩 可 直 接 预 测 学 生 的 机 试 通 过 与 否, 要 想 确 保 学 生 通 过 二 级, 则 学 生 必 须 要 参 加 5 次 平 时 测 试, 这 也 体 现 出 教 研 室 的 考 试 系 统 对 提 高 学 生 的 等 级 考 试 过 级 率 有 很 大 帮 助 3 结 语 使 用 数 据 挖 掘 技 术 对 考 试 数 据 进 行 分 析, 可 以 提 高 考 试 数 据 的 利 用 水 平, 获 得 潜 在 的 规 律 和 趋 势, 为 提 高 教 学 质 量 提 供 参 考 依 据 本 文 使 用 Weka 平 台, 采 用 Apriori 关 联 规 则 对 成 都 体 育 学 院 13 级 部 分 班 级 的 计 算 机 基 础 一 和 基 础 二 课 程 学 生 平 时 测 试 成 绩 及 平 时 测 试 次 数 期 末 卷 面 成 绩 计 算 机 等 级 考 试 成 绩 进 行 数 据 挖 掘 分 析, 得 出 了 平 时 测 试 成 绩 及 次 数 期 末 卷 面 成 绩 计 算 机 等 级 考 试 成 绩 之 间 的 关 联 规 则, 各 规 则 的 置 信 度 均 达 到 0. 91 以 上 参 考 文 献 (References) [1] 罗 美 淑, 刘 世 勇, 夏 春 艳. 数 据 挖 掘 技 术 在 教 学 评 价 中 的 应 用 研 究 [J]. 教 育 探 索,2013(2):81-82. [2] 袁 梅 宇. 数 据 挖 掘 与 机 器 学 习 :WEKA 应 用 技 术 与 实 践 [M]. 北 京 : 清 华 大 学 出 版 社,2014:104-105. [3] 陈 平, 王 利 钢. Apriori 算 法 在 高 校 成 绩 分 析 中 的 应 用 [J]. 信 息 化 研 究,2013,39(5):69-70. [4] WITTEN I H,FRANK E. 数 据 挖 掘 : 实 用 机 器 学 习 技 术 [M]. 北 京 : 机 械 工 业 出 版 社,2006. [5] HALL M,FRANK E,HOLMES G,et al. The WEKA data mining software:an update[j]. SIGKDD Explorations,2009,11 (1):10-18. [6] 姜 凯, 左 风 朝. Weka 平 台 上 解 决 聚 类 的 改 进 差 分 进 化 算 法 [J]. 计 算 机 工 程 与 设 计,2012,33(2):591-593. ( 责 任 编 辑 : 范 建 凤 )