目 录 前 言... 1 第 二 届 CCF 大 数 据 学 术 会 议 组 织 机 构... 2 第 二 届 CCF 大 数 据 学 术 会 议 程 序 委 员 会... 3 会 议 场 地 布 局... 5 会 议 议 程 概 览... 7 学 术 与 技 术 大 会 共 享 主 题 报 告 详



Similar documents
说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

深圳市新亚电子制程股份有限公司


<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

江 苏 瑞 峰 建 设 集 团 有 限 公 有 限 公 江 苏 鲁 工 建 设 工 程 有 限 公 江 苏 溧 鸿 建 设 有 限 公 江 苏 明 创 科 技 园 发 展 有 限 公 公 公 有 限 公 江 苏 茂 盛 建 设 有 限 公 江 苏 鼎 洪 建 工 有 限 公 富 强 机 电 安 装

评 委 : 李 炎 斌 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

2006年顺德区高中阶段学校招生录取分数线


龚 亚 夫 在 重 新 思 考 基 础 教 育 英 语 教 学 的 理 念 一 文 中 援 引 的 观 点 认 为 当 跳 出 本 族 语 主 义 的 思 维 定 式 后 需 要 重 新 思 考 许 多 相 连 带 的 问 题 比 如 许 多 发 音 的 细 微 区 别 并 不 影 响 理 解 和

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

第 卷 第 辑 高 明 华 蔡 卫 星 曾 诚 股 权 结 构 与 信 息 披 露 质 量 来 自 证 券 分 析 师 盈 余 预 测 特 征 的 证 据!!

Microsoft Word - 文件汇编.doc

名 称 生 命 科 学 学 院 环 境 科 学 1 生 物 学 仅 接 收 院 内 调 剂, 初 试 分 数 满 足 我 院 生 物 学 复 试 最 低 分 数 线 生 命 科 学 学 院 生 态 学 5 生 态 学 或 生 物 学 生 命 科 学 学 院


抗 战 时 期 国 民 政 府 的 银 行 监 理 体 制 探 析 % # % % % ) % % # # + #, ) +, % % % % % % % %

ETF、分级基金规模、份额变化统计

课程类 别

第 一 批 本 科 文 科 代 码 学 校 投 档 线 校 线 差 最 低 排 位 投 档 线 校 线 差 最 低 排 位 投 档 线 校 线 差 最 低 排 位 控 制 分 数 线 北 京 大 学


评 委 : 徐 岩 宇 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )

一 从 分 封 制 到 郡 县 制 一 从 打 虎 亭 汉 墓 说 起

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

2014年中央财经大学研究生招生录取工作简报

采 取 行 动 的 机 会 90% 开 拓 成 功 的 道 路 2

珠江钢琴股东大会

<4D F736F F D2033D4C2C6DAD4D3D6BEA3A8B6A8B8E5CEC4BCFEA3A92E646F63>

其 中 :A 股 股 东 持 有 股 份 总 数 31,126,938,909 境 外 上 市 外 资 股 股 东 持 有 股 份 总 数 (H 股 ) 6,454,698,427 3 出 席 会 议 的 股 东 所 持 有 表 决 权 股 份 数 占 公 司 有 表 决 权 股 份 总 数 的 7

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

马 克 思 主 义 公 正 观 的 基 本 向 度 及 方 法 论 原 则!! # #

<433A5C C6B73625C B746F705CB9FABCCAD6D0D2BDD2A9D7A8D2B5B8DFBCB6BCBCCAF5D6B0B3C6C6C0C9F3C9EAC7EBD6B8C4CFA3A CDA8D3C3B0E6A3A92E646F63>

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

市 水 务 局 ( 海 洋 局 ) 上 海 市 水 务 局 ( 上 海 市 海 洋 局 ) 市 水 务 局 ( 海 洋 局 ) 上 海 市 水 务 局 ( 上 海 市 海 洋 局 ) 市 文 广 影 视 局 文 物 保 护 管 理

<4D F736F F D20D2DAB3CFB7A8C2C9BCF2D1B633D4C2BFAFA3A C4EAD7DCB5DA3436C6DAA3A9>

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

郭 双 林 前 后 甲 寅 派 考 & # # # # # # # # # # # # # # # # # # # # ( # # # # # ) ) # # # # # # # # # # # # # # # & 陈 子 展 最 近 三 十 年 中 国 文 学 史 # 上 海 古 籍 出 版 社

简 报 要 点 ESI 共 有 22 个 学 科 门 类, 江 苏 高 校 目 前 只 有 16 个 学 科 门 类 进 入 了 世 界 1%, 分 别 是 一 般 社 会 科 学 临 床 医 学 农 业 科 学 分 子 生 物 学 和 遗 传 学 动 植 物 科 学 化 学 地 球 科 学 工 程

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量

一 女 儿 国 形 象 历 史 溯 源 二 双 性 同 体 的 新 女 性

中 国 软 科 学 年 第 期!!!

中 中 中 中 部 中 岗 位 条 件 历 其 它 历 史 师 地 理 师 生 物 师 体 与 健 康 师 从 事 中 历 史 工 从 事 中 地 理 工 从 事 中 生 物 工 从 事 中 体 与 健 康 工 2. 课 程 与 论 ( 历 史 ); 2. 科 ( 历 史 )

资 料 来 源 延 边 中 级 人 民 法 院 小 野 和 子 指 出 年 实 施 婚 姻 法 后 的 年 间 中 国 有 万 人 因 婚 姻 问 题 自 杀 或 被 杀 离 婚 自 由 对 社 会 和 家 庭 稳 定 带 来 了 很 大 的 影 响 因 婚 姻 问 题 刑 事 案 件 频 发 已

证券代码: 证券简称:长城电脑 公告编号:

( 二 ) 现 行 统 一 高 考 制 度 不 利 于 培 养 人 的 创 新 精 神,,,,,,,,,,,,, [ ],,,,,,,,,,, :, ;,,,,,,? ( 三 ) 现 行 统 一 高 考 制 度 不 利 于 全 体 学 生 都 获 得 全 面 发 展,, [ ],,,,,,,,,,,

公 开 刊 物 须 有 国 内 统 一 刊 (CN), 发 表 文 章 的 刊 物 需 要 在 国 家 新 闻 出 版 广 电 总 局 ( 办 事 服 务 便 民 查 询 新 闻 出 版 机 构 查 询 ) 上 能 够 查 到 刊 凡 在 有 中 国 标 准 书 公 开

市 环 保 局 科 技 标 准 处 市 环 保 局 科 技 标 准 处 市 环 保 局 科 技 标 准 处

第 期 王 日 根 徐 士 林 与 清 初 福 建 汀 漳 道 的 社 会 治 理

内外网.frx

<4D F736F F D20B7A2D0D0C8CBB9D8D3DAB9ABCBBEC9E8C1A2D2D4C0B4B9C9B1BED1DDB1E4C7E9BFF6B5C4CBB5C3F7BCB0C6E4B6ADCAC2A1A2BCE0CAC2A1A2B8DFBCB6B9DCC0EDC8CBD4B1B5C4C8B7C8CFD2E2BCFB2E646F63>

<B4FACFFABBF9BDF0C3FBB5A5A3A A3A92E786C73>

境 外 上 市 外 资 股 股 东 持 有 股 份 总 数 (H 股 ) 489,157,907 3 出 席 会 议 的 股 东 所 持 有 表 决 权 股 份 数 占 公 司 有 表 决 权 股 份 总 数 的 其 中 :A 股 股 东 持 股 占 股 份 总 数 的

一 开 放 性 的 政 策 与 法 规 二 两 岸 共 同 的 文 化 传 承 三 两 岸 高 校 各 自 具 有 专 业 优 势 远 见 杂 志 年 月 日

内外网.frx



书面申请

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

( 此 页 无 正 文, 为 广 东 东 方 精 工 科 技 股 份 有 限 公 司 关 于 提 供 资 料 真 实 准 确 和 完 整 的 承 诺 函 之 签 署 页 ) 广 东 东 方 精 工 科 技 股 份 有 限 公 司 法 定 代 表 人 : 唐 灼 林 2016 年 7 月 28 日


深 入 宣 传 周 恩 义 同 志 先 进 事 迹 和 崇 高 精 神 为 党 的 十 八 大 胜 利 召 开 营 造 良 好 氛 围

三武一宗灭佛研究

002 电 子 科 学 与 工 程 学 院 拟 招 生 150 人 联 系 人 : 周 老 师, 电 话 物 理 电 子 学 电 路 分 析 电 磁 场 理 论 01 电 磁 物 理 与 微 波 电 子 学 02 光 子 学 与 光 电 技 术 03 微 纳

新, 各 地 各 部 门 ( 单 位 ) 各 文 化 事 业 单 位 要 高 度 重 视, 切 实 加 强 领 导, 精 心 组 织 实 施 要 根 据 事 业 单 位 岗 位 设 置 管 理 的 规 定 和 要 求, 在 深 入 调 查 研 究 广 泛 听 取 意 见 的 基 础 上, 研 究 提

思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想


西 南 民 族 学 院 学 报 哲 学 社 会 科 学 版 第 卷 资 料 来 源 中 国 统 计 年 鉴 年 年 新 中 国 五 十 年 统 计 资 料 汇 编 中 国 人 口 统 计 年 鉴 年 数 据 资 料 来 源 中 国 统 计 年 鉴 中 国 统 计 出 版 社 年 版 资 料 来 源

[ 4 ] ( P97 ) [ 5 ] ( P14 ) ( 一 ) 条 约 优 先 是 基 本 原 则

第 期 李 伟 等 用 方 法 对 中 国 历 史 气 温 数 据 插 值 可 行 性 讨 论

修改版-操作手册.doc

抗 日 战 争 研 究 年 第 期

工 程 勘 察 资 质 标 准 根 据 建 设 工 程 勘 察 设 计 管 理 条 例 和 建 设 工 程 勘 察 设 计 资 质 管 理 规 定, 制 定 本 标 准 一 总 则 ( 一 ) 本 标 准 包 括 工 程 勘 察 相 应 专 业 类 型 主 要 专 业 技 术 人 员 配 备 技 术

金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

学 年 第 二 学 期 集 中 考 试 安 排 (18 周 ) 考 试 日 期 :6 月 27 日 星 期 一 8:10-9:50 第 二 公 共 教 学 楼 A 区 A 高 等 数 学 ( 理 二 2) 复 材 材 料 科 学 与 工 程

测 谱 学 基 础 宽 波 段 遥 感

南京大学电子科学与工程系 专业 一年级(00)级 学年 第二学期

103 历 史 文 化 学 院 沈 艳 历 史 教 学 论 0602 中 国 史 01 历 史 文 献 学 02 专 门 史 03 中 国 古 代 史 04 中 国 近 现 代 史 英 语 历 史 学 基 础 01 历 史 文 献 学 02 中 国

收 入 支 出 项 目 2016 年 预 算 项 目 2016 年 预 算 预 算 01 表 单 位 : 万 元 ( 保 留 两 位 小 数 ) 一 公 共 财 政 预 算 拨 款 一 人 员 经 费 一 般 财 力 人 员 支 出 成 品

股票代码:000936

!!

年 8 月 11 日, 公 司 召 开 2015 年 第 五 次 临 时 股 东 大 会, 审 议 通 过 了 关 于 公 司 <2015 年 股 票 期 权 激 励 计 划 ( 草 案 )> 及 其 摘 要 的 议 案 关 于 提 请 股 东 大 会 授 权 董 事 会 办 理 公

I

一、中央新闻单位驻地方机构批复保留名单 (一)保留的报纸驻地方机构名单

21 业 余 制 -- 高 起 专 (12 级 ) 75 元 / 学 分 网 络 学 院 学 生 沪 教 委 财 (2005)49 号 江 西 化 校 工 科 22 业 余 制 -- 高 起 专 (12 级 ) 70 元 / 学 分 网 络 学 院 学 生 沪 教 委 财 (2005)49 号 吉

11. 上 海 建 筑 设 计 研 究 院 有 限 公 司 和 广 州 穗 科 建 设 管 理 有 限 公 司 联 合 体 12. 中 铁 十 七 局 集 团 有 限 公 司 和 中 外 天 利 ( 北 京 ) 工 程 管 理 咨 询 有 限 公 司 联 合 体 13. 中 南 建 筑 设 计 院



 编号:

现 场 会 议 时 间 为 :2016 年 5 月 19 日 网 络 投 票 时 间 为 :2016 年 5 月 18 日 年 5 月 19 日 其 中 通 过 深 圳 证 券 交 易 所 交 易 系 统 进 行 网 络 投 票 的 时 间 为 2016 年 5 月 19 日 9:30-

Microsoft Word - 工业品封面.doc

浙 江 天 册 律 师 事 务 所 关 于 杭 州 电 缆 股 份 有 限 公 司 2015 年 年 度 股 东 大 会 的 法 律 意 见 书 发 文 号 :TCYJS2016H0228 致 : 杭 州 电 缆 股 份 有 限 公 司 根 据 中 华 人 民 共 和 国 证 券 法 ( 下 称 证

2.5 选 举 陈 晓 非 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.6 选 举 卢 婕 女 士 为 第 六 届 董 事 会 董 事 候 选 人 的 议 案 ; 2.7 选 举 张 文 君 先 生 为 第 六 届 董 事 会 独 立 董 事 候 选 人 的 议 案

浙 江 海 洋 学 院 417 普 通 生 态 学 与 鱼 类 学 全 套 考 研 资 料 <2016 年 最 新 考 研 资 料 > 2-2 基 础 生 态 学 笔 记, 此 笔 记 为 高 分 研 究 生 复 习 所 用, 借 助 此 笔 记 可 以 大 大 提 高 复 习 效 率, 把 握 报

2016 年 荔 湾 区 财 政 核 定 支 出 汇 总 表 表 二 单 位 名 称 : 广 州 文 化 公 园 基 本 支 出 项 目 支 出 科 目 编 码 预 算 科 目 名 称 一 般 公 共 预 算 5, , , , ,

抗 日 战 争 研 究! 年 第 期 # # # # #!!!!!!!! #!!

GONGZUO JUJIAO 宝 山 区 领 军 人 才 名 单 宝 山 区 第 七 批 拔 尖 人 才 名 单 2

伊 犁 师 范 学 院 611 语 言 学 概 论 全 套 考 研 资 料 <2016 年 最 新 考 研 资 料 > 2-2 语 言 学 纲 要 笔 记, 由 考 取 本 校 本 专 业 高 分 研 究 生 总 结 而 来, 重 点 突 出, 借 助 此 笔 记 可 以 大 大 提 高 复 习 效

!!!!!


CONTENTS WENZHOU DANGJIAN 紧 贴 中 心 服 务 基 层 拓 宽 视 野 追 求 纵 深 2010 年 第 2 期 ( 总 第 240 期 ) 主 办 中 共 温 州 市 委 组 织 部 主 任 常 务 副 主 任 副 主 任 委 员 王 昌 荣 王 益 琪 陈 进 达 沈

Transcription:

第 二 届 CCF 大 数 据 学 术 会 议 程 序 册 2014 年 12 月 12-13 日 北 京 新 云 南 皇 冠 假 日 酒 店

目 录 前 言... 1 第 二 届 CCF 大 数 据 学 术 会 议 组 织 机 构... 2 第 二 届 CCF 大 数 据 学 术 会 议 程 序 委 员 会... 3 会 议 场 地 布 局... 5 会 议 议 程 概 览... 7 学 术 与 技 术 大 会 共 享 主 题 报 告 详 细 议 程 (13 日 )... 8 学 术 会 议 论 文 宣 读 与 论 坛 详 细 议 程 (12 日 )... 9 Session A1: 大 数 据 存 储 管 理 与 处 理... 9 Session B1: 数 据 质 量... 9 Session A2: 数 据 分 析 与 挖 掘... 10 Session B2: 社 会 网 络 分 析 与 知 识 图 谱... 10 Session A3: 大 数 据 机 器 学 习 算 法... 11 Session B3: 大 数 据 并 行 化 算 法... 11 Session A4: 查 询 检 索... 12 Session B4: 大 数 据 应 用... 12 Session A5: 数 据 安 全 与 大 数 据 系 统... 13 Session B5: 大 数 据 系 统 与 体 系 结 构... 13 论 文 目 录 和 摘 要 信 息... 14 Session A1: 大 数 据 存 储 管 理 与 处 理... 14 Session B1: 数 据 质 量... 15 Session A2: 数 据 分 析 与 挖 掘... 17 Session B2: 社 会 网 络 分 析 与 知 识 图 谱... 18 Session A3: 大 数 据 机 器 学 习 算 法... 20 Session B3: 大 数 据 并 行 化 算 法... 21 Session A4: 查 询 检 索... 23 Session B4: 大 数 据 应 用... 24 Session A5: 数 据 安 全 与 大 数 据 系 统... 26 Session B5: 大 数 据 系 统 与 体 系 结 构... 27 大 数 据 搜 索 论 坛... 30 报 告 1: 网 络 空 间 智 慧 搜 索 技 术 探 索... 30 报 告 2: 意 图 搜 索... 30 报 告 3:Search Intents: Understanding, Representation and Matching... 31 报 告 4: 支 持 时 空 特 性 的 在 线 社 交 网 络 搜 索 理 论 和 技 术... 31 报 告 5: 多 媒 体 大 数 据 搜 索... 31 报 告 6: 大 数 据 下 的 实 体 关 联 建 模... 32 报 告 7: 大 数 据 搜 索 中 的 隐 私 保 护 问 题... 32 会 场 交 通 指 南... 33 会 务 组 联 系 方 式... 34 i

前 言 近 年 来, 大 数 据 已 经 成 为 全 球 关 注 的 热 点, 成 为 国 内 外 学 术 界 产 业 界 和 应 用 行 业 普 遍 关 注 的 热 点 研 究 领 域, 在 国 内 外 掀 起 了 一 个 空 前 的 研 究 热 潮 为 了 促 进 大 数 据 技 术 的 研 究 与 发 展, 推 动 大 数 据 的 学 术 研 究 和 交 流 大 数 据 应 用 以 及 大 数 据 的 信 息 共 享, 继 2013 年 成 功 召 开 了 第 一 届 CCF 大 数 据 学 术 会 议 后, 受 中 国 计 算 机 学 会 委 托 由 中 国 计 算 机 学 会 大 数 据 专 家 委 员 会 承 办 了 2014 年 第 二 届 CCF 大 数 据 学 术 会 议 经 过 近 一 年 时 间 的 会 议 筹 备 论 文 征 集 和 评 审 以 及 相 关 的 会 务 组 织 工 作, 第 二 届 CCF 大 数 据 学 术 会 议 (CCF BigData2014) 将 于 2014 年 12 月 12-13 日 在 北 京 新 云 南 皇 冠 假 日 酒 店 举 行 本 次 会 议 由 中 国 计 算 机 学 会 主 办, 中 国 计 算 机 学 会 大 数 据 专 家 委 员 会 南 京 大 学 和 复 旦 大 学 联 合 承 办 本 次 学 术 会 议 将 与 2014 中 国 大 数 据 技 术 大 会 联 合 召 开 并 共 享 大 会 主 题 报 告 本 届 会 议 将 主 要 关 注 大 数 据 面 临 的 新 的 挑 战 问 题 和 研 究 方 向, 着 力 反 映 中 国 大 数 据 技 术 研 究 的 最 新 进 展 本 届 会 议 征 文 共 收 到 论 文 187 篇, 经 程 序 委 员 会 评 审 最 后 录 取 65 篇, 并 推 荐 到 计 算 机 学 报 计 算 机 研 究 与 发 展 电 子 学 报 中 文 信 息 学 报 计 算 机 科 学 与 探 索 等 刊 物 发 表 与 去 年 相 比, 今 年 的 论 文 在 学 术 和 技 术 水 平 上 比 去 年 有 大 幅 提 高, 论 文 涉 及 的 研 究 深 度 和 广 度 都 比 去 年 有 显 著 的 提 高 今 年 大 会 上 除 与 技 术 大 会 共 享 丰 富 的 主 题 报 告 并 宣 读 录 用 论 文 外, 还 将 举 办 一 个 大 数 据 论 坛, 探 讨 大 数 据 搜 索 相 关 的 技 术 挑 战 和 研 究 本 次 学 术 大 会 的 会 务 由 CSDN 负 责 与 技 术 大 会 统 一 安 排, 在 此 对 CSDN 对 本 次 大 会 的 支 持 和 帮 助 表 示 衷 心 的 感 谢! 我 们 热 诚 欢 迎 并 期 待 您 的 参 与! 同 时, 在 大 家 的 共 同 努 力 和 支 持 下, 预 祝 今 年 的 CCF 大 数 据 学 术 会 议 圆 满 成 功! CCF Big Data 2014 程 序 委 员 会 2014 年 11 月 30 日 1

第 二 届 CCF 大 数 据 学 术 会 议 组 织 机 构 大 会 主 办 单 位 : 中 国 计 算 机 学 会 承 办 单 位 : 中 国 计 算 机 学 会 大 数 据 专 家 委 员 会 南 京 大 学 复 旦 大 学 会 议 委 员 会 大 会 名 誉 主 席 : 李 国 杰 中 国 科 学 院 计 算 技 术 研 究 所 Philip Yu University of Illinois at Chicago 大 会 主 席 : 吕 建 李 建 中 南 京 大 学 哈 尔 滨 工 业 大 学 程 序 委 员 会 主 席 : 黄 宜 华 王 晓 阳 南 京 大 学 复 旦 大 学 宣 传 主 席 : 靳 小 龙 中 国 科 学 院 计 算 技 术 研 究 所 出 版 主 席 : 王 莉 太 原 理 工 大 学 国 际 联 络 主 席 : 熊 辉 Rutgers University,USA 2

第 二 届 CCF 大 数 据 学 术 会 议 程 序 委 员 会 ( 按 姓 名 拼 音 排 序 ) 卜 佳 俊 ( 浙 江 大 学 ) 操 龙 兵 ( 悉 尼 科 技 大 学 ) 车 翔 玖 ( 吉 林 大 学 ) 陈 恩 红 ( 中 国 科 学 技 术 大 学 ) 陈 耿 ( 南 京 审 计 学 院 ) 陈 华 钧 ( 浙 江 大 学 ) 陈 康 ( 清 华 大 学 ) 陈 莉 ( 西 北 大 学 ) 陈 崚 ( 扬 州 大 学 ) 陈 岭 ( 浙 江 大 学 ) 陈 卫 ( 微 软 亚 洲 研 究 院 ) 程 学 旗 ( 中 科 院 计 算 所 ) 邓 波 ( 北 京 系 统 工 程 研 究 所 ) 丁 世 飞 ( 中 国 矿 业 大 学 ) 杜 小 勇 ( 中 国 人 民 大 学 ) 方 粮 ( 国 防 科 技 大 学 ) 高 军 ( 北 京 大 学 ) 高 新 波 ( 西 安 电 子 科 技 大 学 ) 高 阳 ( 南 京 大 学 ) 古 志 民 ( 北 京 理 工 大 学 ) 顾 宁 ( 复 旦 大 学 ) 韩 爱 丽 ( 山 东 大 学 ) 韩 燕 波 ( 北 方 工 业 大 学 ) 何 洁 月 ( 东 南 大 学 ) 何 利 文 ( 南 京 邮 电 大 学 ) 何 清 ( 中 科 院 计 算 所 ) 何 晓 飞 ( 浙 江 大 学 ) 胡 小 华 ( 华 中 师 范 大 学 ) 黄 健 斌 ( 西 安 电 子 科 技 大 学 ) 黄 亚 楼 ( 南 开 大 学 ) 黄 宜 华 ( 南 京 大 学 ) 吉 根 林 ( 南 京 师 范 大 学 ) 蒋 嶷 川 ( 东 南 大 学 ) 金 海 ( 华 中 科 技 大 学 ) 金 连 文 ( 华 南 理 工 大 学 ) 金 翊 ( 上 海 大 学 ) 靳 小 龙 ( 中 科 院 计 算 所 ) 李 翠 平 ( 中 国 人 民 大 学 ) 李 东 升 ( 国 防 科 技 大 学 ) 李 国 徽 ( 华 中 科 技 大 学 ) 李 剑 ( 华 为 香 农 实 验 室 ) 李 克 秋 ( 大 连 理 工 大 学 ) 李 千 目 ( 南 京 理 工 大 学 ) 李 天 瑞 ( 西 南 交 通 大 学 ) 李 武 军 ( 南 京 大 学 ) 李 晓 明 ( 北 京 大 学 ) 梁 吉 业 ( 太 原 师 范 学 院 ) 刘 梦 赤 ( 武 汉 大 学 ) 刘 卫 国 ( 山 东 大 学 ) 陆 嘉 恒 ( 中 国 人 民 大 学 ) 罗 圣 美 ( 中 兴 通 讯 ) 吕 科 ( 中 国 科 学 院 大 学 ) 马 华 东 ( 北 京 邮 电 大 学 ) 马 军 ( 山 东 大 学 ) 马 帅 北 京 航 空 航 天 大 学 ) 毛 文 吉 ( 中 科 院 自 动 化 所 ) 孟 洛 明 ( 北 京 邮 电 大 学 ) 孟 小 峰 ( 中 国 人 民 大 学 ) 牛 保 宁 ( 太 原 理 工 大 学 ) 潘 柱 廷 ( 启 明 星 辰 公 司 ) 彭 舰 ( 四 川 大 学 ) 彭 智 勇 ( 武 汉 大 学 ) 皮 德 常 ( 南 京 航 空 航 天 大 学 ) 齐 红 威 ( 数 据 堂 ( 北 京 )) 钱 宇 华 ( 山 西 大 学 ) 商 烁 ( 中 国 石 油 大 学 ) 施 水 才 ( 北 京 拓 尔 思 ) 石 勇 ( 虚 拟 经 济 与 数 据 科 学 研 究 中 心 ) 舒 继 武 ( 清 华 大 学 ) 孙 建 伶 ( 浙 江 大 学 ) 孙 少 陵 ( 中 国 移 动 通 信 研 究 院 ) 唐 杰 ( 清 华 大 学 ) 3

王 国 胤 ( 重 庆 邮 电 大 学 ) 王 海 艳 ( 南 京 邮 电 大 学 ) 王 建 民 ( 清 华 大 学 ) 王 健 宗 ( 网 易 公 司 ) 王 进 ( 南 京 信 息 工 程 大 学 ) 王 莉 ( 太 原 理 工 大 学 ) 王 腾 蛟 ( 北 京 大 学 ) 王 文 俊 ( 天 津 大 学 ) 王 晓 阳 ( 复 旦 大 学 ) 王 新 ( 复 旦 大 学 ) 王 志 平 ( 中 兴 通 讯 ) 文 继 荣 ( 中 国 人 民 大 学 ) 翁 楚 良 ( 上 海 交 通 大 学 ) 吴 文 峻 ( 北 京 航 空 航 天 大 学 ) 吴 中 海 ( 北 京 大 学 ) 肖 侬 ( 国 防 科 技 大 学 ) 肖 卫 东 ( 国 防 科 技 大 学 ) 邢 春 晓 ( 清 华 大 学 ) 熊 辉 ( 罗 格 斯 新 泽 西 州 立 大 学 ) 许 信 顺 ( 山 东 大 学 ) 杨 庚 ( 南 京 邮 电 大 学 ) 杨 建 武 ( 北 京 大 学 ) 叶 茂 ( 电 子 科 技 大 学 ) 印 鉴 ( 中 山 大 学 ) 於 志 文 ( 西 北 工 业 大 学 ) 于 福 生 ( 北 京 师 范 大 学 ) 于 俊 清 ( 华 中 科 技 大 学 ) 于 小 亿 ( 北 京 大 学 ) 禹 晓 辉 ( 山 东 大 学 ) 袁 晓 如 ( 北 京 大 学 ) 詹 剑 锋 ( 中 科 院 计 算 所 ) 张 宝 峰 ( 华 为 ) 张 成 奇 ( 澳 大 利 亚 悉 尼 科 技 大 学 ) 张 国 清 ( 中 科 院 计 算 所 ) 张 亮 ( 复 旦 大 学 ) 张 瑞 生 ( 兰 州 大 学 ) 张 师 超 ( 广 西 师 范 大 学 ) 张 宪 超 ( 大 连 理 工 大 学 ) 张 自 力 ( 西 南 大 学 ) 赵 东 岩 ( 北 京 大 学 ) 赵 勇 ( 电 子 科 技 大 学 ) 郑 纬 民 ( 清 华 大 学 ) 周 傲 英 ( 华 东 师 范 大 学 ) 周 斌 ( 国 防 科 技 大 学 ) 周 福 才 ( 东 北 大 学 ) 周 水 庚 ( 复 旦 大 学 ) 周 涛 ( 电 子 科 技 大 学 ) 周 晓 方 ( 澳 大 利 亚 昆 士 兰 大 学 ) 周 晓 辉 ( 西 安 邮 电 大 学 ) 周 勇 ( 中 国 矿 业 大 学 ) 周 志 华 ( 南 京 大 学 ) 朱 文 武 ( 清 华 大 学 ) 朱 扬 勇 ( 复 旦 大 学 ) 朱 志 祥 ( 西 安 邮 电 大 学 ) 4

会 议 场 地 布 局 5

6

会 议 议 程 概 览 学 术 会 议 (12 月 12 日, 星 期 五 ) 08:00-08:30 会 议 注 册 Session A1 Session A 2 Session A3 Session A4 Session A5 大 数 据 存 储 管 分 析 挖 掘 大 数 据 机 器 查 询 检 索 数 据 安 全 与 08:30-10:00 理 与 处 理 与 推 荐 学 习 算 法 大 数 据 系 统 昆 明 多 功 能 A 厅 昆 明 多 功 能 B 厅 昆 明 多 功 能 C 厅 西 双 版 纳 厅 会 议 室 7+8 主 持 人 : 肖 利 民 主 持 人 : 王 莉 主 持 人 : 禹 晓 辉 主 持 人 : 陈 耿 主 持 人 : 何 利 文 10:00-10:15 茶 歇 Session B1 Session B2 Session B3 Session B4 Session B5 数 据 质 量 社 会 网 络 分 析 大 数 据 大 数 据 应 用 大 数 据 系 统 10:15-12:00 与 知 识 图 谱 并 行 化 算 法 与 体 系 结 构 昆 明 多 功 能 A 厅 昆 明 多 功 能 B 厅 昆 明 多 功 能 C 厅 西 双 版 纳 厅 会 议 室 7+8 主 持 人 : 曹 建 军 主 持 人 : 何 洁 月 主 持 人 : 于 俊 清 主 持 人 : 罗 圣 美 主 持 人 : 张 东 12:00-13:20 午 餐 13:20-13:30 学 术 会 议 组 织 工 作 通 报 地 点 : 三 层 云 南 宴 会 厅 B 13:30-15:30 大 数 据 搜 索 论 坛 主 席 : 方 滨 兴 地 点 : 三 层 云 南 宴 会 厅 B 15:30-18:30 2014 年 CCF 大 数 据 专 家 委 员 会 年 度 工 作 会 议 地 点 : 二 层 昆 明 多 功 能 厅 A ( 闭 门 会 议 ) 全 体 会 议 (12 月 13 日, 星 期 六 ) 09:00-09:15 2014 中 国 大 数 据 技 术 大 会 暨 第 二 届 CCF 大 数 据 学 术 会 议 开 幕 式 09:15-09:45 两 会 共 享 主 题 演 讲 与 报 告 09:45-10:30 大 数 据 白 皮 书 与 发 展 趋 势 报 告 发 布 会 第 二 届 中 国 大 数 据 技 术 创 新 大 赛 颁 奖 仪 式 10:30-12:30 两 会 共 享 主 题 演 讲 与 报 告 12:30-13:20 午 餐 13:20-17:25 两 会 共 享 主 题 演 讲 与 报 告 7

学 术 与 技 术 大 会 共 享 主 题 报 告 详 细 议 程 (13 日 ) 全 体 会 议 (12 月 13 日, 星 期 六 ) 时 间 议 题 演 讲 者 09:00-09:05 大 会 介 绍 及 与 会 嘉 宾 介 绍 邵 铮, 大 会 程 序 主 席 Dropbox 技 术 经 理 09:05-09:10 中 国 计 算 机 学 会 领 导 致 辞 杜 子 德, 中 国 计 算 机 学 会 秘 书 长 09:10-09:15 CCF 大 数 据 专 家 委 员 会 主 任 讲 话 09:15-09:45 The Data Revolution 09:45-10:00 大 数 据 白 皮 书 与 发 展 趋 势 报 告 发 布 会 10:00-10:30 第 二 届 中 国 大 数 据 技 术 创 新 大 赛 颁 奖 仪 式 及 2015 年 大 赛 形 式 介 绍 10:30-11:00 AWS Cloud 大 数 据 应 用 案 例 与 方 案 11:00-11:30 11:30-12:00 IBM Watson 大 数 据 与 分 析 平 台 : 技 术 评 论 A New Platform for Cloud-based Distributed Machine Learning on Big Data 12:00-12:30 大 数 据 人 工 智 能 12:30-13:20 午 餐 13:20-13:55 Experience-Centric Software Defined Infrastructure 李 国 杰, 中 国 工 程 院 院 士, 中 国 科 学 院 计 算 技 术 研 究 所 研 究 员 Doug Cutting, Chief Architect of Cloudera, Chairman of Apache Software Foundation 程 学 旗, 中 国 科 学 院 计 算 技 术 研 究 所 研 究 员,CCF 大 数 据 专 家 委 员 会 秘 书 长 周 涛, 电 子 科 技 大 学 教 授,CCF 大 数 据 专 家 委 员 会 委 员 Ben Butler, Global Sr. Marketing Manager, Big Data and HPC, Amazon Web Services 李 永 辉,IBM 大 中 华 区 系 统 与 科 技 事 业 部 杰 出 工 程 师 Eric P. Xing, Professor at Carnegie Mellon University, Program Chair of ICML 2014 余 凯, 百 度 研 究 院 副 院 长, 深 度 学 习 实 验 室 主 任, 图 片 搜 索 部 高 级 总 监 张 晖,Co-Founder and CEO of Conviva, Professor of Computer Science, Carnegie Mellon University 13:55-14:30 2015 年 大 数 据 基 础 技 术 的 演 进 趋 势 孙 元 浩, 星 环 科 技 CTO 14:30-15:05 大 数 据 系 统 核 心 技 术 高 光 荣,University of Delaware 电 子 与 计 算 机 工 程 系 教 授, 计 算 机 系 统 结 构 和 并 行 系 统 实 验 室 创 始 人 暨 主 任 15:05-15:40 大 数 据 开 启 行 业 化 应 用 新 浪 潮 王 恩 东, 浪 潮 集 团 高 级 副 总 裁 15:40-16:15 Lambda Architecture 2.0 Convergence between Real-Time Analytics, Context-awareness and Online Learning 16:15-16:50 电 信 运 营 商 大 数 据 商 务 模 式 研 究 16:50-17:25 Recent Developments in Apache Hbase Sabri SKHIRI, Chief Architect of the R&D Architecture, Huawei EU Research Center 钱 岭, 中 国 移 动 苏 州 研 发 中 心 大 数 据 产 品 部 总 经 理 Ted Yu, Senior Member of Technical Staff @ Hortonworks 8

学 术 会 议 论 文 宣 读 与 论 坛 详 细 议 程 (12 日 ) 2014 年 12 月 12 日 ( 星 期 五 )8:30-12:05 Session A1: 大 数 据 存 储 管 理 与 处 理 地 点 : 昆 明 多 功 能 A 厅 主 持 人 : 肖 利 民 时 间 :8:30-10:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 基 于 数 据 通 道 的 非 结 构 化 数 据 多 存 储 系 统 蒋 静 远, 鲁 伟 明, 王 耀 光, 楼 仁 杰 2 大 数 据 集 成 中 确 定 数 据 准 确 属 性 值 的 WR 方 法 周 宁 南, 张 孝, 王 珊 3 面 向 大 数 据 的 分 布 式 流 处 理 技 术 综 述 张 鹏, 李 鹏 霄, 任 彦, 杨 嵘, 林 海 伦, 刘 庆 云 4 一 种 大 规 模 时 空 数 据 处 理 与 可 视 化 平 台 杜 一, 郭 旦 怀, 周 园 春, 黎 建 辉 5 Hadoop 环 境 下 三 维 模 型 的 存 储 及 形 状 分 布 特 征 提 取 李 海 生, 赖 龙, 蔡 强, 毛 典 辉, 陈 谊 6 基 于 数 据 位 图 的 滑 动 分 块 算 法 邓 雪 峰, 孙 瑞 志, 张 永 瀚, 聂 娟 Session B1: 数 据 质 量 地 点 : 昆 明 多 功 能 A 厅 主 持 人 : 曹 建 军 时 间 :10:15-12:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 基 于 任 务 合 并 的 并 行 大 数 据 清 洗 过 程 优 化 杨 东 华, 李 宁 宁, 王 宏 志, 李 建 中, 高 宏 2 大 数 据 上 基 于 Hadoop 的 不 一 致 数 据 检 测 与 修 复 算 法 张 安 珍, 门 雪 莹, 王 宏 志, 李 建 中, 高 宏 3 面 向 隐 马 尔 可 夫 特 征 的 数 据 质 量 控 制 模 型 周 金 陵, 刁 兴 春, 周 星, 曹 建 军 4 对 非 随 机 缺 失 中 的 缺 失 依 赖 关 系 研 究 郑 奇 斌, 刁 兴 春, 曹 建 军 5 一 种 含 缺 失 数 据 的 记 录 逻 辑 检 测 方 法 高 科, 刁 兴 春, 曹 建 军 6 基 于 Hadoop 的 电 网 数 据 质 量 校 验 方 法 与 验 证 系 统 张 志 亮, 孙 煜 华, 陈 承 志, 龙 庆 麟, 梁 国 辉, 顾 荣, 杨 滨 诚, 黄 宜 华 7 利 用 AQL 的 逐 批 海 洋 大 数 据 质 量 检 验 模 型 黄 冬 梅, 周 雪 楠, 王 振 华 9

Session A2: 数 据 分 析 与 挖 掘 地 点 : 昆 明 多 功 能 B 厅 主 持 人 : 王 莉 时 间 :08:30-10:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 利 用 社 交 关 系 的 实 值 条 件 受 限 玻 尔 兹 曼 机 协 同 过 滤 推 荐 算 法 何 洁 月, 马 贝 2 基 于 移 动 网 络 流 量 日 志 的 城 市 空 间 行 为 分 析 强 思 维, 陈 夏 明, 姜 开 达, 金 耀 辉 3 一 种 对 数 据 集 稀 疏 度 不 敏 感 的 协 同 推 荐 新 方 法 蔡 国 永, 吕 瑞 4 基 于 Hadoop 的 领 域 术 语 抽 取 研 究 杜 丽 萍, 李 晓 戈, 周 元 哲, 邵 春 昌 5 6 一 种 融 合 异 构 信 息 网 络 和 评 分 矩 阵 的 推 荐 新 算 法 基 于 广 域 分 布 时 空 轨 迹 大 数 据 的 群 体 行 为 模 式 挖 掘 方 法 张 邦 佐, 桂 欣, 何 涛, 孙 焕 垚, 杨 晟 雨, 韩 宇 茹 杨 杰, 李 小 平, 陈 湉 Session B2: 社 会 网 络 分 析 与 知 识 图 谱 地 点 : 昆 明 多 功 能 B 厅 主 持 人 : 何 洁 月 时 间 :10:15-12:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 一 种 面 向 大 规 模 社 会 信 息 网 络 的 多 层 社 区 发 现 算 法 康 颖, 于 博, 林 政, 周 江, 王 伟 平, 孟 丹 2 一 种 大 规 模 图 数 据 处 理 关 键 技 术 的 评 估 模 型 高 赟, 周 薇, 韩 冀 中, 孟 丹 3 大 规 模 演 化 知 识 网 络 中 的 关 系 推 断 赵 泽 亚, 贾 岩 涛, 王 元 卓, 靳 小 龙, 程 学 旗 4 5 社 会 网 络 中 面 向 不 确 定 性 影 响 源 的 影 响 力 传 播 抑 制 方 法 基 于 低 秩 结 构 和 局 部 约 束 矩 阵 估 计 的 链 接 预 测 方 法 李 劲, 柳 青, 岳 昆, 蔡 莉 刘 冶, 印 鉴, 邓 泽 亚, 王 智 圣, 潘 炎 6 SFEN-Inf: 一 种 微 博 信 息 传 播 网 络 推 理 算 法 郑 众 杰, 林 学 练 7 大 数 据 环 境 下 的 动 态 知 识 网 络 模 型 及 构 建 方 法 刘 剑, 许 洪 波, 唐 慧 丰, 程 学 旗 10

Session A3: 大 数 据 机 器 学 习 算 法 地 点 : 昆 明 多 功 能 C 厅 主 持 人 : 禹 晓 辉 时 间 :08:30-10:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 面 向 大 数 据 流 的 多 任 务 加 速 在 线 学 习 算 法 李 志 杰, 李 元 香, 王 峰, 匡 立 2 基 于 非 负 矩 阵 分 解 的 大 规 模 异 构 数 据 联 合 聚 类 申 国 伟, 杨 武, 王 巍, 于 淼, 董 国 忠 3 基 于 Spark 的 大 规 模 文 本 k-means 并 行 聚 类 算 法 刘 鹏, 滕 家 雨, 张 国 鹏, 胡 延 军, 黄 宜 华 4 基 于 受 限 玻 尔 兹 曼 机 的 链 接 分 类 算 法 史 喜 斌, 吴 世 伟, 熊 赟 5 基 于 滑 窗 不 等 长 时 间 序 列 STS 距 离 的 聚 类 算 法 刘 琴, 王 恺 乐, 饶 卫 雄 6 一 种 基 于 高 斯 混 合 模 型 的 不 确 定 数 据 流 聚 类 方 法 曹 振 丽, 孙 瑞 志, 李 勐 Session B3: 大 数 据 并 行 化 算 法 地 点 : 昆 明 多 功 能 C 厅 主 持 人 : 于 俊 清 时 间 :10:15-12:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 基 于 BSP 并 行 计 算 模 型 的 K-shell 算 法 王 阳, 吴 斌 2 基 于 MapReduce 的 多 元 连 接 优 化 方 法 李 甜 甜, 于 戈, 郭 朝 鹏, 宋 杰 3 基 于 SparkR 的 分 类 算 法 并 行 化 研 究 刘 志 强, 顾 荣, 袁 春 风, 黄 宜 华 4 基 于 MapReduce 的 并 行 化 最 小 最 大 模 块 化 支 持 向 量 机 研 究 赵 研, 李 云 5 基 于 Spark 的 并 行 图 数 据 分 析 系 统 王 虹 旭, 吴 斌, 刘 旸 6 大 数 据 下 利 用 块 依 赖 的 并 行 实 体 解 析 算 法 王 宁, 黄 敏 7 基 于 Hadoop 的 局 部 支 持 向 量 机 崔 文 斌, 温 孚 江, 牟 少 敏, 浩 庆 波 11

Session A4: 查 询 检 索 地 点 : 西 双 版 纳 厅 主 持 人 : 陈 耿 时 间 :8:30-10:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 HiBase: 一 种 基 于 分 层 式 索 引 的 高 效 HBase 查 询 技 术 与 系 统 葛 微, 罗 圣 美, 周 文 辉, 赵 頔, 唐 云, 周 娟, 曲 文 武, 袁 春 风, 黄 宜 华 2 异 构 信 息 网 上 的 可 达 性 查 询 尹 丹, 高 宏, 邹 兆 年, 李 建 中 3 4 基 于 LDA 主 题 模 型 的 分 布 式 信 息 检 索 集 合 选 择 方 法 基 于 浓 密 树 和 改 进 McCHyp 算 法 的 Impala 查 询 优 化 何 旭 峰, 陈 岭, 陈 根 才, 钱 坤, 吴 勇, 王 敬 昌 马 骄 阳, 陈 岭, 赵 宇 亮, 杨 谊, 吴 勇, 王 敬 昌 5 基 于 内 存 的 分 布 式 隐 私 流 查 询 系 统 张 鹏, 刘 庆 云, 熊 翠 文, 李 保 珲, 郑 超, 易 立 6 基 于 信 息 熵 加 权 的 三 维 模 型 特 征 融 合 算 法 李 海 生, 张 朝 立, 蔡 强, 毛 典 辉, 杜 军 平 Session B4: 大 数 据 应 用 地 点 : 西 双 版 纳 厅 主 持 人 : 罗 圣 美 时 间 :10:15-12:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 2 海 量 车 牌 识 别 数 据 集 上 基 于 时 空 划 分 的 旅 行 时 间 计 算 方 法 基 于 海 量 医 疗 数 据 的 症 状 自 查 服 务 的 云 框 架 设 计 赵 卓 峰, 张 帅, 丁 维 龙 周 作 建, 林 文 敏, 王 斌 斌, 潘 金 贵 3 基 于 TCBF_LRU 的 高 速 网 络 大 流 检 测 算 法 白 磊, 田 立 勤, 陈 超 4 大 数 据 下 纺 织 制 造 执 行 系 统 关 键 问 题 研 究 邵 景 峰, 贺 兴 时, 王 进 富, 白 晓 波, 刘 晟, 马 创 涛, 刘 聪 颖 5 一 种 支 持 音 乐 情 感 检 索 的 索 引 结 构 王 伟, 徐 立 臻, 董 逸 生 6 电 力 数 据 语 义 冲 突 检 测 及 消 减 技 术 研 究 张 德 刚, 吴 毅, 张 德 海, 张 少 泉 7 大 数 据 背 景 下 山 东 省 二 代 玉 米 螟 发 生 程 度 预 测 模 型 的 构 建 杨 波, 刘 勇, 牟 少 敏, 温 孚 江 12

Session A5: 数 据 安 全 与 大 数 据 系 统 地 点 : 会 议 室 7+8 主 持 人 : 何 利 文 时 间 :8:30-10:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 增 强 云 存 储 中 数 据 机 密 性 的 属 性 基 加 密 方 案 张 星, 文 子 龙, 沈 晴 霓, 吴 中 海 2 可 信 固 态 硬 盘 : 大 数 据 安 全 的 新 基 础 田 洪 亮, 张 勇, 许 信 辉, 李 超, 邢 春 晓 3 面 向 大 数 据 的 软 件 定 义 安 全 服 务 何 利 文, 李 杰, 陈 向 东, 鲁 蔚 锋, 孔 令 军, 王 少 辉, 黄 俊 4 基 于 属 性 的 广 义 签 密 方 案 韩 益 亮, 白 寅 城, 房 鼎 益, 杨 晓 元 5 接 收 与 处 理 分 离 的 实 时 大 数 据 处 理 模 型 彭 建 华, 李 臣 明, 邱 军 林, 李 晓 芳, 徐 立 中 6 观 澜 交 通 数 据 处 理 平 台 董 振, 禹 晓 辉, 崔 星 灿, 宋 仁 勇, 林 立 伟 Session B5: 大 数 据 系 统 与 体 系 结 构 地 点 : 会 议 室 7+8 主 持 人 : 张 东 时 间 :10:15-12:00, 每 个 报 告 15 分 钟 序 号 论 文 标 题 作 者 1 BDSim: 面 向 大 数 据 应 用 的 组 件 化 高 可 配 并 行 模 拟 框 架 2 云 海 大 数 据 一 体 机 体 系 结 构 和 关 键 技 术 3 一 种 面 向 图 数 据 的 预 装 载 缓 存 策 略 4 5 6 7 GRC: 一 种 适 用 于 多 节 点 失 效 的 高 容 错 低 修 复 成 本 纠 删 码 一 种 基 于 历 史 信 息 的 一 致 性 哈 希 集 群 重 复 数 据 删 除 路 由 策 略 一 种 提 高 虚 拟 化 Hadoop 系 统 数 据 本 地 性 的 资 源 调 度 方 法 云 计 算 环 境 下 基 于 改 进 粒 子 群 优 化 算 法 的 多 目 标 资 源 调 度 策 略 研 究 李 文 明, 叶 笑 春, 张 洋, 宋 风 龙, 王 达, 唐 士 斌, 范 东 睿 张 东, 亓 开 元, 吴 楠, 辛 国 茂, 刘 正 伟, 颜 秉 珩, 郭 锋 黄 硕, 左 遥, 梁 英, 许 洪 波, 熊 锦 华, 王 千 博, 程 学 旗 林 轩, 王 意 洁, 裴 晓 强, 许 方 亮, 符 永 铨 邢 玉 轩, 肖 侬, 刘 芳, 付 印 金, 李 芳, 巫 小 泉 孙 瑞 琦, 杨 杰, 高 瞻, 贺 志 强 赵 宏 伟 13

论 文 目 录 和 摘 要 信 息 Session A1: 大 数 据 存 储 管 理 与 处 理 地 点 : 昆 明 多 功 能 A 厅 时 间 :8:30-10:00 主 持 人 : 肖 利 民 题 目 : 基 于 数 据 通 道 的 非 结 构 化 数 据 多 存 储 系 统 作 者 : 蒋 静 远, 鲁 伟 明, 王 耀 光, 楼 仁 杰 单 位 : 浙 江 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 面 对 大 数 据 大 容 量 高 速 率 和 多 样 性 的 特 点, 传 统 关 系 型 数 据 库 不 再 能 满 足 处 理 海 量 非 结 构 化 数 据 的 需 求, 越 来 越 多 的 数 据 中 心 开 始 使 用 以 NoSQL 数 据 库 为 主, 多 个 数 据 存 储 组 件 相 互 协 同 的 多 存 储 系 统 为 了 发 挥 多 存 储 系 统 中 各 个 存 储 组 件 的 功 能, 数 据 需 要 在 多 个 存 储 组 件 之 间 进 行 同 步, 以 ETL 和 客 户 端 多 路 写 为 代 表 的 传 统 数 据 同 步 方 式 不 能 满 足 以 NoSQL 为 存 储 核 心 的 多 存 储 系 统 本 文 提 出 的 非 结 构 化 数 据 多 存 储 系 统 以 HBase 为 主 数 据 库, 使 用 Coprocessor 索 引 信 息 记 录 和 WAL 日 志 文 件 解 析 两 种 方 式 捕 获 HBase 中 的 数 据 变 更, 并 将 以 此 方 法 实 现 的 变 更 捕 获 组 件 接 入 DataBus 实 现 数 据 通 道, 构 建 以 数 据 库 变 更 为 同 步 手 段 的 非 结 构 化 数 据 多 存 储 系 统 实 验 结 果 表 明, 该 系 统 具 有 较 高 的 数 据 变 更 捕 获 性 能 和 良 好 的 可 扩 展 能 力, 为 非 结 构 化 数 据 多 存 储 架 构 提 供 了 一 种 可 行 的 解 决 方 案 题 目 : 大 数 据 集 成 中 确 定 数 据 准 确 属 性 值 的 WR 方 法 作 者 : 周 宁 南, 张 孝, 王 珊 单 位 : 数 据 工 程 与 知 识 工 程 教 育 部 重 点 实 验 室 ( 中 国 人 民 大 学 ) 摘 要 : 大 数 据 集 成 是 提 供 高 质 量 数 据 进 行 决 策 的 基 础 集 成 的 一 个 关 键 环 节 是 根 据 实 体 在 数 据 库 中 的 不 同 元 组 确 定 其 准 确 属 性 值 最 新 的 R-topK 方 法 在 数 据 上 实 施 人 工 设 计 的 规 则 确 定 属 性 值 间 的 准 确 程 度, 得 到 了 相 对 准 确 的 属 性 值 然 而 这 种 方 法 在 处 理 多 个 可 能 的 准 确 值 或 设 计 的 规 则 存 在 冲 突 等 情 况 下 需 要 较 多 人 工 交 互 为 此 本 文 提 出 基 于 权 重 规 则 的 WR(Weighted-Rule) 方 法 确 定 大 数 据 集 成 中 数 据 的 准 确 属 性 值 该 方 法 每 对 属 性 值 间 准 确 程 度 的 判 断 规 则 上 扩 充 了 权 重, 在 准 确 值 发 生 冲 突 时 避 免 了 R-topK 方 法 中 人 工 交 互 干 预 本 文 基 于 追 逐 过 程 设 计 了 约 束 条 件 推 理 算 法, 并 证 明 它 能 够 在 O(n2) 内 推 导 出 每 对 属 性 值 间 的 带 权 重 的 准 确 程 度, 形 成 推 导 准 确 属 性 值 的 约 束 条 件 面 对 约 束 条 件 中 可 能 的 冲 突, 本 文 提 出 了 目 标 求 解 算 法, 在 O(n) 时 间 内 从 所 有 属 性 值 组 合 中 搜 索 最 可 能 的 准 确 属 性 值 我 们 在 真 实 和 合 成 数 据 集 中 进 行 了 充 分 的 实 验, 验 证 了 WR 方 法 的 效 果 和 效 率 WR 方 法 较 R-topK 方 法 在 性 能 上 提 高 了 3-15 倍, 在 效 果 上 提 升 7%-80% 题 目 : 面 向 大 数 据 的 分 布 式 流 处 理 技 术 综 述 作 者 : 张 鹏, 李 鹏 霄, 任 彦, 杨 嵘, 林 海 伦, 刘 庆 云 单 位 : 国 家 计 算 机 网 络 应 急 技 术 处 理 协 调 中 心 摘 要 : 随 着 大 数 据 的 到 来, 数 据 流 处 理 技 术 又 成 为 了 新 的 研 究 热 点 为 此 本 文 回 顾 了 近 期 提 出 的 面 向 大 数 据 的 流 处 理 技 术 的 现 状, 并 且 从 流 处 理 模 型 上 对 这 些 技 术 进 行 了 划 分, 重 点 分 析 了 面 向 大 数 据 的 并 行 分 布 式 的 流 处 理 模 型 的 设 计 目 标 和 架 构 同 时, 重 点 讨 论 了 并 行 分 布 式 流 处 理 模 型 的 关 键 技 术 以 及 未 来 技 术 的 展 望 题 目 : 一 种 大 规 模 时 空 数 据 处 理 与 可 视 化 平 台 作 者 : 杜 一, 郭 旦 怀, 周 园 春, 黎 建 辉 单 位 : 中 国 科 学 院 计 算 机 网 络 信 息 中 心 科 学 数 据 中 心 摘 要 : 当 前 大 多 数 时 空 数 据 处 理 与 可 视 化 工 具 在 数 据 规 模 增 大 时, 不 能 够 对 数 据 进 行 快 速 的 处 理 与 可 视 化 为 解 决 该 问 题, 本 文 通 过 对 任 务 模 型 数 据 模 型 及 可 视 映 射 策 略 的 重 新 定 义, 给 出 一 种 大 规 模 时 空 数 据 处 理 与 可 视 化 平 台 平 台 能 够 支 持 多 种 不 同 类 型 的 时 空 数 据, 通 过 分 布 式 的 数 据 存 储 数 据 重 新 组 织 分 布 式 检 索 空 间 索 引 分 段 预 取 等 技 术, 能 够 实 现 大 规 模 数 据 的 快 速 处 理 与 可 视 化 14

题 目 :Hadoop 环 境 下 三 维 模 型 的 存 储 及 形 状 分 布 特 征 提 取 作 者 : 李 海 生, 赖 龙, 蔡 强, 毛 典 辉, 陈 谊 单 位 : 北 京 工 商 大 学 计 算 机 与 信 息 工 程 学 院 摘 要 : 随 着 三 维 模 型 数 量 爆 炸 式 的 增 长, 如 何 有 效 地 存 储 和 管 理 海 量 的 三 维 模 型 文 件 并 对 其 进 行 高 效 的 处 理, 是 三 维 模 型 检 索 领 域 亟 待 解 决 的 问 题 本 文 首 先 基 于 模 型 文 件 名 的 概 念 相 似 度 对 模 型 文 件 分 类 合 并, 存 入 Hadoop 集 群 的 分 布 式 文 件 系 统 (HDFS) 通 过 引 入 拓 扑 结 构 一 致 性 因 子, 设 计 了 三 维 模 型 完 整 性 函 数, 实 现 了 Hadoop 环 境 下 对 三 维 模 型 形 状 分 布 的 MapReduce 处 理, 并 根 据 分 布 式 计 算 的 特 点 进 行 了 性 能 优 化 以 中 国 台 湾 大 学 的 三 维 模 型 数 据 库 作 为 测 试 集 在 Hadoop 集 群 上 进 行 实 验, 验 证 了 本 文 算 法 的 有 效 性 题 目 : 基 于 数 据 位 图 的 滑 动 分 块 算 法 作 者 : 邓 雪 峰, 孙 瑞 志, 张 永 瀚, 聂 娟 单 位 : 中 国 农 业 大 学 农 业 部 农 业 信 息 获 取 技 术 重 点 实 验 室 摘 要 : 网 络 中 相 似 的 数 据 文 件 进 行 同 步 与 存 储 的 过 程 中, 对 数 据 进 行 分 块, 是 检 测 数 据 重 复 的 重 要 步 骤 之 一, 在 有 效 的 对 数 据 分 块 的 基 础 上 才 能 更 准 确 的 定 位 数 据 间 的 差 异 部 分 本 文 就 数 据 分 块 方 法 予 以 分 析 总 结, 在 滑 动 分 块 算 法 的 基 础 上, 重 新 将 数 据 文 件 组 织 成 类 似 位 图 的 排 列 形 式, 对 数 据 位 图 以 列 向 读 取 数 据 信 息, 形 成 新 的 数 据 分 块, 并 计 算 列 向 读 取 数 据 的 分 块 指 纹 信 息, 以 列 向 数 据 指 纹 为 补 充 校 正 滑 动 分 块 算 法 定 位 差 异 数 据 的 能 力 的 不 足 之 处, 从 而 获 得 更 精 确 的 数 据 差 异 信 息 经 实 验 证 明, 本 方 法 在 同 源 文 件 的 数 据 重 复 检 测 中 效 果 好 于 相 同 条 件 下 的 滑 动 分 块 方 法 Session B1: 数 据 质 量 地 点 : 昆 明 多 功 能 A 厅 时 间 :10:15-12:00 主 持 人 : 曹 建 军 题 目 : 基 于 任 务 合 并 的 并 行 大 数 据 清 洗 过 程 优 化 作 者 : 杨 东 华, 李 宁 宁, 王 宏 志, 李 建 中, 高 宏 单 位 : 哈 尔 滨 工 业 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 数 据 质 量 问 题 会 对 大 数 据 的 应 用 产 生 致 命 影 响, 因 此 需 要 对 存 在 数 据 质 量 问 题 的 大 数 据 进 行 清 洗 MapReduce 编 程 框 架 可 以 利 用 并 行 技 术 实 现 高 可 扩 展 性 的 大 数 据 清 洗, 然 而, 由 于 缺 乏 有 效 的 设 计, 在 基 于 MapReduce 的 数 据 清 洗 过 程 中 存 在 计 算 的 冗 余, 导 致 性 能 的 降 低 因 此 本 文 的 目 的 是 对 并 行 数 据 清 洗 过 程 进 行 优 化 从 而 提 高 效 率 通 过 研 究, 我 们 发 现 数 据 清 洗 中 一 些 任 务 往 往 都 运 行 在 同 一 输 入 文 件 上 或 者 利 用 同 样 的 运 算 结 果, 基 于 该 发 现 本 文 提 出 了 一 种 新 的 优 化 技 术 基 于 任 务 合 并 的 优 化 技 术 针 对 冗 余 计 算 和 利 用 同 一 输 入 文 件 的 简 单 计 算 进 行 合 并, 通 过 这 种 合 并 可 以 减 少 MapReduce 的 轮 数 从 而 减 少 系 统 运 行 的 时 间, 最 终 达 到 系 统 优 化 的 目 标 本 文 针 对 数 据 清 洗 过 程 中 多 个 复 杂 的 模 块 进 行 了 优 化, 具 体 来 说 分 别 对 实 体 识 别 模 块 不 一 致 数 据 修 复 模 块 和 缺 失 值 填 充 模 块 进 行 了 优 化 实 验 结 果 表 明, 本 文 提 出 的 策 略 可 以 有 效 提 高 数 据 清 洗 的 效 率 题 目 : 大 数 据 上 基 于 Hadoop 的 不 一 致 数 据 检 测 与 修 复 算 法 作 者 : 张 安 珍, 门 雪 莹, 王 宏 志, 李 建 中, 高 宏 单 位 : 哈 尔 滨 工 业 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 随 着 现 代 社 会 互 联 网 的 普 及 应 用, 产 生 的 海 量 数 据 普 遍 存 在 质 量 问 题 本 文 针 对 数 据 质 量 中 不 一 致 性 问 题 进 行 研 究, 设 计 并 实 现 了 基 于 Hadoop 并 行 平 台 的 不 一 致 数 据 检 测 与 修 复 算 法 采 用 条 件 函 数 依 赖 作 为 约 束 规 则 检 测 不 一 致 数 据 集 并 求 解 修 复 方 案, 使 得 修 复 结 果 满 足 数 据 一 致 性 要 求, 并 给 出 修 复 结 果 的 确 定 性 概 率 最 后 通 过 实 验 证 明 本 算 法 较 已 有 的 单 机 算 法 有 更 好 的 修 复 效 果 题 目 : 面 向 隐 马 尔 可 夫 特 征 的 数 据 质 量 控 制 模 型 作 者 : 周 金 陵, 刁 兴 春, 周 星, 曹 建 军 单 位 : 解 放 军 理 工 大 学 指 挥 信 息 系 统 学 院 摘 要 : 为 了 在 进 行 数 据 质 量 控 制 时, 考 虑 数 据 的 具 体 特 征 以 提 高 数 据 质 量, 分 析 了 当 前 基 于 贝 叶 斯 网 络 进 行 数 据 质 量 控 制 的 模 型 改 进 模 型 及 其 效 果 针 对 字 段 之 间 存 在 隐 马 尔 可 夫 关 系 的 数 据, 提 出 了 一 种 面 向 隐 马 尔 可 15

夫 特 征 的 数 据 质 量 控 制 模 型, 利 用 贝 叶 斯 网 络 结 构 算 法 确 定 字 段 之 间 是 否 存 在 的 空 间 上 的 关 系, 并 且 利 用 隐 马 尔 可 夫 模 型 的 Baum-Welch 算 法 学 习 字 段 之 间 的 生 成 概 率 矩 阵 ( 反 映 字 段 之 间 的 依 赖 关 系 ) 和 记 录 之 间 转 移 概 率 矩 阵 ( 反 映 记 录 之 间 的 时 间 依 赖 关 系 ), 作 为 推 理 的 依 据 仿 真 实 验 表 明, 将 空 间 和 时 间 上 的 依 赖 关 系 有 机 结 合 起 来 预 测 或 校 验 数 据, 对 于 存 在 隐 马 尔 可 夫 关 系 的 数 据 质 量 控 制 的 提 升 效 果 显 著, 验 证 了 模 型 的 有 效 性 题 目 : 对 非 随 机 缺 失 中 的 缺 失 依 赖 关 系 研 究 作 者 : 郑 奇 斌, 刁 兴 春, 曹 建 军 单 位 : 解 放 军 理 工 大 学 指 挥 信 息 系 统 学 院 摘 要 : 数 据 缺 失 是 一 种 十 分 重 要 而 又 很 常 见 的 数 据 质 量 问 题 对 缺 失 数 据 的 常 见 处 理 方 法 为 估 计 缺 失 值 或 者 直 接 删 除 缺 失 记 录 这 两 种 方 法 都 只 用 到 了 未 缺 失 数 据 中 的 信 息, 而 隐 含 在 缺 失 记 录 中 的 信 息 则 被 舍 弃 了 在 非 随 机 缺 失 中 各 个 缺 失 属 性 并 不 是 独 立 的, 其 中 存 在 着 依 赖 关 系 本 文 使 用 关 联 规 则 挖 掘 的 技 术, 主 要 是 关 联 规 则 挖 掘, 从 发 生 非 随 机 缺 失 的 数 据 集 中 发 现 属 性 间 的 缺 失 依 赖 关 系 利 用 发 现 的 依 赖 关 系, 可 以 对 数 据 分 析 或 者 信 息 采 集 改 进 提 供 帮 助 通 过 在 一 个 真 实 数 据 集 上 的 实 验, 证 明 本 文 的 方 法 可 以 有 效 的 发 现 缺 失 中 的 依 赖 关 系 题 目 : 一 种 含 缺 失 数 据 的 记 录 逻 辑 检 测 方 法 作 者 : 高 科, 刁 兴 春, 曹 建 军 单 位 : 解 放 军 理 工 大 学 指 挥 信 息 系 统 学 院 摘 要 : 针 对 统 计 数 据 集 中 属 性 值 缺 失 普 遍 存 在 的 情 况, 为 了 更 加 准 确 地 进 行 记 录 的 逻 辑 性 检 查, 在 找 出 问 题 数 据 的 基 础 上 尽 可 能 多 地 保 留 数 据 的 有 效 信 息, 提 出 先 利 用 Fellegi-Holt 算 法 对 规 则 进 行 推 演, 再 进 行 数 据 逻 辑 检 测 的 方 法 分 析 了 算 法 的 基 本 原 理, 结 合 具 体 数 据 实 例 进 行 规 则 推 演 及 检 测 分 析, 从 召 回 率 和 准 确 率 两 个 指 标 上 进 一 步 比 较 了 采 用 不 同 方 法 对 问 题 数 据 进 行 检 测 的 效 果 实 验 结 果 表 明, 此 方 法 能 发 现 隐 含 规 则, 进 一 步 提 高 问 题 数 据 的 检 测 效 果 题 目 : 基 于 Hadoop 的 电 网 数 据 质 量 校 验 方 法 与 验 证 系 统 作 者 : 张 志 亮, 孙 煜 华, 陈 承 志, 龙 庆 麟, 梁 国 辉, 顾 荣, 杨 滨 诚, 黄 宜 华 单 位 : 广 州 供 电 局 / 江 苏 省 软 件 新 技 术 与 产 业 化 协 同 创 新 中 心 摘 要 : 在 诸 多 电 网 数 据 处 理 应 用 中, 电 网 数 据 质 量 监 测 是 电 网 大 数 据 处 理 业 务 中 最 重 要 的 一 个 环 节 随 着 电 网 数 据 规 模 和 数 据 质 量 校 验 规 则 数 量 和 复 杂 度 的 不 断 增 大, 目 前 现 有 的 基 于 传 统 数 据 库 系 统 和 计 算 平 台 的 数 据 质 量 校 验 系 统 的 处 理 能 力 已 经 出 现 严 重 的 瓶 颈, 难 以 快 速 完 成 数 据 质 量 的 监 测 和 校 验, 且 系 统 难 以 扩 展, 越 来 越 难 以 满 足 日 常 的 生 产 管 理 和 经 营 决 策 的 需 求 大 数 据 技 术 为 解 决 电 网 大 数 据 处 理 提 供 了 良 好 的 技 术 手 段 和 支 撑 平 台 为 此, 本 文 提 出 了 一 种 基 于 大 数 据 的 电 网 数 据 质 量 校 验 解 决 方 案, 研 究 设 计 了 基 于 Hadoop 平 台 的 分 布 式 数 据 存 储 管 理 和 并 行 化 校 验 规 则 执 行 技 术, 选 择 批 量 和 增 量 数 据 质 量 校 验 典 型 场 景, 进 行 了 验 证 性 研 究, 设 计 实 现 了 针 对 数 据 校 验 的 索 引 存 储 机 制, 对 校 验 规 则 相 关 的 属 性 建 立 快 速 索 引, 并 进 一 步 设 计 实 现 了 基 于 HBase 和 MapReduce 的 并 行 化 校 验 规 则 执 行 算 法, 使 得 数 据 质 量 校 验 的 处 理 性 能 得 到 显 著 提 升 在 此 基 础 上, 基 于 验 证 性 数 据 集 和 校 验 规 则 实 现 了 一 个 验 证 性 系 统, 实 验 结 果 表 明, 所 提 出 的 技 术 方 法 可 以 有 效 地 提 升 数 据 质 量 校 验 处 理 性 能, 可 满 足 实 时 / 准 实 时 电 网 数 据 数 据 校 验 需 求, 并 且 提 供 了 一 种 具 有 良 好 可 扩 展 性 的 系 统 解 决 方 案 题 目 : 利 用 AQL 的 逐 批 海 洋 大 数 据 质 量 检 验 模 型 作 者 : 黄 冬 梅, 周 雪 楠, 王 振 华 单 位 : 上 海 海 洋 大 学 信 息 学 院 摘 要 : 海 洋 数 据 的 质 量 是 数 据 处 理 和 应 用 的 基 础, 如 何 准 确 高 效 的 评 价 海 洋 数 据 的 质 量, 是 制 约 其 精 确 有 效 应 用 的 关 键 问 题 之 一 质 量 检 验 方 案 主 要 涉 及 三 个 参 数, 即 批 量 样 本 量 和 接 收 数, 而 现 有 的 质 量 检 验 方 案 大 多 集 中 于 样 本 量 与 接 收 数 之 间 的 关 系 推 导, 忽 略 了 数 据 批 量 对 于 质 量 检 验 方 案 的 影 响 此 类 方 案 不 适 用 于 批 量 大 小 不 固 定 的 海 洋 大 数 据 的 质 量 检 验 针 对 该 问 题, 通 过 基 于 接 收 质 量 限 (AcceptanceQualityLimit,AQL), 提 出 了 符 合 超 几 何 分 布 的 海 洋 大 数 据 优 化 质 量 检 验 模 型, 建 立 了 批 量 和 样 本 量 之 间 的 联 系, 平 衡 了 数 据 生 产 方 和 使 用 方 对 于 数 据 精 确 度 的 需 求 最 后, 通 过 与 传 统 质 量 检 验 模 型 的 比 较, 验 证 了 其 对 海 洋 大 数 据 质 量 检 验 的 有 效 性 16

Session A2: 数 据 分 析 与 挖 掘 地 点 : 昆 明 多 功 能 B 厅 时 间 :08:30-10:00 主 持 人 : 王 莉 题 目 : 利 用 社 交 关 系 的 实 值 条 件 受 限 玻 尔 兹 曼 机 协 同 过 滤 推 荐 算 法 作 者 : 何 洁 月, 马 贝 单 位 : 东 南 大 学 计 算 机 科 学 与 工 程 学 院 摘 要 : 利 用 受 限 玻 尔 兹 曼 机 (RestrictedBoltzmannMachine,RBM) 解 决 推 荐 问 题 已 成 为 一 个 很 有 意 义 的 研 究 方 向 目 前 用 于 推 荐 的 RBM 模 型 中 使 用 的 仅 仅 是 用 户 评 分 数 据, 但 用 户 评 分 数 据 存 在 着 严 重 的 数 据 稀 疏 性 问 题 随 着 互 联 网 对 人 们 生 活 的 不 断 渗 透, 社 交 网 络 已 经 成 为 人 们 生 活 中 不 可 缺 少 的 一 部 分, 利 用 社 交 网 络 中 的 好 友 信 任 关 系, 有 助 于 缓 解 评 分 数 据 的 稀 疏 性 问 题, 提 高 推 荐 系 统 的 性 能 因 此, 本 文 提 出 基 于 实 值 的 状 态 玻 尔 兹 曼 机 (Real-ValuedConditionalRestrictedBoltzmannMachine,R_CRBM) 模 型, 此 模 型 不 需 要 将 评 分 数 据 转 化 为 向 量 单 元, 将 数 据 中 潜 在 的 评 分 / 未 评 分 信 息 应 用 到 模 型 训 练 过 程 中 ; 并 且 将 最 近 信 任 好 友 关 系 应 用 到 R_CRBM 模 型 推 荐 过 程 中 在 百 度 数 据 集 和 Epinions 数 据 集 上 的 实 验 结 果 表 明 R_CRBM 模 型 和 引 入 的 最 近 信 任 好 友 关 系 均 有 助 于 提 高 推 荐 系 统 的 预 测 精 度 题 目 : 基 于 移 动 网 络 流 量 日 志 的 城 市 空 间 行 为 分 析 作 者 : 强 思 维, 陈 夏 明, 姜 开 达, 金 耀 辉 单 位 : 上 海 交 通 大 学, 区 域 光 纤 通 信 网 与 新 型 光 通 信 系 统 国 家 重 点 实 验 室 摘 要 : 城 市 的 空 间 组 织 和 居 民 行 为 研 究 是 城 市 地 理 学 研 究 的 重 点, 随 着 信 息 技 术 的 快 速 发 展, 居 民 的 时 空 行 为 对 城 市 空 间 的 组 织 和 结 构 的 影 响 呈 现 出 日 益 增 加 的 趋 势, 因 此, 对 城 市 空 间 以 及 居 民 时 空 行 为 的 深 入 分 析 具 有 很 高 的 研 究 价 值 本 文 通 过 采 集 杭 州 市 区 移 动 3G 网 络 流 量 日 志, 首 先 采 用 空 间 点 模 式 的 分 析 方 法 研 究 了 城 市 居 民 的 聚 集 模 式, 居 民 移 动 的 距 离 方 向 等 方 面 的 特 征, 之 后 采 用 网 格 的 方 法 对 城 市 空 间 进 行 分 块, 并 以 区 块 为 主 体, 研 究 了 热 点 区 块 出 现 的 时 空 点, 区 块 人 流 的 更 迭 速 率, 工 作 日 人 流 的 潮 汐 效 应, 提 出 了 区 块 差 异 指 数 的 概 念, 并 利 用 其 对 区 块 进 行 聚 类, 分 析 了 区 块 间 的 相 关 性 和 区 块 间 距 离 之 间 的 关 系 由 于 本 文 研 究 的 研 究 数 据 来 源 于 移 动 3G 网 络 流 量 日 志, 因 此 具 有 覆 盖 面 广 数 据 量 大 等 特 点, 非 常 适 合 从 大 时 空 尺 度 层 面 研 究 居 民 和 城 市 空 间 行 为 题 目 : 一 种 对 数 据 集 稀 疏 度 不 敏 感 的 协 同 推 荐 新 方 法 作 者 : 蔡 国 永, 吕 瑞 单 位 : 桂 林 电 子 科 技 大 学 广 西 可 信 软 件 重 点 实 验 室 摘 要 : 在 推 荐 系 统 领 域 中, 针 对 数 据 集 稀 疏 性 问 题 的 研 究 大 都 建 立 在 静 态 数 据 集 的 基 础 上, 而 实 际 工 业 应 用 中 的 数 据 集 则 往 往 是 动 态 的 并 且 具 有 以 下 两 个 明 显 的 特 征 :1)User-Item 矩 阵 维 度 逐 渐 增 大 ;2) 稀 疏 程 度 不 断 增 加. 因 此, 传 统 的 依 赖 固 定 稀 疏 程 度 数 据 集 的 推 荐 算 法 的 准 确 率 则 会 随 着 数 据 集 稀 疏 度 的 增 加 而 下 降. 基 于 以 上 考 虑, 针 对 稀 疏 度 动 态 变 化 的 工 业 数 据 集 的 特 征, 提 出 一 种 准 确 率 高 而 且 对 数 据 集 稀 疏 程 度 敏 感 性 较 低 的 方 法. 该 方 法 结 合 了 少 量 的 标 签 信 息 并 利 用 了 因 子 分 析 的 方 法, 通 过 建 立 一 种 特 殊 的 因 子 模 型 从 而 为 用 户 构 建 一 个 新 的 User-Factor 向 量 ( 用 户 - 因 子 向 量 ), 并 基 于 新 的 User-Factor 向 量 为 目 标 用 户 进 行 邻 居 发 现 和 评 分 预 测. 最 后, 我 们 通 过 大 量 对 比 实 验 证 明 了 本 文 中 的 方 法 在 处 理 工 业 应 用 中 的 数 据 集 时 算 法 总 是 能 够 保 持 较 高 且 稳 定 的 准 确 率. 题 目 : 基 于 Hadoop 的 领 域 术 语 抽 取 研 究 作 者 : 杜 丽 萍, 李 晓 戈, 周 元 哲, 邵 春 昌 单 位 : 西 安 邮 电 大 学 计 算 机 学 院 / 中 央 民 族 大 学 理 学 院 摘 要 : 传 统 单 机 领 域 术 语 抽 取 系 统 的 扩 展 性 已 经 成 为 基 于 大 规 模 语 料 库 进 行 领 域 术 语 抽 取 的 瓶 颈 对 此 提 出 了 一 种 基 于 Hadoop 分 布 式 平 台 的 统 计 与 规 则 相 结 合 的 无 监 督 的 专 业 术 语 抽 取 算 法, 该 算 法 首 先 利 用 PMI (Point-wiseMutualInformation) 的 改 进 方 法 确 定 2 元 待 扩 展 种 子, 其 次 采 用 左 右 扩 展 的 方 式 逐 字 地 把 2 元 待 扩 展 种 子 扩 展 至 2-n 元 候 选 术 语 (n 表 示 抽 取 术 语 的 最 大 长 度, 可 根 据 需 要 指 定 ), 最 后 利 用 两 个 基 本 规 则 过 滤 候 选 术 语 集 合 实 验 结 果 表 明 当 PMI 改 进 方 法 的 参 数 取 值 大 于 等 于 3 时 可 解 决 PMI 方 法 的 缺 点 基 于 大 规 模 语 料 库 进 行 专 业 术 语 抽 取 的 必 要 性 和 基 于 并 行 算 法 的 高 效 性 17

题 目 : 一 种 融 合 异 构 信 息 网 络 和 评 分 矩 阵 的 推 荐 新 算 法 作 者 : 张 邦 佐, 桂 欣, 何 涛, 孙 焕 垚, 杨 晟 雨, 韩 宇 茹 单 位 : 东 北 师 范 大 学 计 算 机 科 学 与 信 息 技 术 学 院 摘 要 : 在 当 今 的 大 数 据 时 代, 推 荐 系 统 是 解 决 信 息 超 载 的 有 效 手 段 异 构 信 息 网 络 为 推 荐 系 统 更 多 地 融 合 用 户 与 项 目 信 息 提 供 了 机 遇, 而 传 统 的 协 同 过 滤 推 荐 系 统 仅 仅 使 用 用 户 - 项 目 评 分 矩 阵, 为 了 结 合 二 者 的 优 点, 提 出 了 一 个 融 合 它 们 的 新 的 解 决 方 案 首 先 通 过 对 推 荐 系 统 中 的 用 户 属 性 和 项 目 属 性 建 立 异 构 信 息 网 络, 其 次 使 用 基 于 元 路 径 的 相 似 度 计 算 方 法 分 别 计 算 用 户 与 项 目 的 相 似 度 矩 阵, 然 后 使 用 本 文 提 出 的 三 种 将 相 似 度 矩 阵 与 用 户 - 项 目 评 分 矩 阵 融 合 方 法, 最 后 采 用 传 统 的 基 于 矩 阵 分 解 的 推 荐 技 术 进 行 预 测 及 结 果 合 并 在 MovieLens100K 这 一 国 际 标 准 数 据 集 上 以 及 通 过 IMDB 对 电 影 属 性 进 行 扩 展 后, 通 过 实 验 验 证 了 使 用 异 构 信 息 网 络 更 多 地 引 入 用 户 与 项 目 属 性 信 息 以 及 融 合 评 分 矩 阵 可 以 有 效 地 提 高 推 荐 精 度 题 目 : 基 于 广 域 分 布 时 空 轨 迹 大 数 据 的 群 体 行 为 模 式 挖 掘 方 法 作 者 : 杨 杰, 李 小 平, 陈 湉 单 位 : 东 南 大 学 计 算 机 科 学 与 工 程 学 院 摘 要 : 针 对 时 空 轨 迹 大 数 据 广 域 网 分 布 存 储 条 件 下 的 群 体 行 为 模 式 挖 掘 问 题, 本 文 基 于 MapReduce 和 ACO(AntColonyOptimization) 算 法 提 出 可 在 广 域 网 环 境 分 布 并 行 增 量 执 行 的 DPIA (Distributed&Parallel&IncrementalACO) 聚 类 方 法 该 方 法 聚 类 过 程 分 为 历 史 全 量 阶 段 和 若 干 周 期 增 量 阶 段 分 段 持 续 执 行, 通 过 每 个 周 期 的 增 量 数 据 聚 类 持 续 修 正 已 有 聚 类 结 果, 通 过 MapReduce 实 现 每 个 阶 段 聚 类 运 算 的 广 域 网 分 布 并 行 执 行, 避 免 时 空 轨 迹 大 数 据 的 重 复 聚 类 运 算 和 拷 贝 迁 移, 大 大 提 升 运 算 效 率, 保 持 聚 类 结 果 准 确 性 通 过 江 苏 道 路 交 通 监 控 系 统 的 实 际 数 据 比 较 该 方 法 与 已 有 基 于 MapReduce 的 并 行 ACO 方 法, 实 验 结 果 表 明,DPIA 方 法 具 有 更 好 的 聚 类 特 性 Session B2: 社 会 网 络 分 析 与 知 识 图 谱 地 点 : 昆 明 多 功 能 B 厅 时 间 :10:15-12:00 主 持 人 : 何 洁 月 题 目 : 一 种 面 向 大 规 模 社 会 信 息 网 络 的 多 层 社 区 发 现 算 法 作 者 : 康 颖, 于 博, 林 政, 周 江, 王 伟 平, 孟 丹 单 位 : 中 国 科 学 院 信 息 工 程 研 究 所 摘 要 : 社 区 发 现 旨 在 挖 掘 社 会 信 息 网 络 的 社 区 结 构, 是 社 会 计 算 及 其 相 关 研 究 的 基 础 随 着 交 互 式 社 会 信 息 网 络 规 模 的 快 速 增 长, 传 统 的 社 区 发 现 算 法 难 以 满 足 大 规 模 网 络 的 可 扩 展 分 析 需 求 多 层 社 区 发 现 算 法 如 PMetis Graclus 等 虽 然 可 以 分 析 包 含 数 百 万 节 点 规 模 的 网 络, 但 是 小 于 1/2 的 粗 化 缩 减 比 率 以 及 社 会 信 息 网 络 的 幂 律 分 布 特 性 极 大 地 制 约 着 该 类 算 法 的 性 能 优 势 本 文 提 出 了 一 种 基 于 三 角 形 内 点 同 一 社 区 性 粗 化 策 略 的 多 层 社 区 发 现 算 法 TMLCD TMLCD 不 仅 以 大 于 1/2 的 粗 化 缩 减 比 率 加 快 了 大 规 模 社 会 信 息 网 络 的 粗 化 过 程, 而 且 从 基 本 拓 扑 结 构 上 保 持 了 初 始 网 络 的 社 区 效 应, 提 高 了 社 区 发 现 精 度 基 于 真 实 网 络 如 Youtube Orkut 等 的 实 验 结 果 表 明,TMLCD 的 计 算 精 度 内 存 占 用 以 及 运 行 时 间 均 优 于 目 前 典 型 的 多 层 社 区 发 现 算 法, 适 用 于 富 含 三 角 形 的 社 会 信 息 网 络 分 析 题 目 : 一 种 大 规 模 图 数 据 处 理 关 键 技 术 的 评 估 模 型 作 者 : 高 赟, 周 薇, 韩 冀 中, 孟 丹 单 位 : 中 国 科 学 院 信 息 工 程 研 究 所 信 息 智 能 处 理 技 术 研 究 室 摘 要 : 随 着 社 交 网 络 知 识 图 谱 等 图 应 用 的 不 断 发 展, 对 亿 万 个 顶 点 级 别 大 规 模 图 的 处 理 能 力 的 需 求 愈 加 迫 切, 这 是 当 前 海 量 数 据 处 理 领 域 的 研 究 和 开 发 热 点 但 是, 目 前 并 没 有 一 个 全 面 的 评 估 模 型 来 衡 量 和 比 较 当 前 主 流 框 架 的 适 用 场 景 及 利 弊 针 对 以 上 问 题, 本 文 全 面 分 析 和 总 结 了 大 规 模 图 数 据 处 理 的 四 个 关 键 问 题, 包 括 图 数 据 分 布 策 略 磁 盘 数 据 组 织 策 略 迭 代 编 程 模 型 消 息 模 型 与 同 步 策 略 等 结 合 主 流 的 大 规 模 图 处 理 框 架, 建 立 了 评 估 模 型 定 量 地 分 析 这 些 关 键 问 题 对 大 规 模 图 数 据 处 理 的 影 响, 对 未 来 图 计 算 框 架 的 设 计 具 有 指 导 意 义 最 后 通 过 全 面 的 实 验 评 测 证 实 了 本 文 提 出 的 评 估 模 型 的 有 效 性, 在 我 们 的 测 试 结 果 中 发 现 了 如 下 不 同 寻 常 的 现 象 : 与 图 数 据 边 分 割 相 比, 通 常 认 为 更 快 的 顶 点 分 割 方 法 ( 如 PowerGraph) 虽 然 在 邻 域 算 法 上 运 行 时 间 确 实 能 够 达 到 边 分 割 18

的 50% 左 右, 但 是 在 非 邻 域 算 法 上 时 间 开 销 却 是 边 分 割 的 3 倍 ; 与 同 步 策 略 相 比, 异 步 策 略 可 以 减 少 约 20%~30% 的 总 计 算 量, 但 在 稠 密 图 上 由 于 细 粒 度 的 锁 冲 突, 其 运 行 时 间 反 而 可 能 达 到 同 步 策 略 的 2 倍 ; 当 数 据 集 达 到 4 千 万 顶 点 和 13 亿 条 边 时, 基 于 磁 盘 的 MapReduce 比 基 于 内 存 的 Giraph 等 框 架 性 能 反 而 更 高 题 目 : 大 规 模 演 化 知 识 网 络 中 的 关 系 推 断 作 者 : 赵 泽 亚, 贾 岩 涛, 王 元 卓, 靳 小 龙, 程 学 旗 单 位 : 中 国 科 学 院 计 算 技 术 研 究 所 中 国 科 学 院 网 络 数 据 科 学 和 与 技 术 重 点 实 验 室 摘 要 : 网 络 大 数 据 时 代 的 到 来 使 得 知 识 网 络 中 时 空 信 息 越 来 越 丰 富 现 有 的 知 识 网 络 描 述 模 型 对 知 识 的 时 空 信 息 的 刻 画 不 足 研 究 证 明, 利 用 网 络 中 知 识 的 时 空 信 息 以 及 相 关 性, 能 够 提 高 网 络 中 知 识 间 的 关 系 推 断 的 准 确 率 针 对 以 上 问 题, 我 们 首 先 提 出 了 一 种 包 含 时 空 信 息 的 演 化 知 识 网 络 表 示 模 型, 然 后 研 究 在 该 网 络 模 型 上 的 关 系 推 断 问 题, 提 出 了 一 种 基 于 背 包 问 题 的 知 识 间 关 系 推 断 方 法 在 多 个 数 据 集 上 的 实 验 证 明 了 所 提 出 的 关 系 推 断 方 法 的 有 效 性 以 及 对 大 规 模 知 识 网 络 的 适 应 性 题 目 : 社 会 网 络 中 面 向 不 确 定 性 影 响 源 的 影 响 力 传 播 抑 制 方 法 作 者 : 李 劲, 柳 青, 岳 昆, 蔡 莉 单 位 : 云 南 大 学 软 件 学 院 摘 要 : 社 会 网 络 中 影 响 力 传 播 的 有 效 抑 制 是 社 会 网 络 影 响 力 传 播 机 制 研 究 所 关 注 的 问 题 之 一 针 对 未 知 影 响 传 播 源, 或 传 播 源 信 息 具 有 不 确 定 性 的 情 况, 提 出 面 向 不 确 定 性 影 响 源 的 影 响 力 传 播 抑 制 问 题 首 先, 作 为 提 高 抑 制 算 法 效 率 的 有 效 途 径, 讨 论 竞 争 线 性 阈 值 传 播 模 型 下, 影 响 源 传 播 能 力 的 近 似 估 计 方 法, 以 此 为 基 础, 提 出 有 限 影 响 源 情 况 下, 期 望 抑 制 效 果 最 大 化 的 抑 制 种 子 集 挖 掘 算 法 其 次, 对 于 大 尺 寸 不 确 定 性 影 响 源 的 情 况, 为 实 现 算 法 运 行 效 率 和 抑 制 质 量 之 间 的 有 效 折 衷, 提 出 基 于 抽 样 平 均 近 似 的 期 望 抑 制 效 果 最 大 化 的 抑 制 种 子 集 挖 掘 算 法 最 后, 在 真 实 的 社 会 网 络 数 据 集 上, 通 过 实 验 测 试 验 证 了 本 文 所 提 出 方 法 的 有 效 性 题 目 : 基 于 低 秩 结 构 和 局 部 约 束 矩 阵 估 计 的 链 接 预 测 方 法 作 者 : 刘 冶, 印 鉴, 邓 泽 亚, 王 智 圣, 潘 炎 单 位 : 中 山 大 学 信 息 科 学 与 技 术 学 院 摘 要 : 网 络 链 接 预 测 问 题 是 链 接 挖 掘 的 一 个 重 要 部 分, 指 的 是 通 过 已 知 的 网 络 结 构 数 据 预 测 网 络 中 尚 未 连 接 的 任 意 节 点 间 产 生 链 接 的 可 能 性 在 大 数 据 时 代, 互 联 网 社 会 网 络 和 其 他 复 杂 网 络 中 的 链 接 预 测 问 题 研 究 成 为 热 门 领 域 链 接 预 测 相 关 的 方 法 已 被 广 泛 地 应 用 于 社 会 网 络 关 系 挖 掘 个 性 化 推 荐 和 生 物 制 药 等 领 域 在 复 杂 网 络 的 链 接 预 测 问 题 中, 通 常 利 用 相 似 性 矩 阵 来 表 示 网 络 中 任 意 两 个 节 点 之 间 存 在 链 接 的 可 能 性, 因 此 相 似 性 矩 阵 的 计 算 是 链 接 预 测 中 的 至 关 重 要 的 一 步 近 年 来 的 研 究 中, 大 多 数 方 法 是 基 于 已 知 网 络 中 数 据 的 分 析, 通 过 网 络 潜 在 结 构 设 计 机 器 学 习 算 法 构 造 相 似 性 矩 阵 在 全 局 低 秩 的 网 络 结 构 假 设 下, 结 合 网 络 中 节 点 特 征 的 局 部 约 束, 提 出 了 一 种 基 于 数 据 的 链 接 预 测 优 化 算 法, 并 针 对 复 杂 网 络 数 据 链 接 预 测 问 题 设 计 了 可 扩 展 的 分 治 方 法, 便 于 分 布 式 环 境 中 对 大 规 模 数 据 求 解 通 过 在 多 个 真 实 数 据 集 上 的 实 验 和 结 果 分 析, 提 出 的 基 于 低 秩 结 构 和 局 部 约 束 矩 阵 估 计 的 链 接 预 测 分 治 方 法 能 够 取 得 较 好 的 效 果, 并 对 复 杂 的 网 络 结 构 数 据 具 有 较 强 的 可 扩 展 性 题 目 :SFEN-Inf: 一 种 微 博 信 息 传 播 网 络 推 理 算 法 作 者 : 郑 众 杰, 林 学 练 单 位 : 北 京 航 空 航 天 大 学 计 算 机 学 院 摘 要 : 在 线 社 交 网 络 的 特 点 之 一 是 信 息 的 快 速 传 播 和 频 繁 交 互 为 了 更 好 的 研 究 社 交 网 络 的 特 性, 我 们 需 要 知 道 信 息 传 播 网 络 的 结 构 然 而, 信 息 传 播 网 络 通 常 是 潜 在 的 我 们 能 观 察 到 信 息 包 含 的 时 间 戳 和 文 本 等 内 容, 却 难 以 直 接 观 测 到 信 息 传 播 网 络 因 此, 如 何 根 据 观 测 到 的 数 据 准 确 地 推 理 出 潜 在 的 传 播 网 络 结 构, 即 信 息 传 播 网 络 的 推 理 问 题, 具 有 重 要 的 研 究 意 义 本 文 对 该 问 题 进 行 研 究, 根 据 信 息 的 时 间 和 文 本 内 容 的 相 似 性, 建 立 了 信 息 传 播 的 概 率 模 型, 提 出 了 信 息 传 播 网 络 推 理 算 法 SFEN-Inf 我 们 针 对 典 型 的 微 博 事 件 对 SFEN-Inf 算 法 进 行 实 验 分 析, 并 将 SFEN-Inf 算 法 与 著 名 的 NetInf 算 法 进 行 比 较 实 验 结 果 表 明,SFEN-Inf 算 法 在 传 播 网 络 推 理 效 果 上 提 高 约 2 倍, 并 且 算 法 的 时 间 效 率 有 较 明 显 的 提 高 题 目 : 大 数 据 环 境 下 的 动 态 知 识 网 络 模 型 及 构 建 方 法 作 者 : 刘 剑, 许 洪 波, 唐 慧 丰, 程 学 旗 19

单 位 : 中 国 科 学 院 计 算 技 术 研 究 所 摘 要 : 针 对 语 义 知 识 库 构 建 方 式 和 语 义 表 达 模 型 研 究 中 的 不 足, 在 已 有 工 作 的 基 础 上, 提 出 一 种 新 的 语 义 知 识 模 型 : 动 态 知 识 网 络, 在 详 细 阐 述 模 型 组 成 要 素 的 基 础 上, 进 一 步 研 究 了 该 模 型 的 知 识 表 示 方 法 在 语 义 知 识 模 型 的 指 导 下, 面 向 开 放 的 网 络 数 据 资 源, 研 究 了 动 态 知 识 网 络 的 半 自 动 构 建 方 法, 并 且 以 360 百 科 和 新 闻 网 页 数 据 为 基 础 进 行 了 实 验 验 证, 结 果 表 明 所 提 模 型 和 方 法 能 够 有 效 支 持 动 态 知 识 网 络 的 构 建 Session A3: 大 数 据 机 器 学 习 算 法 地 点 : 昆 明 多 功 能 C 厅 时 间 :8:30-10:00 主 持 人 : 禹 晓 辉 题 目 : 面 向 大 数 据 流 的 多 任 务 加 速 在 线 学 习 算 法 作 者 : 李 志 杰, 李 元 香, 王 峰, 匡 立 单 位 : 武 汉 大 学 软 件 工 程 国 家 重 点 实 验 室 摘 要 : 多 任 务 在 线 学 习 框 架 采 用 直 接 数 据 处 理 的 流 式 计 算 模 式, 是 大 数 据 流 分 析 很 有 前 途 的 一 种 工 具 然 而 目 前 的 多 任 务 在 线 学 习 算 法 收 敛 率 低, 仅 为 O(1/T^(1/2)),T 为 算 法 迭 代 次 数 提 出 一 种 新 颖 的 多 任 务 加 速 在 线 学 习 算 法, 在 保 持 多 任 务 在 线 学 习 快 捷 计 算 优 势 的 基 础 上, 达 到 最 优 收 敛 率 O(1/T^2) 对 多 任 务 权 重 学 习 矩 阵 Wt 的 迭 代 邻 近 解 表 达 式 进 行 了 推 导, 对 提 出 算 法 的 收 敛 性 进 行 了 详 细 的 理 论 分 析 实 验 表 明, 提 出 的 多 任 务 加 速 在 线 学 习 算 法 能 够 更 好 地 保 障 大 数 据 流 处 理 的 实 时 性 和 可 伸 缩 性, 有 较 广 泛 的 实 际 应 用 价 值 题 目 : 基 于 非 负 矩 阵 分 解 的 大 规 模 异 构 数 据 联 合 聚 类 作 者 : 申 国 伟, 杨 武, 王 巍, 于 淼, 董 国 忠 单 位 : 哈 尔 滨 工 程 大 学 信 息 安 全 研 究 中 心 摘 要 : 异 构 信 息 网 络 中 包 含 多 类 实 体 和 关 系 随 着 数 据 规 模 增 大 时, 不 同 类 实 体 规 模 增 长 不 平 衡, 异 构 关 系 数 据 也 变 得 异 常 稀 疏, 导 致 聚 类 算 法 的 时 间 复 杂 度 高 准 确 率 低 针 对 上 述 问 题, 提 出 了 一 种 基 于 关 联 矩 阵 分 解 的 两 阶 段 联 合 聚 类 算 法 FNMTF-CM 第 一 阶 段, 抽 取 规 模 较 小 的 一 类 实 体 中 的 关 联 关 系 构 建 关 联 矩 阵, 通 过 对 称 非 负 矩 阵 分 解 得 到 划 分 指 示 矩 阵 与 原 始 关 系 矩 阵 相 比, 关 联 矩 阵 的 稠 密 度 更 高, 规 模 更 小 第 二 阶 段, 将 划 分 指 示 矩 阵 作 为 关 系 矩 阵 三 分 解 的 输 入, 进 而 快 速 求 解 另 一 类 实 体 的 划 分 指 示 矩 阵 在 标 准 测 试 数 据 集 和 异 构 关 系 数 据 集 上 的 实 验 表 明, 算 法 准 确 率 和 性 能 整 体 优 于 传 统 的 基 于 非 负 矩 阵 分 解 的 联 合 聚 类 算 法 题 目 : 基 于 Spark 的 大 规 模 文 本 k-means 并 行 聚 类 算 法 作 者 : 刘 鹏, 滕 家 雨, 张 国 鹏, 胡 延 军, 黄 宜 华 单 位 : 中 国 矿 业 大 学 物 联 网 ( 感 知 矿 山 ) 研 究 中 心 / 南 京 大 学 计 算 机 软 件 新 技 术 国 家 实 验 室 摘 要 : 互 联 网 文 本 数 据 量 的 激 增 使 得 对 其 作 聚 类 运 算 的 处 理 时 间 显 著 加 长, 虽 有 研 究 者 利 用 Hadoop 架 构 进 行 了 k-means 并 行 化 研 究, 但 由 于 很 难 有 效 满 足 k-means 需 要 频 繁 迭 代 的 特 点, 因 此 执 行 效 率 仍 然 不 能 让 人 满 意 本 文 研 究 提 出 了 基 于 新 一 代 并 行 计 算 系 统 Spark 的 k-means 文 本 聚 类 并 行 化 算 法, 利 用 RDD 编 程 模 型 充 分 满 足 了 k-means 频 繁 迭 代 运 算 的 需 求 实 验 结 果 表 明, 针 对 同 一 聚 类 文 本 大 数 据 集 和 同 样 的 计 算 环 境, 基 于 Spark 的 k-means 文 本 聚 类 并 行 算 法 在 加 速 比 扩 展 性 等 主 要 性 能 指 标 上 明 显 优 于 基 于 Hadoop 的 实 现, 因 此 能 更 好 地 满 足 大 规 模 文 本 数 据 挖 掘 算 法 的 需 求 题 目 : 基 于 受 限 玻 尔 兹 曼 机 的 链 接 分 类 算 法 作 者 : 史 喜 斌, 吴 世 伟, 熊 赟 单 位 : 复 旦 大 学 计 算 机 科 学 技 术 学 院 摘 要 : 链 接 分 类 旨 在 给 定 社 会 网 络 图 谱, 预 测 出 其 中 链 接 的 语 义 类 型, 如 信 任 关 系, 同 事 朋 友 关 系 等 已 有 工 作 大 多 关 注 在 特 定 领 域, 对 特 定 领 域 的 数 据 做 人 工 特 征 工 程, 这 种 工 作 的 局 限 是 不 容 易 扩 展 到 其 他 社 会 网 络 中, 算 法 框 架 缺 少 扩 展 性 本 文 提 出 了 结 合 矩 阵 分 解 和 受 限 玻 尔 兹 曼 机 的 特 征 构 造 算 法, 可 以 根 据 网 络 拓 扑 自 动 构 造 隐 式 特 征 用 于 分 类 在 合 作 者 网 络 和 Epinions 信 任 网 络 中 进 行 了 实 验, 算 法 准 确 率 较 人 工 特 征 算 法 有 了 明 显 提 高 20

题 目 : 基 于 滑 窗 不 等 长 时 间 序 列 STS 距 离 的 聚 类 算 法 作 者 : 刘 琴, 王 恺 乐, 饶 卫 雄 单 位 : 同 济 大 学 软 件 学 院 摘 要 : 时 间 序 列 的 聚 类 算 法 是 分 析 预 测 互 联 网 搜 索 对 象 搜 索 指 数 和 社 交 网 络 话 题 热 度 随 时 间 变 化 趋 势 的 重 要 过 程, 但 目 前 时 间 序 列 聚 类 算 法 的 研 究 存 在 两 点 不 足 首 先 国 内 外 的 时 间 序 列 聚 类 的 研 究 都 采 用 等 长 划 分 的 时 间 序 列, 这 往 往 会 丢 失 许 多 重 要 特 征 点, 对 数 据 挖 掘 的 结 果 产 生 一 定 负 面 影 响 其 次 现 有 工 作 均 直 接 使 用 时 间 序 列 观 测 值 不 能 准 确 的 度 量 时 间 序 列 的 形 状 相 似 度 因 此, 本 文 通 过 标 准 分 数 预 处 理 消 除 时 间 序 列 观 测 值 数 量 级 差 异 影 响, 并 设 计 基 于 滑 窗 的 不 等 长 时 间 序 列 STS 距 离 和 类 k-means 聚 类 算 法 中 心 曲 线 计 算 算 法, 最 终 提 出 基 于 滑 窗 不 等 长 时 间 序 列 STS 距 离 的 聚 类 算 法, 从 而 解 决 了 不 等 长 时 间 序 列 聚 类 问 题 本 文 采 集 互 联 网 上 的 真 实 数 据 集 作 为 测 试 样 本, 进 行 大 量 实 验 实 验 结 果 表 明 基 于 滑 窗 不 等 长 时 间 序 列 STS 距 离 的 聚 类 算 法 在 消 除 时 间 序 列 观 测 值 数 量 级 差 异 影 响, 并 解 决 了 不 等 长 时 间 序 列 聚 类 问 题 的 同 时, 比 现 有 算 法 取 得 更 优 的 聚 类 效 果 题 目 : 一 种 基 于 高 斯 混 合 模 型 的 不 确 定 数 据 流 聚 类 方 法 作 者 : 曹 振 丽, 孙 瑞 志, 李 勐 单 位 : 农 业 部 农 业 信 息 获 取 技 术 重 点 实 验 室 摘 要 : 传 感 器 的 广 泛 应 用 产 生 了 大 量 的 不 确 定 数 据 流, 在 聚 类 应 用 中, 当 输 入 数 据 为 连 续 型 随 机 变 量 时, 现 有 基 于 离 散 型 随 机 变 量 的 聚 类 方 法 无 法 满 足 数 据 流 应 用 在 效 率 和 精 度 上 的 要 求 本 文 使 用 高 斯 混 合 模 型 作 为 不 确 定 数 据 的 基 本 表 示 形 式, 仅 需 要 保 存 不 同 组 件 的 描 述 信 息 即 可, 可 以 更 好 的 利 用 存 储 空 间, 完 成 对 真 实 情 况 的 逼 近, 并 提 出 了 一 种 可 以 发 现 时 间 维 度 上 的 不 确 定 数 据 流 聚 类 方 法 cumicro, 该 算 法 将 时 间 直 接 作 为 数 据 属 性, 可 直 接 查 询 某 个 时 间 维 度 的 聚 簇, 避 免 了 传 统 基 于 划 分 的 聚 类 中 较 难 发 现 非 球 状 聚 簇 的 问 题 通 过 实 验 与 经 典 算 法 umicro 进 行 比 较, 证 明 了 本 文 算 法 的 有 效 性, 并 分 析 了 不 同 K 值 Tau 值 下 的 聚 类 结 果 最 后 得 出 结 论, 原 始 数 据 较 密 集 时, 相 较 原 有 基 于 离 散 模 型 的 聚 类, 该 算 法 具 有 准 确 度 上 的 优 势 Session B3: 大 数 据 并 行 化 算 法 地 点 : 昆 明 多 功 能 C 厅 时 间 :10:15-12:00 主 持 人 : 于 俊 清 题 目 : 基 于 BSP 并 行 计 算 模 型 的 K-shell 算 法 作 者 : 王 阳, 吴 斌 单 位 : 北 京 邮 电 大 学, 北 京 市 智 能 通 信 软 件 与 多 媒 体 重 点 实 验 室 摘 要 : 提 出 了 一 种 基 于 BSP 模 型 的 并 行 K-shell 算 法, 算 法 利 用 BSP 特 有 的 超 级 步 和 全 局 同 步 机 制, 将 K-shell 迭 代 分 解 划 分 为 若 干 超 级 步, 利 用 通 信 来 交 换 中 间 计 算 结 果, 节 省 了 MapReduce 模 型 处 理 迭 代 计 算 问 题 时 反 复 读 取 磁 盘 的 时 间 开 销 从 理 论 上 详 细 分 析 了 性 能 影 响 因 素, 并 在 10 个 大 规 模 公 共 数 据 集 上 验 证 了 算 法 较 好 的 性 能 在 节 点 K-shell 值 精 确 计 算 的 基 础 上, 针 对 所 选 数 据 集, 分 析 了 大 规 模 图 的 K-shell 值 分 布 近 似 呈 幂 律 分 布, 并 且 分 布 曲 线 的 趋 势 与 自 身 的 度 分 布 极 其 相 似 通 过 进 一 步 对 并 行 K-shell 运 行 时 间 和 最 大 K-shell 值 与 其 他 图 属 性 的 相 关 性 分 析, 阐 明 了 影 响 这 两 个 值 的 主 要 因 素 题 目 : 基 于 MapReduce 的 多 元 连 接 优 化 方 法 作 者 : 李 甜 甜, 于 戈, 郭 朝 鹏, 宋 杰 单 位 : 东 北 大 学 软 件 学 院 / 东 北 大 学 信 息 科 学 与 工 程 学 院 摘 要 : 多 元 连 接 是 数 据 分 析 最 常 用 的 操 作 之 一,MapReduce 是 广 泛 用 于 大 规 模 数 据 分 析 处 理 的 编 程 模 型, 它 给 多 元 连 接 优 化 带 来 新 的 挑 战 : 传 统 的 优 化 方 法 不 能 简 单 地 适 用 到 MapReduce 中 ;MapReduce 连 接 执 行 算 法 尚 存 优 化 空 间 针 对 前 者, 考 虑 到 I/O 代 价 是 连 接 运 算 的 主 要 代 价, 本 文 首 先 以 降 低 I/O 代 价 为 目 标 提 出 一 种 启 发 式 算 法 确 定 多 元 连 接 执 行 顺 序, 并 在 此 基 础 上 进 一 步 优 化, 最 后 针 对 MapReduce 设 计 一 种 并 行 执 行 策 略 提 高 多 元 连 接 的 整 体 性 能 针 对 后 者, 考 虑 到 负 载 均 衡 能 够 有 效 减 少 MapReduce 的 木 桶 效 应, 本 文 通 过 任 务 公 平 分 配 算 法 提 高 连 接 内 部 的 并 行 度, 并 在 此 基 础 上 给 出 Reduce 任 务 个 数 的 确 定 方 法 最 后, 通 过 实 验 验 证 本 文 提 出 的 执 行 计 划 确 定 方 法 以 及 负 载 均 衡 算 法 的 优 化 效 果 本 研 究 对 大 数 据 环 境 下 MapReduce 多 元 连 接 的 应 用 具 有 指 导 意 义, 可 以 优 化 如 OLAP 分 析 中 的 星 型 连 接, 社 交 网 络 中 社 团 发 现 的 链 式 连 接 等 应 用 的 性 能 21

题 目 : 基 于 SparkR 的 分 类 算 法 并 行 化 研 究 作 者 : 刘 志 强, 顾 荣, 袁 春 风, 黄 宜 华 单 位 : 南 京 大 学 计 算 机 软 件 新 技 术 国 家 重 点 实 验 室 摘 要 : 近 几 年 来, 大 数 据 机 器 学 习 和 数 据 挖 掘 的 并 行 化 算 法 研 究 成 为 大 数 据 领 域 一 个 较 为 重 要 的 研 究 热 点 早 几 年 国 内 外 研 究 者 和 业 界 比 较 关 注 的 是 在 Hadoop 平 台 上 的 并 行 化 算 法 设 计 然 而,HadoopMapReduce 平 台 由 于 网 络 和 磁 盘 读 写 开 销 大, 难 以 高 效 地 实 现 需 要 大 量 迭 代 计 算 的 机 器 学 习 并 行 化 算 法 随 着 UCBerkeleyAMPLab 推 出 的 新 一 代 大 数 据 平 台 Spark 系 统 的 出 现 和 逐 步 发 展 成 熟, 近 年 来 国 内 外 开 始 关 注 在 Spark 平 台 上 如 何 实 现 各 种 机 器 学 习 和 数 据 挖 掘 并 行 化 算 法 设 计 为 了 方 便 一 般 应 用 领 域 的 数 据 分 析 人 员 使 用 所 熟 悉 的 R 语 言 在 Spark 平 台 上 完 成 数 据 分 析,Spark 提 供 了 一 个 称 为 SparkR 的 编 程 接 口, 使 得 一 般 应 用 领 域 的 数 据 分 析 人 员 可 以 在 R 语 言 的 环 境 里 方 便 地 使 用 Spark 的 并 行 化 编 程 接 口 和 强 大 计 算 能 力 本 文 基 于 SparkR 设 计 并 实 现 了 多 种 常 用 的 并 行 化 的 机 器 学 习 分 类 算 法, 包 括 多 项 式 贝 叶 斯 分 类 算 法,SVM 算 法 和 LogisticRegression 算 法 进 一 步 地, 对 于 SVM 和 LogisticRegression 算 法, 本 文 在 常 规 的 并 行 化 策 略 的 基 础 之 上 为 了 进 一 步 提 升 训 练 速 度, 设 计 采 用 了 并 行 化 局 部 优 化 的 迭 代 计 算 模 式 实 验 结 果 表 明, 本 文 所 设 计 实 现 的 基 于 SparkR 的 并 行 化 分 类 算 法 与 HadoopMapReduce 的 方 案 相 比, 速 度 上 提 升 了 8 倍 左 右 题 目 : 基 于 MapReduce 的 并 行 化 最 小 最 大 模 块 化 支 持 向 量 机 研 究 作 者 : 赵 研, 李 云 单 位 : 南 京 邮 电 大 学 计 算 机 学 院 摘 要 : 最 小 最 大 模 块 化 支 持 向 量 机 (M3-SVM) 是 对 大 规 模 数 据 进 行 模 式 分 类 的 有 效 方 法 为 了 进 一 步 提 高 M3-SVM 算 法 处 理 大 规 模 数 据 的 效 率 本 文 基 于 MapReduce 的 编 程 模 型 实 现 了 M3-SVM 的 并 行 化 并 行 化 主 要 分 为 两 个 部 分 : 1 将 M3-SVM 中 的 多 个 任 务 分 解 进 行 并 行 化 ;2 将 M3-SVM 中 用 来 训 练 基 分 类 器 SVM 的 序 列 最 小 优 化 算 法 (SMO) 进 行 并 行 化 在 多 个 现 实 数 据 集 上 的 实 验 结 果 表 明 基 于 MapReduce 的 并 行 化 最 小 最 大 模 块 化 支 持 向 量 机 算 法 不 仅 具 有 较 好 的 可 靠 性, 而 且 比 传 统 的 最 小 最 大 模 块 化 支 持 向 量 机 算 法 具 有 更 好 的 时 间 效 率 题 目 : 基 于 Spark 的 并 行 图 数 据 分 析 系 统 作 者 : 王 虹 旭, 吴 斌, 刘 旸 单 位 : 北 京 邮 电 大 学 计 算 机 学 院 摘 要 : 提 出 了 一 种 基 于 Spark 计 算 平 台 的 并 行 数 据 分 析 系 统 系 统 以 大 规 模 图 数 据 分 析 任 务 为 主, 并 支 持 非 图 数 据 分 析 应 用, 集 成 了 数 据 分 析 算 法 集 合 与 非 图 数 据 分 析 算 法 集 详 细 阐 述 了 该 系 统 的 架 构 设 计, 以 及 部 分 并 行 数 据 分 析 算 法 的 设 计 与 实 现 通 过 多 种 规 模 的 数 据 集 测 试, 该 系 统 相 对 于 以 往 的 图 数 据 挖 掘 系 统 可 以 更 高 效 的 完 成 计 算 任 务, 而 且 也 可 以 有 效 进 行 非 图 数 据 分 析 题 目 : 大 数 据 下 利 用 块 依 赖 的 并 行 实 体 解 析 算 法 作 者 : 王 宁, 黄 敏 单 位 : 北 京 交 通 大 学 计 算 机 与 信 息 技 术 学 院 摘 要 : 实 体 解 析 在 数 据 库 管 理 信 息 检 索 中 均 有 广 泛 应 用, 大 数 据 时 代 的 到 来 使 得 实 体 解 析 在 海 量 数 据 的 处 理 上 面 临 新 的 挑 战 为 适 应 海 量 数 据 的 实 体 解 析 工 作, 提 出 基 于 块 依 赖 的 并 行 实 体 解 析 方 法, 该 方 法 在 MapReduce 编 程 框 架 下 分 三 阶 段 实 现 : 首 先, 依 靠 分 块 技 术 初 步 减 少 计 算 量 ; 其 次, 通 过 基 于 块 依 赖 的 数 据 筛 选 策 略, 挑 选 分 块 中 与 所 在 块 的 块 依 赖 度 较 低 的 实 体 与 其 他 块 中 实 体 匹 配, 不 仅 保 证 解 析 结 果 的 正 确 性, 且 在 一 定 程 度 上 控 制 了 计 算 量 ; 最 后, 通 过 设 定 跨 度 距 离 来 控 制 解 析 数 量, 进 一 步 提 高 时 间 效 率 采 用 真 实 数 据 集 在 Hadoop 上 对 该 方 法 进 行 了 评 估, 实 验 结 果 表 明 该 方 法 在 保 证 解 析 质 量 的 基 础 上 具 有 良 好 的 时 效 性 题 目 : 基 于 Hadoop 的 局 部 支 持 向 量 机 作 者 : 崔 文 斌, 温 孚 江, 牟 少 敏, 浩 庆 波 单 位 : 山 东 农 业 大 学 农 业 大 数 据 研 究 中 心 摘 要 : 随 着 物 联 网 云 计 算 等 技 术 的 不 断 发 展, 产 生 的 数 据 也 以 爆 炸 式 的 速 度 不 断 增 长, 如 何 在 大 数 据 中 进 行 挖 掘 和 分 析 成 为 了 当 前 学 术 界 研 究 的 热 点.Hadoop 分 布 式 计 算 也 因 此 逐 渐 成 为 了 大 数 据 挖 掘 和 分 析 的 主 要 技 术. 支 持 向 量 机 则 是 一 种 应 用 比 较 广 泛 的 数 据 挖 掘 方 法, 局 部 支 持 向 量 机 是 在 支 持 向 量 机 的 基 础 上 引 入 局 部 学 习 算 法 的 一 种 有 效 的 分 类 算 法. 但 是, 局 部 支 持 向 量 机 需 要 为 每 个 测 试 样 本 分 别 构 造 分 类 器, 在 大 数 据 上 进 行 分 类 的 时 间 复 杂 22

度 较 高, 分 类 效 率 比 较 低. 针 对 上 述 问 题, 本 文 结 合 Hadoop 并 行 计 算 平 台, 提 出 了 基 于 Hadoop 的 局 部 支 持 向 量 机 算 法. 本 文 对 局 部 支 持 向 量 机 进 行 了 两 方 面 的 改 进 : 第 一 是 将 计 算 测 试 样 本 的 k 近 邻 并 行 化, 第 二 是 将 训 练 模 型 并 行 化. 通 过 测 试 实 验, 结 果 表 明 : 基 于 Hadoop 的 局 部 支 持 向 量 机 能 够 有 效 降 低 分 类 时 间, 且 在 分 类 精 度 上 与 局 部 支 持 向 量 机 基 本 保 持 一 致. Session A4: 查 询 检 索 地 点 : 西 双 版 纳 厅 时 间 :8:30-10:00 主 持 人 : 陈 耿 题 目 :HiBase: 一 种 基 于 分 层 式 索 引 的 高 效 HBase 查 询 技 术 与 系 统 作 者 : 葛 微, 罗 圣 美, 周 文 辉, 赵 頔, 唐 云, 周 娟, 曲 文 武, 袁 春 风, 黄 宜 华 单 位 : 南 京 大 学 计 算 机 软 件 新 技 术 国 家 重 点 实 验 室 摘 要 :HadoopHBase 系 统 为 大 数 据 的 存 储 管 理 提 供 了 一 种 具 有 高 可 扩 展 性 的 技 术 方 法 和 系 统 平 台 然 而 HBase 不 支 持 非 主 键 索 引, 导 致 HBase 的 数 据 查 询 效 率 较 低, 难 以 满 足 数 据 实 时 / 准 实 时 查 询 需 求 本 文 研 究 提 出 了 一 种 基 于 分 层 式 HBase 非 主 键 索 引 的 查 询 模 型 和 方 法, 包 括 基 于 HBase 的 持 久 性 索 引 基 于 分 布 式 内 存 的 索 引 热 点 数 据 缓 存 技 术 和 高 效 的 热 度 累 积 缓 存 替 换 策 略, 并 实 现 于 分 层 式 索 引 和 查 询 系 统 HiBase 在 千 万 至 十 亿 条 记 录 规 模 数 据 集 上 的 测 试 结 果 表 明,HiBase 总 体 查 询 性 能 比 标 准 HBase 快 300 多 倍 ( 大 结 果 集 ) 到 1.7 万 倍 ( 小 结 果 集 ), 比 开 源 的 Hindex 系 统 快 5~20 倍 题 目 : 异 构 信 息 网 上 的 可 达 性 查 询 作 者 : 尹 丹, 高 宏, 邹 兆 年, 李 建 中 单 位 : 哈 尔 滨 工 业 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 随 着 图 数 据 规 模 的 爆 炸 式 增 长, 其 形 式 也 越 来 越 复 杂. 异 构 信 息 网 可 建 模 成 包 含 多 种 类 型 的 顶 点 和 多 种 类 型 的 边 的 图. 例 如, 文 献 数 据 库 在 线 购 物 网 站 等. 首 次 研 究 异 构 信 息 网 上 的 可 达 性 查 询 问 题. 利 用 不 同 类 型 顶 点 之 间 的 关 系, 查 询 两 个 顶 点 满 足 路 径 模 式 的 可 达 性, 该 问 题 的 时 间 复 杂 度 是 多 项 式 的. 然 而 在 大 规 模 的 网 络 上, 每 次 查 询 遍 历 一 遍 网 络 的 时 间 开 销 也 是 不 能 容 忍 的. 现 有 的 可 达 性 查 询 问 题 主 要 分 为 两 类 :k 跳 可 达 性 查 询 和 带 有 标 签 约 束 的 可 达 性 查 询. 但 是 这 两 种 问 题 的 算 法 都 不 能 用 于 解 决 异 构 信 息 网 上 的 可 达 性 查 询 问 题. 因 此, 为 了 实 现 高 效 的 在 线 查 询, 提 出 一 种 新 的 索 引 结 构, 通 过 路 径 模 式 的 分 解, 预 先 计 算 部 分 路 径 模 式 的 可 达 信 息. 当 在 线 查 询 到 来 时, 在 路 径 模 式 的 偏 序 图 上, 快 速 找 到 索 引 结 构 中 存 在 的 路 径 子 模 式, 高 效 地 计 算 查 询 结 果. 在 真 实 和 人 工 数 据 集 上 进 行 了 大 量 实 验, 验 证 了 算 法 的 有 效 性. 题 目 : 基 于 LDA 主 题 模 型 的 分 布 式 信 息 检 索 集 合 选 择 方 法 作 者 : 何 旭 峰, 陈 岭, 陈 根 才, 钱 坤, 吴 勇, 王 敬 昌 单 位 : 浙 江 鸿 程 计 算 机 系 统 有 限 公 司 / 浙 江 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 针 对 分 布 式 信 息 检 索 时 不 同 集 合 对 最 终 检 索 结 果 贡 献 度 有 差 异 的 现 象, 提 出 一 种 基 于 LDA 主 题 模 型 的 集 合 选 择 方 法 该 方 法 首 先 使 用 基 于 查 询 的 采 样 方 法 获 取 各 集 合 描 述 信 息 ; 其 次, 通 过 建 立 LDA 主 题 模 型 计 算 查 询 与 文 档 的 主 题 相 关 度 ; 接 着, 用 基 于 关 键 词 相 关 度 和 基 于 主 题 相 关 度 结 合 的 方 法 估 计 查 询 与 样 本 集 中 文 档 的 综 合 相 关 度 ; 最 后, 通 过 样 本 集 文 档 所 属 的 集 合 信 息, 估 计 查 询 与 各 集 合 的 相 关 度, 进 而 选 择 相 关 度 最 高 的 M 个 集 合 进 行 检 索 实 验 部 分 采 用 Rm P@n 和 MAP 作 为 评 价 指 标 对 集 合 选 择 方 法 的 性 能 进 行 了 验 证 实 验 结 果 表 明 本 文 提 出 方 法 能 更 准 确 的 定 位 到 包 含 相 关 文 档 多 的 集 合, 提 高 了 检 索 结 果 的 召 回 率 和 准 确 率 题 目 : 基 于 浓 密 树 和 改 进 McCHyp 算 法 的 Impala 查 询 优 化 作 者 : 马 骄 阳, 陈 岭, 赵 宇 亮, 杨 谊, 吴 勇, 王 敬 昌 单 位 : 浙 江 鸿 程 计 算 机 系 统 有 限 公 司 / 浙 江 大 学 计 算 机 科 学 与 技 术 学 院 摘 要 : 针 对 Impala 大 数 据 实 时 查 询 系 统 在 查 询 优 化 上 存 在 的 问 题, 提 出 基 于 浓 密 树 和 改 进 的 McCHyp (MinCutConservativeHypergraph) 算 法 的 Impala 查 询 优 化 方 法 首 先, 修 改 Impala 使 其 支 持 浓 密 树 的 查 询 计 划 ; 接 着, 使 用 剪 枝 策 略 对 McCHyp 算 法 进 行 改 进, 减 少 查 询 优 化 的 时 间 ; 最 后, 提 出 一 种 适 用 于 Impala 的 代 价 23

模 型, 并 将 改 进 的 McCHyp 算 法 集 成 到 Impala 中, 根 据 用 户 的 SQL 语 句 生 成 较 优 的 查 询 计 划 在 Impala 系 统 上 实 现 了 本 文 提 出 的 查 询 优 化 方 法 并 在 TPC-H 数 据 集 上 进 行 了 实 验, 结 果 表 明, 改 进 的 McCHyp 算 法 与 McCHyp 算 法 对 连 接 超 图 的 优 化 结 果 一 致, 且 前 者 的 运 行 时 间 减 少 了 43.82%~62.55% 同 时, 使 用 改 进 的 McCHyp 算 法 及 新 的 代 价 模 型 对 查 询 语 句 优 化 后, 查 询 响 应 时 间 较 原 始 的 Impala 系 统 减 少 了 79.60% 题 目 : 基 于 内 存 的 分 布 式 隐 私 流 查 询 系 统 作 者 : 张 鹏, 刘 庆 云, 熊 翠 文, 李 保 珲, 郑 超, 易 立 单 位 : 中 国 科 学 院 信 息 工 程 研 究 所 摘 要 : 随 着 大 数 据 时 代 的 到 来, 隐 私 问 题 备 受 关 注, 用 户 一 方 面 希 望 获 得 新 鲜 和 低 延 迟 的 查 询 结 果, 另 一 方 面 又 希 望 对 查 询 信 息 进 行 隐 私 保 护, 为 此 本 文 提 出 了 一 种 基 于 内 存 的 分 布 式 隐 私 流 查 询 系 统, 其 中, 查 询 可 以 通 过 Paillier 密 码 系 统 进 行 加 密 该 系 统 在 shared-nothing 架 构 下 支 持 水 平 扩 展, 实 现 了 在 内 存 中 对 流 数 据 进 行 分 片 的 并 行 查 询 以 及 基 于 位 图 索 引 的 压 缩 存 储 实 验 证 明 了 该 系 统 的 有 效 性 题 目 : 基 于 信 息 熵 加 权 的 三 维 模 型 特 征 融 合 算 法 作 者 : 李 海 生, 张 朝 立, 蔡 强, 毛 典 辉, 杜 军 平 单 位 : 北 京 邮 电 大 学 计 算 机 学 院 / 北 京 工 商 大 学 计 算 机 与 信 息 工 程 学 院 摘 要 : 特 征 融 合 是 提 高 三 维 模 型 检 索 有 效 性 的 一 种 重 要 手 段, 越 来 越 受 到 广 泛 关 注 为 解 决 融 合 特 征 权 重 的 自 适 应 问 题, 提 出 了 一 种 基 于 信 息 熵 加 权 的 三 维 模 型 多 特 征 融 合 算 法, 以 提 升 检 索 效 果 算 法 的 主 要 贡 献 有 : 首 先 为 了 精 确 地 刻 画 形 状 分 布 直 方 图, 针 对 传 统 形 状 分 布 算 法 提 出 了 三 次 样 条 插 值 形 状 分 布 特 征 提 取 算 法, 同 时 由 于 形 状 分 布 算 法 本 身 缺 少 描 述 模 型 形 状 的 层 次 分 布 信 息, 设 计 了 简 化 的 形 状 上 下 文 特 征 提 取 算 法 ; 然 后, 采 用 衡 量 不 确 定 性 的 信 息 熵 来 自 适 应 计 算 上 述 两 个 欲 融 合 特 征 的 权 值, 进 而 得 到 融 合 后 的 相 似 距 离 用 于 三 维 模 型 检 索 在 SHREC2014 的 综 合 模 型 库 上 实 验, 结 果 表 明 : 所 提 特 征 融 合 算 法 的 通 用 和 加 权 的 六 种 评 价 指 标 (PR/NN/FT/ST/E/DCG) 优 于 采 用 单 一 特 征 的 检 索 算 法, 且 运 行 效 率 较 高 Session B4: 大 数 据 应 用 地 点 : 西 双 版 纳 厅 时 间 :10:15-12:00 主 持 人 : 罗 圣 美 题 目 : 海 量 车 牌 识 别 数 据 集 上 基 于 时 空 划 分 的 旅 行 时 间 计 算 方 法 作 者 : 赵 卓 峰, 张 帅, 丁 维 龙 单 位 : 北 方 工 业 大 学 云 计 算 研 究 中 心 摘 要 : 城 市 路 段 旅 行 时 间 计 算 是 智 能 交 通 领 域 研 究 的 热 点 问 题 之 一, 精 确 的 旅 行 时 间 计 算 有 助 于 实 现 路 网 调 度, 减 少 交 通 拥 塞 车 牌 识 别 数 据 作 为 近 年 来 新 兴 的 一 种 针 对 城 市 道 路 行 驶 车 辆 的 实 时 监 测 数 据, 具 有 持 续 生 成 且 数 据 量 大 时 间 空 间 相 关 等 特 性 为 了 利 用 车 牌 识 别 数 据 集 进 行 高 效 准 确 的 旅 行 时 间 计 算, 给 出 了 基 于 车 牌 识 别 数 据 集 的 旅 行 时 间 计 算 定 义, 在 此 基 础 上 提 出 一 种 基 于 时 空 划 分 的 流 水 线 式 并 行 计 算 模 型, 并 给 出 了 该 模 型 基 于 实 时 MapReduce 的 实 现 通 过 一 组 基 于 海 量 真 实 车 牌 识 别 数 据 集 的 实 验 表 明, 相 对 于 传 统 的 旅 行 时 间 计 算 方 式, 本 文 方 法 在 亿 级 车 牌 数 据 集 上 的 旅 行 时 间 计 算 性 能 方 面 可 以 提 高 3 倍 以 上, 同 时 具 有 适 合 细 粒 度 划 分 受 路 网 规 模 影 响 小 及 扩 展 性 好 的 特 点 题 目 : 基 于 海 量 医 疗 数 据 的 症 状 自 查 服 务 的 云 框 架 设 计 作 者 : 周 作 建, 林 文 敏, 王 斌 斌, 潘 金 贵 单 位 : 南 京 大 学 计 算 机 软 件 新 技 术 国 家 重 点 实 验 室 摘 要 : 随 着 当 前 社 会 亚 健 康 人 群 的 增 加, 症 状 自 查 服 务 显 得 愈 发 重 要 各 地 基 于 居 民 健 康 档 案 的 区 域 卫 生 信 息 平 台 的 建 立, 为 症 状 自 查 服 务 实 现 提 供 了 数 据 基 础, 但 是 我 们 仍 面 临 着 海 量 电 子 病 历 的 获 取 存 储 搜 索 以 及 数 据 分 析 计 算 等 诸 多 挑 战 鉴 于 上 述 问 题, 本 文 提 出 一 种 基 于 云 框 架 的 症 状 自 查 服 务 模 型 首 先, 本 文 建 立 了 Hadoop 集 群, 用 来 对 海 量 医 疗 数 据 的 存 储 以 及 索 引 的 建 立, 提 高 电 子 病 历 的 搜 索 响 应 时 间 其 次, 本 文 设 计 了 基 于 Lucene 的 分 布 式 搜 索 节 点 集 群, 用 来 对 海 量 的 电 子 病 历 进 行 实 时 检 索 数 据 分 析 和 隐 私 过 滤 此 外, 本 文 对 症 状 自 查 服 务 的 实 现 进 行 讨 论, 包 括 搜 索 节 点 的 选 择 病 历 索 引 文 件 的 建 立 病 历 相 似 度 的 计 算 及 排 序 方 法 最 后, 本 文 通 过 实 验 证 实 症 状 自 查 服 务 的 云 框 架 模 型 具 有 可 扩 展 性 和 有 效 性 24

题 目 : 基 于 TCBF_LRU 的 高 速 网 络 大 流 检 测 算 法 作 者 : 白 磊, 田 立 勤, 陈 超 单 位 : 华 北 科 技 学 院 计 算 机 学 院 摘 要 : 在 高 速 主 干 网 络 中, 随 着 网 络 链 路 速 率 的 不 断 提 高 和 网 络 流 数 量 的 急 速 增 加, 同 时 受 到 硬 件 计 算 和 存 储 资 源 的 限 制, 如 何 及 时 准 确 地 在 海 量 数 据 中, 有 效 的 检 测 出 其 中 的 大 流 信 息, 成 为 目 前 大 规 模 高 速 网 络 流 测 量 的 热 点 问 题 本 文 根 据 传 统 的 LRU 算 法 容 易 淘 汰 大 流 和 频 繁 更 新 给 系 统 带 来 巨 大 压 力 的 缺 陷, 提 出 一 种 新 的 大 流 检 测 算 法 TCBF_LRU 算 法, 用 于 高 速 网 络 大 流 信 息 识 别 算 法 通 过 时 间 超 时 和 大 流 报 文 预 保 护 策 略, 过 滤 大 部 分 的 小 流 报 文, 极 大 减 少 LRU 算 法 小 流 置 换 大 流 的 概 率, 提 高 算 法 的 准 确 性 分 析 了 算 法 的 误 判 率 和 复 杂 度, 并 通 过 实 际 主 干 网 trace 数 据, 实 验 分 析 了 算 法 参 数 配 置 对 于 大 流 检 测 准 确 性 的 影 响 理 论 分 析 和 仿 真 结 果 表 明, 与 标 准 LRU 算 法 和 BF_LRU 算 法 相 比, 在 使 用 相 同 的 缓 存 空 间 下,TCBF_LRU 算 法 具 有 更 高 的 测 量 准 确 性 和 实 用 性 题 目 : 大 数 据 下 纺 织 制 造 执 行 系 统 关 键 问 题 研 究 作 者 : 邵 景 峰, 贺 兴 时, 王 进 富, 白 晓 波, 刘 晟, 马 创 涛, 刘 聪 颖 单 位 : 西 安 工 程 大 学 管 理 学 院 / 长 安 大 学 信 息 工 程 学 院 摘 要 : 为 解 决 纺 织 制 造 执 行 系 统 设 计 过 程 中 的 数 据 融 合 问 题, 首 先 对 纺 织 制 造 过 程 中 产 生 的 海 量 数 据 及 其 相 关 性 进 行 分 析, 并 对 纺 织 工 艺 流 程 进 行 了 优 化 设 计, 然 后, 利 用 多 色 集 合 理 论 对 纺 织 制 造 过 程 中 产 生 的 海 量 数 据 进 行 了 统 一 形 式 化 表 达, 并 针 对 异 构 纺 织 监 测 系 统 数 据 库 间 难 以 融 合 的 问 题, 利 用 D-S 证 据 提 出 了 一 种 采 用 两 级 传 感 器 信 息 融 合 的 方 法 最 后, 通 过 实 验 验 证, 结 果 表 明 : 通 过 对 制 造 过 程 数 据 的 统 一 描 述, 提 出 的 信 息 融 合 方 法 有 效 解 决 了 海 量 纺 织 数 据 的 融 合 问 题, 实 现 了 计 划 层 与 制 造 层 之 间 信 息 的 有 效 衔 接, 有 利 于 为 构 建 大 数 据 环 境 下 的 纺 织 制 造 执 行 系 统 提 供 技 术 支 撑 题 目 : 一 种 支 持 音 乐 情 感 检 索 的 索 引 结 构 作 者 : 王 伟, 徐 立 臻, 董 逸 生 单 位 : 东 南 大 学 计 算 机 科 学 与 工 程 学 院 摘 要 : 本 文 提 出 一 种 支 持 音 乐 情 感 色 彩 检 索 的 索 引 结 构 针 对 MIDI 音 乐 文 件 的 音 高 特 征 数 据, 提 出 音 高 与 色 彩 关 联 概 念, 建 立 音 高 色 彩 空 间, 然 后 在 分 析 多 个 情 感 模 型 的 基 础 上, 提 出 音 高 色 彩 与 情 感 映 射 的 情 感 色 彩 词 组 对 表, 建 立 音 乐 情 感 色 彩 索 引, 并 设 计 一 个 情 感 色 彩 检 索 算 法 理 论 分 析 和 实 验 结 果 表 明 : 通 过 色 彩 能 直 观 有 效 地 表 现 出 音 乐 所 蕴 含 的 基 本 情 感, 为 音 乐 情 感 检 索 提 供 了 一 种 新 思 路 题 目 : 电 力 数 据 语 义 冲 突 检 测 及 消 减 技 术 研 究 作 者 : 张 德 刚, 吴 毅, 张 德 海, 张 少 泉 单 位 : 云 南 电 力 试 验 研 究 院 ( 集 团 ) 有 限 公 司 电 力 研 究 院 摘 要 : 随 着 电 力 企 业 信 息 化 的 加 快, 企 业 内 部 各 种 信 息 系 统 间 的 异 构 数 据 逐 渐 增 多, 如 何 有 效 的 消 除 这 些 异 构 数 据 之 间 的 语 义 冲 突 成 为 一 个 热 点 问 题 本 文 根 据 电 力 数 据 语 义 冲 突 的 具 体 情 况, 提 出 了 一 个 冲 突 检 测 及 消 减 模 型, 将 电 力 企 业 内 部 的 异 构 数 据 源 进 行 融 合, 有 效 地 解 决 电 力 企 业 内 部 数 据 源 语 义 冲 突 问 题 使 用 结 果 表 明, 该 模 型 可 以 有 效 消 解 异 构 数 据 源 之 间 的 语 义 冲 突, 为 电 力 企 业 内 部 及 企 业 间 异 构 数 据 的 融 合 和 共 享 提 供 有 力 的 支 持 题 目 : 大 数 据 背 景 下 山 东 省 二 代 玉 米 螟 发 生 程 度 预 测 模 型 的 构 建 作 者 : 杨 波, 刘 勇, 牟 少 敏, 温 孚 江 单 位 : 山 东 农 业 大 学 大 数 据 研 究 中 心 摘 要 : 大 数 据 技 术 重 塑 了 我 们 周 围 的 世 界 农 业 大 数 据 是 大 数 据 的 重 要 组 成 部 分, 是 大 数 据 理 念 技 术 和 方 法 在 农 业 领 域 的 应 用 和 发 展 依 靠 多 年 农 作 物 害 虫 发 生 的 数 据 积 累, 使 数 据 转 化 为 监 测 预 警 的 行 动, 是 大 数 据 思 想 和 理 念 的 具 体 体 现 通 过 对 山 东 省 2003-2013 年 的 平 均 气 温 降 水 日 照 时 数 风 速 等 气 象 资 料 的 相 关 分 析, 采 用 多 元 线 性 回 归 方 法, 分 析 预 测 6 月 下 旬 7 月 上 中 下 旬 和 8 月 上 旬, 玉 米 螟 的 发 生 程 度, 建 立 了 玉 米 螟 动 态 气 候 预 测 模 型 经 检 验, 玉 米 螟 的 发 生 与 当 地 的 气 象 条 件 有 直 接 的 关 系,6 月 下 旬 7 月 上 旬 7 月 下 旬 和 8 月 上 旬 模 型 拟 合 的 准 确 率 分 别 为 91% 77% 69% 和 68% 25