中 国 计 算 机 学 会 学 科 前 沿 讲 习 班 The CCF Advanced Disciplines Lectures 第 31 期 主 题 自 然 语 言 处 理 与 机 器 学 习 理 论 方 法 与 应 用 2012 年 10 月 31 日 -11 月 2 日 北 京 随 着 计 算 机 网 络 和 移 动 通 讯 技 术 的 快 速 发 展 和 普 及, 面 向 网 络 文 本 理 解 和 知 识 挖 掘 的 自 然 语 言 处 理 技 术 正 在 成 为 学 术 界 和 产 业 界 关 注 的 热 点 一 方 面, 来 自 各 类 用 户 的 海 量 信 息 充 斥 着 巨 大 的 网 络 空 间, 如 Facebook QQ Twitter 新 浪 微 博 等 社 交 网 站 及 Skype GTalk MSN 等 通 信 工 具 每 天 为 我 们 记 录 或 传 送 了 数 以 十 亿 计 用 户 的 所 思 所 言, 而 这 些 数 据 80% 以 上 为 自 然 语 言 文 本, 面 对 如 此 庞 大 的 非 结 构 化 和 半 结 构 化 的 动 态 数 据, 如 何 针 对 不 同 需 求 建 立 有 效 快 捷 的 处 理 模 型 和 实 现 方 法? 另 一 方 面, 机 器 学 习 理 论 和 方 法 在 近 几 年 来 发 展 迅 速, 若 干 模 型 和 算 法 已 经 在 自 然 语 言 处 理 的 各 个 方 向 上 发 挥 了 重 要 作 用 那 么, 面 对 自 然 语 言 处 理 的 复 杂 任 务, 如 何 进 一 步 研 究 和 开 发 新 的 机 器 学 习 理 论 和 方 法? 这 是 众 多 学 者 和 企 业 家 共 同 关 注 的 问 题 本 期 CCF 学 科 前 沿 讲 习 班 将 围 绕 面 向 互 联 网 的 自 然 语 言 处 理 和 机 器 学 习 相 关 理 论 技 术 及 应 用 方 法, 邀 请 学 术 界 和 工 业 界 的 著 名 专 家 学 者 系 统 地 讲 授 相 关 学 术 理 论 知 识 和 应 用 创 新 经 验, 面 向 有 志 于 从 事 自 然 语 言 处 理 和 机 器 学 习 基 础 理 论 研 究 和 应 用 技 术 研 发 的 青 年 学 者 和 学 生 提 供 三 天 学 习 和 交 流 的 机 会, 让 参 加 者 全 面 了 解 并 掌 握 该 领 域 的 基 本 概 念 和 主 要 研 究 内 容, 把 握 研 究 热 点 和 前 沿, 提 高 学 术 水 平 和 研 究 实 践 能 力 讲 习 班 采 用 小 班 授 课 方 式 (60 人 ), 中 文 讲 解, 利 于 答 疑 解 惑, 同 时 提 供 参 加 NLP&CC2012 举 办 的 微 博 情 感 分 析 与 词 汇 语 义 关 系 评 测 研 讨 会 的 机 会 共 同 学 术 主 任 : 宗 成 庆 中 国 科 学 院 自 动 化 研 究 所 周 明 微 软 亚 洲 研 究 院 协 办 单 位 : 微 软 亚 洲 研 究 院 (MSRA) 10 月 31 日 : 机 器 学 习 与 机 器 翻 译 日 程 安 排 特 邀 讲 者 及 报 告 题 目 : 上 午 第 一 讲 : 概 率 图 模 型 : 表 示 推 断 与 学 习
主 讲 人 : 王 立 威 北 京 大 学 下 午 第 二 讲 : 机 器 翻 译 及 多 语 理 解 主 讲 人 : 张 民 新 加 坡 信 息 通 信 研 究 所 (I 2 R) 11 月 1 日 : 微 软 亚 洲 研 究 院 专 题 上 午 第 三 讲 : 互 联 网 创 新 组 织 者 : 周 明 微 软 亚 洲 研 究 院 下 午 第 四 讲 : 搜 索 引 擎 基 础 和 实 战 主 讲 人 : 兰 东 俊 微 软 亚 洲 互 联 网 工 程 院 第 五 讲 : 如 何 做 研 究 ( 参 观 讲 座 和 讨 论 ) 组 织 者 : 马 歆 微 软 亚 洲 研 究 院 11 月 2 日 : 面 向 互 联 网 的 自 然 语 言 处 理 技 术 与 应 用 上 午 第 六 讲 : 信 息 抽 取 和 问 答 系 统 主 讲 人 : 赵 军 中 科 院 自 动 化 所 研 究 员 下 午 第 七 讲 : 文 本 挖 掘 的 概 率 主 题 模 型 主 讲 人 : 翟 成 祥 美 国 伊 利 诺 伊 大 学 副 教 授
注 册 费 :( 含 资 料 和 3 天 的 午 餐 ) 1. 9 月 15 日 前 报 名 并 缴 费 : 会 员 ( 或 研 究 生 )900 元, 非 会 员 1200 元 2. 9 月 30 日 前 缴 费 : 会 员 ( 或 研 究 生 )1000 元, 非 会 员 1300 元 3. 10 月 31 日 缴 费 ( 含 当 天 缴 费 ): 会 员 1200 元, 非 会 员 1500 元 优 惠 办 法 : 1. 同 一 单 位 一 次 有 5 人 报 名 者, 第 六 个 人 免 注 册 费 ( 无 论 会 员 与 否, 仅 对 提 前 注 册 者 有 效, 当 天 不 予 受 理 ) 2. 2011 年 参 加 过 2 次 讲 习 班 的 CCF 会 员 可 优 惠 100 元 3. 2012 年 参 加 3 次 讲 习 班 的 CCF 会 员, 第 4 次 参 加 时 免 交 注 册 费 4. 往 届 学 员 推 荐 一 名 新 学 员 时, 推 荐 者 当 期 注 册 费 优 惠 100 元 5. 同 时 满 足 以 上 多 项 优 惠 条 款 时, 只 能 选 择 一 项 6. 学 员 可 免 费 参 加 NLP&CC2012 举 办 的 微 博 情 感 分 析 与 词 汇 语 义 关 系 评 测 研 讨 会 (MSA/LSR Workshop 2012 食 宿 自 理 缴 费 方 式 : 邮 寄 : 北 京 2704 信 箱, 邮 编 :100190 收 款 人 : 中 国 计 算 机 学 会, 银 行 转 账 : 开 户 行 : 北 京 银 行 北 京 大 学 支 行 ; 户 名 : 中 国 计 算 机 学 会 帐 号 :01090519 5001 201 097 020 28 请 务 必 注 明 : 姓 名 TCCI-ADL 现 场 : 报 到 时 缴 纳 报 名 方 式 : 即 日 起 至 2012 年 9 月 30 日, 报 名 者 请 填 写 附 表 并 发 送 至 :zlu@nlpr.ia.ac.cn, 按 报 名 先 后 录 取 学 会 秘 书 处 将 与 邮 寄 联 系 确 认 自 10 月 1 日 起 不 再 接 受 通 讯 报 名, 只 接 受 10 月 31 日 现 场 报 名 联 系 人 : 陆 征 E-Mail: zlu@nlpr.ia.ac.cn 电 话 : 010-82614468 地 址 : 北 京 市 海 淀 区 中 关 村 东 路 95 号 中 科 院 自 动 化 所 模 式 识 别 国 家 重 点 实 验 室
日 程 安 排 2012 年 10 月 31 日 : 机 器 学 习 与 机 器 翻 译 上 午 : 8:30-9:00 开 班 仪 式 合 影 9:00-12:00 第 一 讲 : 概 率 图 模 型 : 表 示 推 断 与 学 习 主 讲 人 : 北 京 大 学 教 授 王 立 威 第 一 课 09:00-10:20 机 器 学 习 基 础 休 息 10:20-10:40 第 二 课 10:40-12:00 概 率 图 模 型 Elements of Machine Learning Probabilistic Graphical Models 下 午 :13:30-18:00 第 二 讲 : 机 器 翻 译 及 多 语 理 解 主 讲 人 : 新 加 坡 信 息 通 信 研 究 所 (I2R) 张 民 第 一 课 13:30-14:00 自 然 语 言 处 理 和 机 器 翻 译 基 础 : 预 备 知 识 基 本 概 念 相 关 学 科 和 背 景 知 识 第 二 课 14:30-15:30 机 器 翻 译 综 述 : 前 世 和 今 生 主 要 研 究 方 法 和 主 要 的 公 共 模 块 休 息 15:30-16:00 第 三 课 16:00-17:00 统 计 机 器 翻 译 : 基 于 词 短 语 和 句 法 的 方 法 第 四 课 17:00-17:30 机 器 翻 译 未 来 : 下 一 步 发 展 趋 势 研 究 方 法 和 产 业 化 第 五 课 17:30-18:00 Free QA( 互 动 课 ) 2012 年 11 月 1 日 :NLP2.0 互 联 网 创 新 与 应 用 上 午 : 8:30-12:00 第 三 讲 : 互 联 网 创 新 第 一 课 08:30-10:00 社 会 关 系 网 的 文 本 挖 掘 和 应 用 周 明 刘 晓 华, 韦 福 如 休 息 10:00-10:30 第 二 课 10:30-11:00 由 文 本 到 图 像 的 变 换 王 欣 靖 第 三 课 11:00-11:30 基 于 知 识 库 的 短 文 本 概 念 化 及 其 应 用 宋 阳 秋 第 四 课 11:30-12:00 对 象 级 别 的 互 联 网 搜 索 及 交 互 式 知 识 挖 掘 聂 再 清 下 午 : 13:30-15:30 第 四 讲 : 搜 索 引 擎 基 础 和 实 战 主 讲 人 : 兰 东 俊 第 一 课 13:30-14:00 搜 索 引 擎 基 本 原 理 第 二 课 14:00-14:30 搜 索 引 擎 的 实 战 经 验 第 三 课 14:30-15:00 搜 索 引 擎 的 未 来 发 展 趋 势 和 研 究 方 向 休 息 15:30-16:00 16:00-18:00 第 五 讲 : 如 何 做 研 究 ( 参 观 讲 座 讨 论 ) 组 织 者 : 马 歆 严 峻 段 楠
2012 年 11 月 2 日 : 面 向 互 联 网 的 自 然 语 言 处 理 技 术 上 午 :8:30-12:00 第 六 讲 : 信 息 抽 取 和 问 答 系 统 主 讲 人 : 中 科 院 自 动 化 所 研 究 员 赵 军 第 一 课 08:30-09:10 第 二 课 09:10-09:50 休 息 09:50-10:10 第 三 课 10:10-10:50 第 四 课 10:50-11:30 第 五 课 11:30-12:00 信 息 抽 取 观 点 信 息 抽 取 问 答 系 统 社 区 问 答 系 统 互 动 课 下 午 :13:30-15:30 第 七 讲 : 文 本 挖 掘 的 概 率 主 题 模 型 主 讲 人 : 美 国 伊 利 诺 伊 大 学 副 教 授 翟 成 祥 第 一 课 13:30-14:00 第 二 课 14:00-15:00 第 三 课 15:00-15:30 概 率 主 题 模 型 基 本 介 绍 概 率 主 题 模 型 在 文 本 挖 掘 中 的 重 要 应 用 未 来 的 研 究 展 望 15:00-15:30 结 业 式 下 午 :15:30-18:00 NLP&CC2012 微 博 情 感 分 析 与 词 汇 语 义 关 系 评 测 研 讨 会
讲 座 与 专 家 介 绍 第 一 讲 : 概 率 图 模 型 : 表 示 推 断 与 学 习 主 讲 人 : 王 立 威, 北 京 大 学 教 授 主 要 内 容 : 我 们 通 过 介 绍 机 器 学 习 的 基 本 思 想 引 入 概 率 图 模 型 首 先 描 述 为 何 概 率 图 模 型 适 于 表 示 机 器 学 习 问 题, 以 及 概 率 图 模 型 的 表 示 能 力, 包 括 有 向 图 Bayes 网 和 无 向 图 Markov 网 接 下 来 我 们 转 入 如 何 利 用 概 率 图 模 型 进 行 推 断 报 告 将 深 入 浅 出 地 介 绍 概 率 图 模 型 常 用 推 断 算 法, 包 括 著 名 的 belief propagation 算 法, 马 尔 科 夫 链 蒙 特 卡 罗 (MCMC) 方 法 等 同 时, 我 们 还 将 简 要 指 出 概 率 图 模 型 推 断 的 本 质 困 难 性 以 及 近 似 的 必 要 性 最 后, 我 们 介 绍 如 何 从 数 据 中 学 习 概 率 图 模 型, 重 点 是 图 结 构 学 习 的 常 用 算 法 包 括 基 于 约 束 的 算 法 和 基 于 模 型 得 分 的 算 法 等, 并 讨 论 它 们 各 自 的 优 点 与 不 足 王 立 威 北 京 大 学 信 息 学 院 智 能 科 学 系 教 授 分 别 于 1999 年 2002 年 于 清 华 大 学 电 子 工 程 系 获 本 科 和 硕 士 学 位 2005 年 于 北 京 大 学 数 学 学 院 获 博 士 学 位 自 2005 年 起 在 北 京 大 学 信 息 学 院 任 教 他 的 主 要 研 究 兴 趣 为 机 器 学 习 理 论 与 算 法, 对 boosting 主 动 学 习 等 开 展 了 深 入 研 究 在 机 器 学 习 顶 级 会 议 NIPS, COLT, ICML 和 顶 级 期 刊 JMLR, IEEE Trans. PAMI 发 表 论 文 多 篇 2010 年 入 选 AI s 10 to Watch 第 一 讲 : 机 器 翻 译 及 多 语 理 解 主 讲 人 : 张 民, 新 加 坡 信 息 通 信 研 究 所 (I2R) 研 究 员 主 要 内 容 : 实 现 不 同 自 然 语 言 之 间 的 无 障 碍 信 息 交 流 一 直 是 人 类 的 梦 想 随 着 人 类 社 会 步 入 全 球 化 时 代 和 互 联 网 以 及 社 交 网 络 的 迅 猛 发 展, 这 种 需 求 尤 为 迫 切 有 鉴 于 此 需 求, 近 几 年 来, 机 器 翻 译 和 多 语 理 解 技 术 的 研 究 和 产 业 化 越 来 越 成 为 学 术 界 和 产 业 界 的 关 注 热 点 之 一 本 课 程 即 在 这 一 背 景 下, 对 机 器 翻 译 和 多 语 理 解 技 术 进 行 系 统 全 面 的 介 绍, 包 括 其 基 本 概 念 需 要 解 决 的 问 题 研 究 背 景 和 历 史 相 关 学 科 主 要 方 法 最 新 研 究 进 展 下 一 步 发 展 趋 势 和 产 业 化 等 等, 使 学 生 能 够 对 这 个 学 科 的 各 个 方 面 有 较 为 系 统 的 认 识 Dr. Min ZHANG is a research scientist at the Institute for Infocomm Research, Singapore and the Program Investigator of statistical machine translation team at the institute. His research interests include Machine Translation, Information Extraction, Information Retrieval and Machine Learning for Natural Language Processing. He has authored more than 120 papers in leading journals and conferences. He is the vice president of COLIPS, a steering committee member of PACLIC and a member of AFNLP and ACL. He supervises Ph.D students at the National University of Singapore and Harbin Institute of Technology. Dr. Min ZHANG joined the Institute in Dec. 2003. He received his Ph.D. degree from Harbin Institute of Technology in 1997. From Dec. 1997 to Aug. 1999, he worked as a postdoctoral research fellow in Korean Advanced Institute of Science and Technology in Korea. He began his academic and industrial career as a researcher at Lernout & Hauspie Asia Pacific (now Nuance) in Sep. 1999. He joined Infotalk Technology (Singapore) as a researcher in Jan 2001 and became a senior research manager in 2002.
第 三 讲 : 互 联 网 创 新 报 告 1: 社 会 关 系 网 的 文 本 挖 掘 和 应 用 主 讲 人 : 周 明 刘 晓 华 韦 福 如, 微 软 亚 洲 研 究 院 研 究 员 主 要 内 容 : 最 近 几 年, 我 们 看 到 了 研 究 人 员 工 程 师 和 公 司 对 利 用 社 会 网 络 来 进 行 数 据 挖 掘, 商 业 智 能, 搜 索 和 广 告 营 销 的 兴 趣 越 来 越 大 但 是 数 据 的 爆 炸 以 及 社 会 网 络 的 特 殊 的 语 言 表 达 现 象 对 这 些 努 力 构 成 了 巨 大 的 挑 战 使 用 现 有 的 面 向 标 准 书 面 语 言 的 文 本 挖 掘 技 术 不 能 获 得 满 意 的 结 果 本 讲 座 以 推 特 为 例, 将 介 绍 一 组 文 本 挖 掘 技 术 来 从 大 规 模 的 实 时 的 推 特 中 提 取 关 键 的 信 息 来 支 持 后 续 的 更 多 的 在 社 会 网 络 中 进 行 的 数 据 挖 掘 和 搜 索 任 务 具 体 的 讲 座 内 容 将 包 括 推 特 和 微 博 文 本 的 预 处 理 命 名 实 体 的 识 别 和 情 感 分 析 然 后 介 绍 再 次 基 础 上 进 行 的 搜 索 和 文 摘 的 工 作 周 明, 微 软 亚 洲 研 究 院 自 然 语 言 组 主 任, 高 级 研 究 员 1991 年 哈 工 大 博 士 毕 业,1991-1993 年 在 清 华 任 博 士 后, 随 后 任 副 教 授 至 1999 年, 其 间 1996-1999 年 在 日 本 高 电 社 领 导 中 - 日 机 器 翻 译 的 研 发 1999 年 加 入 微 软 研 究 院 任 研 究 员 2001 年 起 任 自 然 语 言 组 主 任 并 曾 于 2004 年 短 期 兼 任 语 音 组 主 任 刘 晓 华, 微 软 研 究 院 自 然 语 言 组 研 究 员 作 为 主 要 研 究 人 员 曾 参 加 微 软 英 库 和 必 应 词 典 的 研 究 工 作 现 从 事 社 会 网 络 的 文 本 挖 掘 和 搜 索 研 究 发 表 ACL EMNLP Coling AAAI IJCAI 文 章 10 余 篇 韦 福 如, 微 软 研 究 院 自 然 语 言 组 副 研 究 员 从 事 社 会 网 络 的 情 感 分 析 摘 要 和 自 然 语 言 问 答 的 研 究 工 作 发 表 ACL SIGIR KDD, Coling AAAI IJCAI 文 章 10 余 篇 报 告 2: 由 文 本 到 图 像 的 变 换 主 讲 人 : 王 欣 靖, 微 软 亚 洲 研 究 院 副 研 究 员 主 要 内 容 : 一 图 胜 过 千 言 万 语 将 文 本 可 视 化, 即 为 一 个 词 赋 予 一 幅 图 像 可 以 让 词 的 意 思 一 目 了 然, 从 而 提 升 用 户 体 验 本 工 作 首 先 展 示 如 何 为 单 个 词 找 出 代 表 性 的 图 像, 并 由 此 推 广 到 大 规 模 可 视 化 互 联 网 上 的 本 体 词 汇 (identity) 王 欣 靖, 于 2005 年 取 得 清 华 大 学 博 士 学 位, 目 前 为 微 软 亚 洲 研 究 院 互 联 网 搜 索 与 挖 掘 组 的 研 究 员, 从 事 大 规 模 网 络 图 像 理 解 方 面 的 研 究 报 告 3: 基 于 知 识 库 的 短 文 本 概 念 化 及 其 应 用 主 讲 人 : 宋 阳 秋, 微 软 亚 洲 研 究 院 副 研 究 员 主 要 内 容 : 在 互 联 网 高 速 发 展 的 时 代, 短 文 本 处 理 技 术 越 来 越 多 地 被 应 用 在 搜 索 广 告 图 像 标 签 和 微 博 等 数 据 当 中 由 于 短 文 本 缺 乏 统 计 信 息, 数 据 相 对 于 长 文 更 加 稀 疏 模 糊 且 有 更 多 的 噪 音 因 此, 我 们 需 要 建 立 知 识 库 来 令 计 算 机 更 好 的 处 理 短 文 本 在 本 工 作 中, 我 们 使 用 一 个 基 于 概 率 建 模 的 知 识 库 Probase Probase 拥 有 数 以 百 万 级 的 概 念 这 些 概 念 是 由 计 算 机 自 动 从 数 十 亿 网 页 中 自 动 抽 取 出 来 在 此 基 础 上, 我 们 提 出 一 个 基 于 概 率 的 框 架, 系 统 地 对 短 文 本 中 的 实 例 和 属 性 进 行 概 念 化 利 用 短 文 本 概 念 化 的 结 果, 我 们 通 过 实 际 数 据 验 证 了 本 方 法 可 以 更 好 地 帮 助 搜 索 广 告 进 行 相 关 度 匹 配 另 外, 通 过 对 查 询 日 志 和 Twitter 数 据 的 聚 类, 我 们 进 一 步 验 证 了 该 方 法 的 有 效 性
宋 阳 秋, 于 2003 年 和 2009 年 分 别 获 得 清 华 大 学 自 动 化 系 本 科 和 博 士 学 位, 并 于 2010 年 加 入 微 软 研 究 方 向 为 机 器 学 习 数 据 挖 掘 信 息 检 索 和 可 视 化 报 告 4: 对 象 级 别 的 互 联 网 搜 索 及 交 互 式 知 识 挖 掘 主 讲 人 : 聂 再 清, 微 软 亚 洲 研 究 院 研 究 员 主 要 内 容 : 互 联 网 中 蕴 含 着 大 量 的 关 于 现 实 世 界 对 象 ( 例 如 人 物 机 构 和 地 点 ) 的 结 构 化 信 息 我 们 在 探 索 一 种 全 新 的 搜 索 体 验 : 抽 取 和 集 成 网 页 上 各 式 各 样 的 对 象 信 息, 让 用 户 能 够 进 行 对 象 级 别 的 信 息 搜 索 和 浏 览 对 象 级 别 搜 索 的 一 个 显 著 优 点 是 可 以 利 用 对 象 的 语 义 信 息, 采 用 直 接 或 者 聚 合 的 结 果 来 响 应 复 杂 查 询 在 本 次 讲 座 中, 我 将 以 人 立 方 和 微 软 学 术 搜 索 为 例 介 绍 互 联 网 对 象 级 别 搜 索 的 用 户 体 验 及 其 关 键 技 术 聂 再 清, 于 2004 年 4 月 加 入 微 软 亚 洲 研 究 院 互 联 网 搜 索 与 挖 掘 组, 负 责 对 象 级 别 互 联 网 搜 索 引 擎 的 研 发 工 作 包 括 数 据 抽 取, 集 成 和 检 索 人 立 方 关 系 搜 索 和 微 软 学 术 搜 索 是 对 象 级 别 搜 索 技 术 的 两 个 成 功 应 用 实 例 聂 再 清 于 1996 和 1998 年 在 清 华 大 学 计 算 机 系 获 学 士 和 硕 士 学 位,2004 获 美 国 亚 利 桑 那 州 立 大 学 计 算 机 科 学 专 业 博 士 学 位 第 四 讲 : 搜 索 引 擎 基 础 和 实 战 主 讲 人 : 兰 东 俊, 微 软 亚 洲 互 联 网 工 程 院 项 目 经 理 主 要 内 容 : 搜 索 引 擎 需 要 服 务 的 网 页 数 量 高 达 百 亿 甚 至 千 亿, 而 从 用 户 拿 到 的 输 入 只 有 搜 索 框 中 的 几 个 查 询 词 从 巨 大 的 结 果 集 中 根 据 很 少 的 输 入 判 断 用 户 的 意 图, 把 和 用 户 意 图 最 相 关 的 内 容 呈 现 给 用 户, 同 时 这 一 切 都 必 须 要 在 几 秒 内 完 成, 其 挑 战 性 和 系 统 复 杂 性 不 难 想 见 在 本 讲 座 中, 我 们 将 介 绍 搜 索 引 擎 的 现 状, 搜 索 引 擎 的 基 本 架 构, 搜 索 引 擎 的 技 术 难 点 及 工 程 实 践 通 过 以 上 的 内 容, 听 众 将 会 了 解 搜 索 引 擎 的 基 本 原 理 常 见 方 法 和 工 程 实 践 兰 东 俊, 微 软 亚 洲 互 联 网 工 程 院 的 项 目 经 理 现 在 微 软 广 告 平 台 的 广 告 相 关 性 团 队 工 作 在 加 入 广 告 团 队 前, 兰 东 俊 在 微 软 必 应 搜 索 引 擎 的 基 础 设 施 团 队 工 作, 管 理 数 万 台 机 器 和 数 百 PB 的 数 据, 为 微 软 在 线 服 务 部 门 提 供 分 布 式 存 储 和 计 算 平 台 加 入 微 软 之 前, 兰 东 俊 是 IBM 中 国 研 究 院 的 资 深 研 究 员 兰 东 俊 毕 业 于 清 华 大 学 电 子 工 程 系 第 五 讲 : 如 何 做 研 究 主 讲 人 : 马 歆 严 峻 段 楠, 微 软 亚 洲 研 究 院 主 要 内 容 : 每 一 位 学 生 在 踏 上 研 究 之 路 时, 都 希 望 能 得 到 来 自 前 辈 或 者 学 长 的 建 议 与 指 导 微 软 亚 洲 研 究 院 的 研 究 员 在 亲 自 指 导 学 生 以 及 自 己 做 研 究 的 过 程 中, 也 总 结 了 一 系 列 如 何 做 研 究 的 经 验 在 这 个 讲 座 中, 几 位 报 告 者 将 为 同 学 们 分 享 自 己 的 研 究 和 成 长 经 历, 包 括 从 认 知 自 己 和 怎 样 在 研 究 中 发 挥 自 己 的 优 势 到 如 何 发 表 第 一 篇 学 术 论 文, 从 做 研 究 的 基 本 功 训 练 到 如 何 选 题 制 定 方 向 和 解 题 马 歆, 微 软 亚 洲 研 究 院 学 术 合 作 部 资 深 经 理 2001 年 加 盟 微 软 亚 洲 研 究 院 现 负 责 制 定 和 开 展 微 软 亚 洲 研 究 院 与 亚 洲 地 区 高 校 学 术 机 构 在 人 才 培 养 与 合 作 的 战 略 和 相 关 项 目, 包 括 微 软 学 者 奖 学 金, 明 日 之 星 实 习 生 项 目, 联 合 培 养 博 士 生 项 目 等 此 外, 还 负 责 微 软 亚 洲 研 究 院 亚 太 区 文 化 遗 产 数 字 化 保 护 研 究 计 划, 与 北 京 故 宫 博 物 院, 台 北 故 宫 博 物 院 敦 煌 研 究 院 等 多 家 文 化 遗 产 单 位 和 博 物 馆 建 立 合 作 研 究 项 目 严 峻, 毕 业 于 北 京 大 学 数 学 系, 获 得 博 士 学 位 研 究 方 向 为 模 式 识 别 和 信 号 处 理 目 前 是 微
软 亚 洲 研 究 院 机 器 学 习 组 研 究 员, 研 究 方 向 为 大 规 模 数 据 挖 掘 机 器 学 习 和 计 算 广 告 学 已 在 SIGKDD SIGIR WWW ICDM 和 TKDE 等 国 际 会 议 发 表 了 50 余 篇 论 文 段 楠,2011 年 博 士 毕 业, 系 天 津 大 学 和 微 软 亚 洲 研 究 院 联 合 培 养 的 第 一 名 博 士 博 士 期 间 在 微 软 亚 洲 研 究 院 从 事 统 计 机 器 翻 译 的 研 究 现 为 微 软 亚 洲 研 究 院 自 然 语 言 计 算 组 博 士 后 研 究 员, 从 事 自 动 问 答 和 搜 索 的 研 究 在 ACL EMNLP COLING 等 自 然 语 言 处 理 会 议 中 发 表 10 余 篇 学 术 论 文 第 六 讲 : 信 息 抽 取 和 问 答 系 统 主 讲 人 : 赵 军, 中 国 科 学 院 自 动 化 研 究 所 研 究 员 主 要 内 容 : 问 答 系 统 被 认 为 是 下 一 代 搜 索 引 擎 的 重 要 形 态, 而 信 息 抽 取 是 支 撑 问 答 系 统 等 互 联 网 应 用 的 关 键 技 术 之 一 本 课 程 将 围 绕 信 息 抽 取 和 问 答 系 统 两 个 研 究 方 向, 系 统 介 绍 其 中 的 基 本 概 念 主 要 方 法 最 新 研 究 进 展 需 要 解 决 的 问 题 和 发 展 趋 势, 使 听 者 能 够 对 信 息 抽 取 和 问 答 系 统 研 究 领 域 的 重 点 问 题 和 主 要 方 法 有 较 为 系 统 的 了 解 赵 军, 研 究 员, 博 士 生 导 师 1998 年 在 清 华 大 学 计 算 机 科 学 与 技 术 系 获 得 博 士 学 位 1998 年 2002 年 在 香 港 科 技 大 学 计 算 机 科 学 系 做 访 问 学 者 2002 年 5 月 至 今 在 中 国 科 学 院 自 动 化 研 究 所 模 式 识 别 国 家 重 点 实 验 室 工 作 研 究 方 向 为 自 然 语 言 处 理 网 络 信 息 抽 取 和 问 答 系 统 等 主 持 多 项 国 家 自 然 科 学 基 金 863 计 划 中 国 出 版 集 团 科 技 项 目 等 的 研 究 工 作 在 ACL SIGIR CIKM IJCAI EMNLP CoNLL 等 顶 级 国 际 会 议 上 发 表 一 系 列 学 术 论 文 主 页 :http://www.nlpr.ia.ac.cn/cip/jzhao.htm 第 七 讲 : 文 本 挖 掘 的 概 率 主 题 模 型 主 讲 人 : 翟 成 祥, 美 国 伊 利 诺 伊 大 学 副 教 授 Abstract:Statistical Topic Models (also known as probabilistic topic models, or just topic models) have recently been successfully applied to many text mining problems. They can be used to naturally model the topics in unstructured/semistructured text collections, and extract various types of topical patterns from text. A great deal of recent work have shown that topic models not only have a solid theoretical foundation, but also offer solutions to many practical text mining tasks. This lecture will systematically review the recent progress in applying statistical topic models to text mining. We will first introduce the basic probabilistic topic models, and then discuss a number of extensions of the basic models and their applications in text mining. In particular, we will discuss in depth how to use topic models for contextual text mining where context variables such as time, location, authors, and sources are considered when analyzing topics in text. Sample results on a wide range of applications such as spatiotemporal topic trend analysis, opinion integration and summarization, and event impact analysis will be presented. Chengxiang Zhai is an Associate Professor of Computer Science at the University of Illinois at Urbana-Champaign, where he also holds a joint appointment at the Institute for Genomic Biology, Statistics, and the Graduate School of Library and Information Science. He received a Ph.D. in Computer Science from Nanjing University in 1990, and a Ph.D. in Language and Information Technologies from Carnegie Mellon University in 2002. He worked at Clairvoyance Corp. as a Research Scientist and a Senior Research Scientist from 1997 to 2000. His research interests include information retrieval, text mining, natural language processing, machine learning, and bioinformatics. He is an Associate Editor of ACM Transactions on Information Systems, and Information Processing and Management, and serves on the editorial board of Information Retrieval Journal. He is a
program co-chair of ACM CIKM 2004, NAACL HLT 2007, and ACM SIGIR 2009. He is an ACM Distinguished Scientist, and received the 2004 Presidential Early Career Award for Scientists and Engineers (PECASE), the ACM SIGIR 2004 Best Paper Award, an Alfred P. Sloan Research Fellowship in 2008, and an IBM Faculty Award in 2009. More details about Dr. ChengXiang Zhai can be found at his personal website http://www.cs.uiuc.edu/homes/czhai/
姓 名 任 职 单 位 职 称 是 否 CCF 会 员 1 手 机 住 宿 2 ( 如 需 安 排 ) 发 票 抬 头 3 发 票 项 目 内 容 4 CCF ADL 报 名 表 自 然 语 言 处 理 与 机 器 学 习 参 加 本 期 讲 习 班 的 目 的 : 会 员 号 性 别 入 住 时 间 : 离 开 时 间 : 单 住 : 合 住 : Emai l 注 册 费 会 议 费 会 务 费 培 训 费 信 息 来 源 : ( 请 注 明 ) CCF 周 刊 CCF 网 页 CCCF 熟 人 介 绍 单 位 通 告 其 它 我 申 请 参 加 本 届 研 究 峰 会 并 承 诺 按 主 办 单 位 的 规 定 参 加 说 明 : 1 会 员 号 : 不 填 写 会 员 号, 按 非 会 员 处 理, 2 仅 需 要 组 织 者 代 位 安 排 住 宿 是, 填 写 安 排 住 宿 一 栏 3 发 票 : 发 票 付 款 单 位 如 空, 则 认 为 同 任 职 单 位 4 发 票 项 目 如 不 选 择, 则 认 为 是 会 议 费 5 对 会 员 优 惠 400 元, 仅 对 开 班 前 三 个 月 前 入 会 者 有 效 如 果 正 在 申 请 入 会, 请 填 写 正 在 办 理, 享 受 200 元 优 惠