PowerPoint 演示文稿

Similar documents
word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

PowerPoint 演示文稿

基于矩阵分解和矩阵变换的多义词向量研究

acl2017_linguistically-regularized-lstm-MinlieHuang

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

untitled

专题 第 11 卷 第 3 期 2015 年 3 月 从 结 构 上 说 深 层 神 经 网 逐层学习的无监督预处理可以为 络就是前向多层神经网络 是 下一步有监督的反向传播提供一 由沃伦 麦卡洛克 (Warren Mc- 个比较好的初始参数 自然语言处理中的 深度学习 Culloch) 在 194

( 一 ) 實 習 的 時 候 就 和 讀 書 會 的 同 學 一 起 把 陳 嘉 陽 紮 實 地 讀 過 一 遍 了, 也 因 此 在 考 完 教 檢 之 後, 我 們 只 有 把 不 熟 或 是 常 考 的 章 節 再 導 讀 一 次 ( 例 如 : 統 計 行 政 法 規 ), 主 力 則 是

双 语 教 学 之 中 综 上 所 述, 科 大 讯 飞 畅 言 交 互 式 多 媒 体 教 学 系 统, 围 绕 语 音 核 心 技 术 的 研 究 与 创 新, 取 得 了 一 系 列 自 主 产 权 并 达 到 国 际 领 先 水 平 的 技 术 成 果, 同 时 获 得 发 明 专 利 3

Natural Neural Networks

春 雷 新 雨 看 潮 生 2015 年 计 算 机 系 大 众 创 业 万 众 创 新 校 友 论 坛 创 业 新 锐 奖 颁 奖 孙 茂 松 为 罗 建 北 老 师 颁 发 创 业 伯 乐 奖 杨 士 强 为 本 科 生 超 新 星 工 作 室 颁 发 未 来 创 新 之 星 奖 杨 士 强 为


<4D F736F F D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

Microsoft Word - A _ doc

<4D F736F F D C33A3BAD7D4C8BBD3EFD1D4B4A6C0EDD3EBBBFAC6F7D1A7CFB A3A8D3E0A3A92E646F63>

<4D F736F F F696E74202D20312EB9FEB6FBB1F5B9A4D2B5B4F3D1A7D5E7C1BCA3BAC3E6CFF2D1D0BEBFC9FAB8B4CAD4B5C4BDE1B9B9BBAFC3E6CAD4BFBCBACBCCBDCBF7D3EBCAB5BCF92E BBCE6C8DDC4A3CABD5D>

( 70 ) B,,,, B,,,, : (5) ( ),, A, : (6) ( ) (7), ( ) (8),, ( ) (9), ( ) (6), (7), (8), (9) B,,,, : (10),, ( ) (11)! ( ) 1. 2 A A,, : (12), ( )

5B_sasaki.pdf

从零构建支持向量机(SVM)

Microsoft Word - 05洪淑苓--論黃得時對民間文學與古蹟文化之研究與貢獻.doc

Microsoft Word 谢雯雯.doc

上海市本科教学质量年度报告

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

g 100mv /g 0. 5 ~ 5kHz 1 YSV8116 DASP 1 N 2. 2 [ M] { x } + [ C] { x } + [ K]{ x } = { f t } 1 M C K 3 M C K f t x t 1 [ H( ω )] = - ω 2

44 生 活 與 生 涯 規 劃 : 彩 繪 生 命 的 藍 圖 : 生 涯 規 劃 :something you should know 學 習 規 劃 與 生 涯 發 展 192.1/1133/ 給 青 年

广 类 型 对 定 位 在 应 用 型 地 方 本 科 院 校 发 展 具 有 促 进 作 用 统 一 的 任 职 条 件 能 确 保 某 一 职 称 具 有 同 一 起 点 的 质 量, 但 是 较 难 满 足 高 校 的 多 样 化 和 高 校 教 师 多 样 化 的 需 求, 可 能 形 成

Microsoft Word 定版

Microsoft Word - CMRO ??????????????? Luxiaoyan

Microsoft Word - 附章.doc

Microsoft Word - 附章.doc

高中英文科教師甄試心得

标题

然 而 打 开 目 前 市 场 上 流 行 的 任 意 一 款 智 能 输 入 法, 上 面 提 到 的 词 都 会 被 轻 轻 松 松 的 输 出 来 ; 不 仅 如 此, 所 有 的 智 能 输 入 法 都 支 持 用 户 短 句 级 别 以 及 句 子 级 别 的 输 入 方 法, 并 且 能

营养学于一身的著作 也是中国古代一部重要的药膳专书 书中许多内容对今天人们的饮食 营养 食疗食补 养生避忌等有着指导性意义和现实价值 本书问世之后进献元朝文宗皇帝 文宗批示 命中院使臣拜住刻梓而广传之 兹举也 意欲推一人之安而使天下之人举安 推 ①忽思慧又作和斯辉 一人之寿而使天下之人皆寿 恩泽之厚

目 錄 壹 青 輔 會 結 案 附 件 貳 活 動 計 劃 書 參 執 行 內 容 一 教 學 內 容 二 與 當 地 教 師 教 學 交 流 三 服 務 執 行 進 度 肆 執 行 成 效 一 教 學 課 程 二 與 當 地 教 師 教 學 交 流 三 服 務 滿 意 度 調 查 伍 服 務 檢

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

PowerPoint 演示文稿

1 SIGMA Lab Sydney IntelliGent MultimediA Laboratory Electrical and Information Engineering department EIE Ph.D. M.Phil. 1.QS (Associate Profess

國光藝訊-封面93S

35-55

课题调查对象:

214 年 第 3 期 郑 丹 青 等 : 高 职 学 生 个 性 特 征 及 职 业 能 力 调 查 与 分 析 61 一 问 题 的 提 出 随 着 高 等 教 育 大 众 化, 高 职 院 校 的 学 生 来 源 出 现 多 样 化, 学 生 的 基 本 素 质 和 职 业 能 力 参 差 不

第一章

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

Microsoft Word - 19王建华.doc

. 1 4 Web PAD

Microsoft Word - Final Exam Review Packet.docx

198 天 津 体 育 学 院 学 报 谁 来 教, 怎 么 教 的 问 题 长 时 间 悬 而 未 决, 或 泛 泛 而 谈, 或 知 行 不 一, 以 至 于 使 中 小 学 武 术 教 育 积 重 难 返, 停 滞 不 前 因 此, 切 实 推 进 中 小 学 武 术 教 育 的 发 展 要

2015 年 第 24 卷 第 11 期 计 算 机 系 统 应 用 历 的 主 体 部 分 多 以 非 结 构 化 的 文 本 形 式 存 储, 很 多 研 究 只 能 基 于 有 限 的 结 构 化 数 据 进 行 [4,5], 无 法 满 足 临

BISQ理论模型与声波测井响应研究

successful and it testified the validity of the designing and construction of the excavation engineering in soft soil. Key words subway tunnel

Microsoft Word 任 辉_new_.doc

课程12-7.FIT)

(2008) 主 张 教 师 在 课 文 教 学 中 应 让 学 生 有 意 识 地 注 意 语 块, 并 指 出 语 块 教 学 对 大 学 生 的 英 语 写 作 能 力 有 着 重 要 的 意 义 于 秀 莲 (2008) 以 大 学 生 为 受 试 对 象, 在 对 不 同 学 生 分 别

致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

Microsoft Word - 第四組心得.doc


85% NCEP CFS 10 CFS CFS BP BP BP ~ 15 d CFS BP r - 1 r CFS 2. 1 CFS 10% 50% 3 d CFS Cli

1 引言

Vol. 15 No. 1 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb O21 A

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

編 者 的 話 文 字 / KK 人 天 生 便 具 有 好 奇 心, 想 對 週 遭 事 物 更 加 瞭 解, 以 滿 足 自 己 的 求 知 渴 望 孩 子 可 以 透 過 父 母 的 敘 說 表 演, 激 發 想 像 創 造 邏 輯 推 理 判 斷 等 能 力 父 母 最 能 夠 了 解 子

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 百 善 孝 為 先? 奉 養 父 母 與 接 受 子 女 奉 養 之 態 度 及 影 響 因 素 : 跨 時 趨 勢 分 析 Changes in attitude toward adult children's responsibilit

泰迪杯全国数据挖掘挑战赛 OCR (CNN) OCR() CNN % 92.1% 15% 90%. Viterbi. OCR..,,,,,

m m m ~ mm

39 屆 畢 業 典 禮

United Nations ~ ~ % 2010

中国媒体发展研究报告

言语理解中的知觉表征与命题表征*

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai ATR-SLT (Advanced Telcommunications Research Institute Internat

幻灯片 1

、審計稽察之成果

Untitled

一段“蝶蝶”上休的生命教育故事

/ / / Kornai1993 hierarchy Weber1958 Williamson 1979 chain of command Downs 1994 Tullock 1992 Lazear1998 Li & Zhou promoti

PowerPoint Presentation

01政治.doc

因 這 將 成 為 你 一 生 中 最 珍 貴 也 最 難 得 的 資 產 在 本 系 徐 主 任 積 極 努 力 安 排 之 下, 東 海 大 學 國 貿 系 與 南 京 大 學 國 貿 系 簽 定 交 換 計 畫, 系 上 開 放 四 個 名 額 到 南 京 大 學 進 行 為 期 一 學 期



南華大學數位論文

Microsoft Word - 生活禮儀柯友惠981

高雄市左營國民小學八十九學年度第一學期一年級總體課程教學進度表

标题

南華大學數位論文

22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research IF: Interchange Format [12] C-STAR IF 1. IF IF [14

恩 典 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 1 欢 迎 持 续 在 门 口 欢 迎 学 生, 聆 听 他 们 分 享 本 周 开 心 或 烦 恼 的 事 预 备 活 动 <10 分 钟 A 猜 猜 是 谁 B 上 帝 的 礼 物 无 孩 子 们 的 儿 时

团 契 就 体 力 来 说, 参 孙 乃 是 地 上 极 强 壮 的 人 ; 但 在 自 制 忠 贞 和 坚 稳 上, 他 却 是 人 间 最 软 弱 的 了 先 祖 与 先 知 第 页 教 室 布 置 见 第 一 课 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动

微博「吐槽」


14 17.,., Fig. 1 Bougeur gravity map of research region 2 Fig. 2 Magnetic map of research region

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

F3

Wuhan Textile University M. A. S Dissertation Emotional Design of Home Textile Based on the Chinese Traditional Culture Wedding Bedding for Example Ca

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

汉语口语考试

PowerPoint Presentation

我的野蛮女友(网络小说)中文版

文章编号 : 结合卷积神经网络和词语情感序列特征的中文情感分析 陈钊 1, 徐睿峰 1*, 桂林 1, 陆勤 2 (1. 哈尔滨工业大学深圳研究生院计算机科学与技术学院, 广东省深圳市 ; 2. 香港理工大学电子计算学系, 香港特别行政区 ) 摘要 : 目前基于词嵌入的卷积神经网络文本分

Transcription:

自然语言处理中的深度学习 从词语表示到句子表示 张家俊中国科学院自动化研究所 www.nlpr.ia.ac.cn/cip/jjzhang.htm jjzhang@nlpr.ia.ac.cn

自然语言处理 - 搜索引擎 2

自然语言处理 - 机器翻译 3

自然语言处理 - 自动摘要 4

自然语言处理 - 主题分析 5

自然语言处理 - 文本分类 6

自然语言处理 - 问答聊天 7

研究任务 - 词法分析 从南京站到南理工怎么走? 从南京站到南理工怎么走? 从南京站到南理工怎么走? 地名 机构名 8

研究任务 9

研究任务 - 句法分析 1

研究任务 - 语义分析 ( 北京, 中国, 首都 ) 实体实体关系 11

研究任务 - 篇章分析 1 识别篇章单元 : 识别并表示基本篇章单元 (EDU) 2 计算篇章单元间的关系 : 计算篇章单元之间的层次 关系与篇章关系 12

自然语言处理 输入文本 处理对象 词法分析 词语 句法分析 短语 语义分析 句子 篇章分析 段落 / 篇章 13

自然语言处理 - 最基础问题 输入文本 处理对象 词法分析 词语 句法分析 语义分析 短语 句子 如何表示? 篇章分析 段落 / 篇章 14

传统离散符号表示方法 典型方法 : 离散符号 ( 字符串 ) 该课程很枯燥, 大家觉得很无聊 w = 该 w 1 = 课程 w 2 = 很 w 3 = 枯燥 w 4 =, w 5 = 大家 w 6 = 觉得 w 7 = 很 w 8 = 无聊 w 9 = 等价表示方法 :one-hot 表示法 V 所有词按照出现的顺序排序 每个词语将对应唯一的下标 枯燥 1 无聊 1 15

词语 - 离散符号表示 问题 枯燥 1 无聊 1 枯燥 无聊 1 1 = 任意两个词之间的相似度都为! 16

词语 - 实数向量表示 枯燥 无聊 这个那个这些 单调枯燥无聊.24.15.42.51.21.25.12.39.46.26 今天明天昨天 一月三月五月 低维 稠密的连续实数空间 17

词向量 L = 枯燥 V D 单调无聊 1 L R D V 通常称为 look-up table 我们可以对 L 右乘一个词的 one-hot 表示 e 得到该词的低维 稠密的实数向量表达 : x = Le 18

词向量 L = V D L R D V 枯燥 单调 无聊 词表规模 V 和词向量维度 D 如何确定 V 的确定 :1, 训练数据中所有词 ;2, 频率高于某个阈值的所有词 ;3, 前 V 个频率最高的词 D 的确定 : 超参数, 人工设定, 一般从几十到几百 19

词向量 L = V D L R D V 枯燥 单调 无聊 如何学习 L 通常先随机初始化, 然后通过目标函数优化词的向量表达 (e.g. 最大化语言模型似然度 ) 2

自然语言处理常用的几种网络 前馈神经网络 循环神经网络 ( 递归 ) 自编码器 递归神经网络 卷积神经网络 21

前馈神经网络 x 1 f 2 f 3 W 1 W 2 W 3 f 4 x 2 h w,b (x) x 3 +1 +1 +1 输入层隐藏层输出层 22

循环神经网络 w t+1 U h t+1 W w t h t 1 U W h t V y t h t = UL w t + Wh t 1 p y t = ey t e y i i 23

自编码器 重构 x 输出 y 输入 x W 2 W 1 W 1, W 2 = argmin 1 2 x x 2 24

递归自编码器 每一层利用相同的自编码器 E Rec = 1 2 x 1, x 2 x 1 x 2 2 x 1 x 2 RAE RAE x 1 x 2 x 3 25

递归神经网络 label y 3 =f(w (3) [y 2 ; x 4 ]+b (3) ) label y 2 =f(w (2) [y 1 ; x 3 ]+b (2) ) label y 1 =f(w (1) [x 1 ; x 2 ]+b (1) ) x 1 x 2 x 3 x 4 26

变长句子 e 卷积神经网络 k 卷积 L 最大池化 定长输出 O e L 27

词向量表示 L = V D L R D V 单调 枯燥无聊 训练准则 : You shall know a word by the company it keeps (J. R. Firth 1957) 28

词向量表示 - 语言模型的副产品 训练准则 : You shall know a word by the company it keeps (J. R. Firth 1957) P w 1 w 2 w t 1 w n n = P w t w t 1 w t n+1 t=1 29

前馈神经网络 P w t w t 1 w t n+1 = ey w t e y i i θ θ + logp θ y = Utanh Hx + d + Wx + b L L L x = L w t 1, L w t n+1 L L [Bengio et al., 23] 3

前馈神经网络 Input Window Text the few supporters of Lookup Table 将每个词通过词向量矩阵 L 映射为低维实数向量 of (.23,.15,.8,.31,..,.42) Linear concatenate 拼接所有词的向量, 形成一个向量 Tanh 隐藏层 : 线性映射 + 非线性变换 Linear Softmax 输出层 : Softmax Prob 31

Input Window Input Window Text the supporters of Text the supporters of Lookup Table Lookup Table LT w D LT w D concatenate SUM Linear M 1 Tanh H VS. Tanh H D Linear Linear M 2 M 2 V V Softmax Softmax Prob Prob V V 32

Google s Word2Vec CBOW: Continuous Bag-of-Words 词序不影响预测 Input Window Text Lookup Table the supporters of LT w D SUM Tanh D Linear M 2 V Softmax Prob V 33

词向量分布 在低维 稠密的实数向量空间中, 相似的词聚集在一起, 在相同 34 的历史上下文中具有相似的概率分布!

词向量的优化 - 一词多义问题 星体 star 2 明星 1 1 2 35

词向量的优化 - 一词多义问题 在词语相似度实验上取得最好效果! [Hu et al., 216] 36

自然语言处理 - 最基础问题 输入文本 处理对象 词法分析 词语 句法分析 语义分析 短语 句子 如何表示? 篇章分析 段落 / 篇章 37

短语向量 - 无监督递归自编码器 目标函数 : 最小化所有节点的重构误差 E total = E Rec_node node RAE RAE 只能学到一部分短语的句法信息,, 但无法获得正确的语义 RAE 法国和俄罗斯的 38

短语向量 - 无监督递归自编码器 理想方法 : 有标注数据 但是, 现实中不存在正确标注的短语向量 监督学习 法国和俄罗斯 39

短语向量 - 双语约束的递归自编码器 假设 短语与其翻译具有相同的语义向量表示 目标函数 最小化短语翻译对间的语义表示误差 模型 Pre-training: 无监督递归自编码器学习短语初始表示 Fine-tuning: 相互监督学习, 优化短语向量表示 4

短语向量 - 双语约束的递归自编码器 r s = argmin 1 2 f r s r t 2 r t = argmin 1 2 f r t r s 2 源语言短语向量表示 r s 目标语言短语向量表示 r t 法国和俄罗斯 France and Russia 41

短语向量 - 双语约束的递归自编码器 目标函数 正则化项 重构误差 J = E S, T; θ + 1 2 λ 2 双语语义误差 E S, T; θ = αe rec S, T; θ + 1 α E regression S, T; θ E rec S, T; θ =E rec S; θ + E rec T; θ E regression S, T; θ = E regression S T, θ + E regression T S, θ E regression S T, θ = s S 1 2 f v 2 s_root v t_root 42

短语向量 - 双语约束的递归自编码器 相似短语 : 相似短语 : 相似短语 : do not agree will definitely reject will never accept abstract meaning real meaning intrinsic logic what is your opinion what do you think about how do you view those [Zhang et al., 214] 43

短语向量应用 短语相似度计算 句法分析 情感分析 统计机器翻译 44

情感分析 任务定义 This film is not very good. 45

情感分析 将词 短语与句子利用递归神经网络表示为连续向量, 从而预测词 短语与句子的情感极性 46

情感分析 [Socher et al., 211] 47

跨语言情感分析 This film is not very good. 这部手机不是很好. 48

跨语言情感分析 49

跨语言情感分析 [Jain and Batra, 215] 5

自然语言处理 - 最基础问题 输入文本 处理对象 词法分析 词语 句法分析 语义分析 短语 句子 如何表示? 篇章分析 段落 / 篇章 51

变长句子 e 卷积神经网络 k 卷积 L 最大池化 定长输出 O e L 52

sentence f sentence e 双语约束的 CNN This film is not very good. Shared Space O f O e 这部电影不是很好. 53

sentence f sentence e 基于语块划分的 CNN Shared Space O f O e 54

sentence f sentence e Max-Margin Training Shared Space O f O e dis f, e, Θ 55

sentence f sentence e* Max-Margin Training Shared Space O f O e dis f, e, Θ [Zhang et al., 215] 56

问题与思考 前述方法需要双语对照的训练数据 我们能否可以由词语表示直接组合为句子表示? 我们能否借鉴人类阅读的注意机制对句子 表示进行建模? 57

基于人类注意力指导的句子表示 自动问答文本摘要机器翻译 应用 句子表示 组合函数 : Addition / Multiplication / RNN 词向量 the two young sea-lions 离散符号表示 58

人的注意机制 The Dunee human reading time corpus Reading time/word the two young Sealions took RTfpass 27.2 138.7 155.5 314.8 169.3 RTgopast 27.2 138.7 178.4 426.1 18.9 RTrb 27.2 138.7 155.5 339.2 169.3 Surprisal POS tag CCG supertag Word length Word frequency 59

人的注意机制 POS 向量 / CCG 向量 / Surprisal 组合函数 : Addition / Multiplication / RNN 词向量 attention model the two young sea-lions 6

人的注意机制 61

人的注意机制 Surprisal/POS/ CCG 三种方法关注度最低和最高的五个词 62

人的注意机制 Surprisal/POS/ CCG 三种方法与人注意机制的相关程度 [Wang et al., 216] 63

总结 输入文本 处理对象 词法分析 词语 句法分析 短语 语义分析 句子 篇章分析 段落 / 篇章 64

参考文献 1, Bengio, Y.; Ducharme, R.; Vincent, P.; and Jauvin, C. 23. A neural probabilistic language model. Journal of Machine Learning Research 3:1137 1155. 2, Socher, R.; Pennington, J.; Huang, E. H.; Ng, A. Y.; and Manning, C. D. 211. Semisupervised recursive autoencoders for predicting sentiment distributions. In Proc. of EMNLP, 151 161. 3, Socher, R.; Perelygin, A.; Wu, J. Y.; Chuang, J.; Manning, C. D.; Ng, A. Y.; and Potts, C. 213. Recursive deep models for semantic compositionality over a sentiment treebank. In Proc. of EMNLP 213. 4, Collobert, R., and Weston, J. 28. A unified architecture for natural language processing: Deep neural networks with multitask learning. In Proc. of ICML, 16 167. 5, Mikolov, T.; Karafiat, M.; Burget, L.; Cernocky, J.; and Khudanpur, S. 21. Recurrent neural network based language model. In INTERSPEECH, 145 148. 6, Mikolov, T.; Sutskever, I.; Chen, K.; Corrado, G.; and Dean, J. 213. Distributed representations of words and phrases and their compositionality. In Proc. of NIPS. 7, Devlin J., Zbib R., Huang Z., Lamar T., Schwartz R., and Makhoul J. 214. Fast and robust neural network joint models for statistical machine translation. In Proc. of ACL, 214. 8. Sarthak Jain and Shashank Batra. 215. Cross-Lingual Sentiment Analysis using modified BRAE. In Proc. of EMNLP 215. 65

参考文献 9. Wenpeng Hu, Jiajun Zhang and Nan Zheng. Different Contexts Lead to Different Word Embeddings. In Proc. of COLING 216. 1. Shaonan Wang, Jiajun Zhang and Chengqing Zong. Learning Sentence Representation with Guidance of Human Attention. https://arxiv.org/pdf/169.9189.pdf. 11, Zhang, J.; Liu, S.; Li, M.; Zhou, M.; and Zong, C. 214. Bilingually-constrained phrase embeddings for machine translation. In Proc. of ACL. 12, Zhang, J.; Zhang, D.; and Hao, J. 215. Local Translation Prediction with Global Sentence Representation. In Proc. of IJCAI. 66

谢谢! Q&A