基于矩阵分解和矩阵变换的多义词向量研究

Similar documents
[-0.6cm]On Multi-Sense Word Embeddings via Matrix Factorization and Transformation

GOLD(General Ontology for Linguistic Description) (,) (,) (,) () () (,) () (,) (,) (,)

c p.pm

word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

Vol. 36 ( 2016 ) No. 6 J. of Math. (PRC) HS, (, ) :. HS,. HS. : ; HS ; ; Nesterov MR(2010) : 90C05; 65K05 : O221.1 : A : (2016)

恩 典 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 1 欢 迎 持 续 在 门 口 欢 迎 学 生, 聆 听 他 们 分 享 本 周 开 心 或 烦 恼 的 事 预 备 活 动 <10 分 钟 A 猜 猜 是 谁 B 上 帝 的 礼 物 无 孩 子 们 的 儿 时

团 契 就 体 力 来 说, 参 孙 乃 是 地 上 极 强 壮 的 人 ; 但 在 自 制 忠 贞 和 坚 稳 上, 他 却 是 人 间 最 软 弱 的 了 先 祖 与 先 知 第 页 教 室 布 置 见 第 一 课 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动

i


、審計稽察之成果


中篇小说 震东震东 潘 维建 着 看得出来 他要在核桃上雕刻一个寿星老头的形 象 寿星的眉目已经初步显现出来 这种在核桃上雕刻 人物形象的技艺是刘震东早在年轻时候就已经练就的一 手绝活 他非常喜欢这种微雕艺术 从军二十余载 从 未将其丢弃过 闲暇之时 总会拿出刻刀刻上一样什么 东西 可以说 就是这门

3

今 天 會 坐 在 這 裡, 肯 定 是 認 真 的 基 督 徒 不 然, 這 時 候 是 假 日, 為 什 麼 不 選 擇 其 他 方 式, 為 什 麼 不 在 家 裡 輕 輕 鬆 鬆 的? 為 什 麼 不 睡 到 自 然 醒? 和 親 友 一 起 去 郊 遊 逛 街 看 電 影 聊 天? 我 們

“关于北京重点高校在校生回乡就业意愿调查问卷”


报, 现 将 有 关 培 训 具 体 事 宜 补 充 通 知 如 下, 请 各 校 参 训 人 员 做 好 充 分 准 备 一 报 到 及 培 训 时 间 地 点 报 到 时 间 及 地 点 :2015 年 11 月 18 上 午 9:00 11:30; 铁 西 联 邦 大 厦 银 座 11 楼 东

<4D F736F F D20D1A7C9FACAD6B2E1B8C4D7EED6D5A3A8B4F8B1EDB8F1BCD3D2B3C2EBB0E6A3A9372E3239>

桂林市劳动和社会保障局关于

第三章 維修及管理

Microsoft Word 年度选拔硕博连读研究生的通知.doc

14052_公開用.pdf

# 7 % % % < % +!,! %!!

#!! +!,! # &!. / !!, 7!!, & #! % 7! % )

& ( )! +!, # %! ( & &.! / /.

<4D F736F F D20B5F8C4B1A55CAFE0B5FBA6F4ACF6BFFDAAED2E646F63>

Untitled


控 制 评 价 结 果 推 测 未 来 内 部 控 制 的 有 效 性 具 有 一 定 的 风 险 二 内 部 控 制 评 价 结 论 根 据 公 司 财 务 报 告 内 部 控 制 重 大 缺 陷 的 认 定 情 况, 于 内 部 控 制 评 价 报 告 基 准 日, 不 存 在 财 务 报 告

评 标 准 扣.4 全 科 医 学 科.4. 建 立 全 科 医 学 科 作 为 培 训 基 地 的 综 合 医 院 独 立 设 置 全 科 医 学 科, 牵 头 承 担 全 科 住 培, 与 相 关 临 床 轮 转 科 室 密 切 协 同, 指 导 帮 助 基 层 实 践 基 地 加 强 带 教

恩 典 1 * 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生 ; 倾 听 他 们 的 快 乐 或 烦 恼 预 备 活 动 <10 分 钟 A. 顺 境 或 逆 境 B. 平 衡 书 本 赞 美 和 祈 祷 <10 分 钟 课 堂 教 学 概

Microsoft Word - FINAL CHINESE VER- MOH OOB CODE OF PROFESSIONAL CONDUCT _AMENDED VERSION II_ edited

目 录

团 契 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生, 聆 听 他 们 分 享 本 周 开 心 或 烦 恼 的 事 -- 无 预 备 活 动 <10 分 钟 A 味 觉 检 测 赞 美 和 祈 祷 <10 分 钟

第 八 条 凡 在 考 评 过 程 中 提 供 虚 假 信 息 的, 一 经 查 实, 视 情 节 轻 重, 扣 除 该 实 验 室 5~10 分, 并 通 报 批 评 第 九 条 文 科 学 院 没 有 实 验 室 的, 其 学 院 年 度 工 作 目 标 管 理 考 核 中 实 验 室 工 作

服 侍 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 预 备 活 动 赞 美 祈 祷 圣 经 课 程 <10 分 钟 <10 分 钟 <20 分 钟 在 门 口 欢 迎 学 生, 听 他 们 分 享 开 心 或 不 如 意 的 事 A 时 间 表 B 偶 像

团 契 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生, 听 他 们 分 享 开 心 或 不 如 意 的 事 A. 种 子 发 芽 无 使 用 上 星 期 的 物 品 1 预 备 活 动 <10 分 钟 B. 种 子 C. 生 长

窑 缘 愿 窑 意 义 重 大 袁 与 之 相 关 的 表 观 遗 传 学 研 究 主 要 来 自 动 物 实 验 遥 有 学 者 发 现 母 鼠 对 幼 仔 的 舔 舐 和 理 毛 渊 造 蚤 糟 噪 蚤 灶 早 葬 灶 凿 早 则 燥 燥 皂 蚤 灶 早 袁 蕴 郧 冤 及 弓 背 看 护 行

评 估 内 容 与 内 涵 评 估 方 式 评 2.2 管 理 制 度 (10 ) 重 点 制 度 落 实 情 况 4 院 级 和 职 能 部 门 有 明 确 的 会 议 制 度 培 训 制 度 质 量 评 价 制 度 师 资 培 训 制 度 评 价 体 系 等, 并 有 实 施 办 法

恩 典 课 堂 教 学 概 览 1 * 欢 迎 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 在 门 口 欢 迎 孩 子 们, 聆 听 他 们 开 心 或 烦 恼 的 事 情 预 备 活 动 <10 分 钟 A. 婴 孩 时 间 赞 美 和 祈 祷 <10 分 钟 B. 耶 稣

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

Microsoft Word - 2B802內文.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

東區校園中法治教育種子師資教學研習營

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童


* CUSUM EWMA PCA TS79 A DOI /j. issn X Incipient Fault Detection in Papermaking Wa

基于因子分析法对沪深农业类上市公司财务绩效实证分析

一种快速获取领域新词语的新方法

untitled

上海浦~1

K526-ML

<4D F736F F D20B5DAC8FDB7BDBE57C9CFD6A7B8B6D6AEB7A8C2C98696EE7DCCBDBEBF2E646F63>

Turing Machine [1] n n n findmin (a 1, a 2,, a n ) 1. result a 1 2. index 2 3. result min (result, aindex) 4. index index go to step 3 till (in

08_toukei03.dvi


~ ~

Microsoft Word - 季风书讯NO.114.doc

强迫症毁灭天才

Microsoft PowerPoint - FY Q Results.ppt [互換モード]

ebook 132-2

QUESTION BANK UPDATED FOR STUDENT ONLY.xls

恩 典 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 孩 子, 聆 听 他 们 分 享 本 周 开 心 或 烦 恼 的 事 无 预 备 活 动 <10 分 钟 A 十 诫 石 板 B 我 是 谁? 粘 土 牙 签 一 些 名 人 的 照

<332E D373829A451A447A67EB0EAA5C1B0F2A5BBB1D0A87CAC46B5A62E696E6464>

1.5招募说明书(草案)

Corpus Word Parser 183

硕 士 学 位 论 文 论 文 题 目 : 北 岛 诗 歌 创 作 的 双 重 困 境 专 业 名 称 : 中 国 现 当 代 文 学 研 究 方 向 : 中 国 新 诗 研 究 论 文 作 者 : 奚 荣 荣 指 导 老 师 : 姜 玉 琴 2014 年 12 月

~ ~

<4D F736F F D20A661B0ECAE74B2A7AABAA4A4B0EAB941A7F8B0F2C2A6B1D0A87C2E646F63>

2 JCAM. June,2012,Vol. 28,NO. 6 膝 关 节 创 伤 性 滑 膜 炎 是 急 性 创 伤 或 慢 性 劳 损 所 致 的 关 节 滑 膜 的 无 菌 性 炎 症, 发 病 率 达 2% ~ 3% [1], 为 骨 伤 科 临 床 的 常 见 病 多 发 病 近 年 来

PCA+LDA 14 1 PEN mL mL mL 16 DJX-AB DJ X AB DJ2 -YS % PEN

c_onto-intro-0304.doc

22 政 法 论 坛 ( 一 ) 制 约 社 会 保 险 法 的 三 个 重 要 约 束 条 件 B

吴 郁 玲 等 : 农 户 对 宅 基 地 使 用 权 确 权 效 应 的 认 知 研 究 以 武 汉 市 为 例 29 the paper tried to provide a basis to improve the confirmation policy efficiency and to f

校园之星

Corporate Social Responsibility CSR CSR CSR 1 2 ~ CSR 6 CSR 7 CSR 8 CSR 9 10 ~ CSR 14 CSR CSR 2013 A A 23.

标题

Bairoch, ) (Angus Maddison,1926 ) (Bairoch, 1976, 1981), 1960, , 220, 228 ; , 447, 310, 178 (1993) (1988) Peter Brecke (

标题

Microsoft Word - spl105.doc

)

100學年度大學推甄申請面試題庫

Myers Majluf 1984 Lu Putnam R&D R&D R&D R&D

并非没有必要的一些宏观思考

目 錄 12K 第 一 章 總 論 及 憲 法 基 本 原 理 憲 法 前 言 1-1 第 二 章 基 本 人 權 2-1 第 三 章 中 央 政 府 體 制 之 一 ( 總 統 行 政 立 法 ) 3-1 第 四 章 中 央 政 府 體 制 之 二 ( 司 法 考 試 監 察 ) 4-1 第 五

y 1 = 槡 P 1 1h T 1 1f 1 s 1 + 槡 P 1 2g T 1 2 interference 2f 2 s y 2 = 槡 P 2 2h T 2 2f 2 s 2 + 槡 P 2 1g T 2 1 interference 1f 1 s + n n

<4D F736F F D20D6D0CEC4B7A88C57B454CABF8C57CEBBD593CEC4D28EB9A0>

Microsoft Word doc

<4D F736F F F696E74202D20A8E2A9A4AA41B0C8B77EB654A9F6B67DA9F1ABE1A141BB4FC657AAF7BFC4AAF7BFC4AA41B0C8B77EA4A7B0D3BEF7BB50AC44BED420A6BFACB C >

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

目 錄 contents ABC 13 前 言 敗 部 復 活 篇

第十一章 颈部疾病病人的护理

5-25袁宏钧.indd

19 湖 南 新 闻 联 播 湖 南 广 播 电 视 侯 伟 杨 全 阳 黎 欧 阳 琴 20 新 闻 特 别 节 目 生 态 文 明 智 汇 贵 阳 贵 州 广 播 电 视 孙 建 凯 王 亮 张 维 谢 晖 21 四 川 要 闻 四 川 广 播 电 视 周 丹 韦 效 胡 琦 李 宁 22 江

第五章 縮略詞語普及度調查及分析

Microsoft Word - Final Exam Review Packet.docx

1 119 Clark 1951 Martin Harvey a 2003b km 2

國立中山大學學位論文典藏.PDF

Transcription:

hyshi@pku.edu.cn 2018 6 9

Content 1 PCA VS. RPCA

2

2

3 [1] star s1 star s2 star s3 algorithm s1 algorithm s2 stars, movie, song, MVP stars, award, eagle, two-time supergiant, constellation, aurigae hash, algorithms, quick sort, recursive algorithms, optimization, public-key [1] Neelakantan et al.. 2014. Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector Space. In Proc. of EMNLP

4

5

5 WordNet [1] / [2] (hypernymy-hyponymy) animal/ country/ cat/ China/ [1] Miller. 1995. WordNet: a lexical database for English. Communications of the ACM [2]. 1984..

6 1 1 2 2 bank financial institution slope net trap ( ) income

6 1 1 2 2 bank financial institution slope net trap ( ) income score(v w s 1, SynH w i ) = cos(v w s 1, v w s k )ispossiblehypernym(synh w i, v w s 1 ) v w s k NN(v w s 1 )

6 1 1 2 2 bank financial institution slope net trap ( ) income score(v w s 1, SynH w i ) = cos(v w s 1, v w s k )ispossiblehypernym(synh w i, v w s 1 ) v w s k NN(v w s 1 )

7 : P pseudo (v w s 0, v w s 1 ) cos(v s 0, v s 1 ) v s 0 NN(v w s ) v 0 s 1 NN(v w s ) 1 θ θ

7 : P pseudo (v w s 0, v w s 1 ) cos(v s 0, v s 1 ) v s 0 NN(v w s ) v 0 s 1 NN(v w s ) 1 θ θ /

8 (1) (cat s0 -dog s0, cat s1 -dog s1 ) (2) (> 70%)

8 (1) (cat s0 -dog s0, cat s1 -dog s1 ) (2) (> 70%) M = w [ i j (v w i v w j )] v 0 cat v 1 cat v 1 cat v 0 cat..... v 0 cat v 2 cat v 1 cat v 2 cat M

9 d L min M L F subject to L + E = M, rank(l) = d

9 min M L F subject to L + E = M, rank(l) = d d L

9 min M L F subject to L + E = M, rank(l) = d d L (Robust PCA, RPCA) min rank(l) + λ 1 S 0 + λ 2 E F subject to L + E = M, rank(l) = d

10 RPCA [1]

10 RPCA [1] PCA RPCA M (0) = M, t = 0, S = 0 WHILE PCA L (t) + E (t) = M (t) S (t) = E (t) S = S + S (t) M (t+1) = M (t) S (t) t = t + 1 return L (t), S, E (t) M (t) L (t) [2] [1] Wright et al.. 2009. Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Matrices via Convex Optimization. In Proc. NIPS [2]. 2010..

11 T min L(T) = m i=1 1 2 ( Tvwi s i,0 (vwi s i,0 + v wi 2 s i,1 ) 2 + Tv wi s i,1 (vwi s i,0 + v wi 2 s i,1 ) 2 )

11 T min L(T) = m i=1 1 2 ( Tvwi s i,0 (vwi s i,0 + v wi 2 s i,1 ) 2 + Tv wi s i,1 (vwi s i,0 + v wi 2 s i,1 ) 2 ) U R n T { Tα = 0, α U Tα = α α U T

11 T min L(T) = m i=1 1 2 ( Tvwi s i,0 (vwi s i,0 + v wi 2 s i,1 ) 2 + Tv wi s i,1 (vwi s i,0 + v wi 2 s i,1 ) 2 ) U R n T { Tα = 0, α U Tα = α α U T T Ṽ = {ṽ w s = Tv w s v w s V}.

12 WS-353 SCWS [1] 64.2 26.1 skip-gram (MSSG, 300D) [2] 70.9 57.3 skip-gram (NP-MSSG, 300D) [2] 69.1 59.8 NP-MSSG + 68.8 62.2 NP-MSSG + 69.2 63.7 NP-MSSG + (PCA) 69.2 65.3 NP-MSSG + (RPCA) 69.2 65.4 [3] 69.5 62.4 MUSE [4] 69.4 67.9 [1] Huang et al.. 2012. Improving word representations via global context and multiple word prototypes. In Proc. of ACL [2] Neelakantan et al.. 2014. Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector Space. In Proc. of EMNLP [3] Li and Jurafsky. 2015. Do Multi-Sense Embeddings Improve Natural Language Understanding?. In Proc. of EMNLP [4] Lee and Chen. 2017. MUSE: Modularizing Unsupervised Sense Embeddings. In Proc. of EMNLP

13 SentEval [1] (SUBJ), (TREC) (MSRP) BoW SUBJ TREC MSRP (NP-MSSG) [2] 91.0 78.4 70.0 + 91.2 83.2 70.6 + 91.0 84.2 70.0 + (RPCA) 92.3 85.4 71.0 [1] Conneau and Kiela. 2018. SentEval: An Evaluation Toolkit for Universal Sentence Representations. In Proc. of LREC [2] Neelakantan et al.. 2014. Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector Space. In Proc. of EMNLP

PCA VS. RPCA: WordNet Synset 14 PCA -L RPCA S 2 WordNet rank(l) = 1, 2, 3, 5-0.5 RPCA PCA 0.5 RPCA PCA 0.4 0.4 0.3 2000 3000 4000 5000 0.3 2000 3000 4000 5000 0.5 RPCA PCA 0.5 RPCA PCA 0.4 0.4 0.3 2000 3000 4000 5000 0.3 2000 3000 4000 5000

PCA VS. RPCA: 15 rank(l) = 3 PCA RPCA RPCA PCA # 1 after 1,2, eventually 0,1, whilst 0,1, again 1,2, finally 1,2 2 although 1,2, well 2,3, initially 1,2, more 1,4, both 0,2 3 Brian 1,2, February 0,2, Daniel 1,2, September 2,7, Frank 0,2 1 income 2,4, campaigns 1,5, age 6,7, development 4,5, goals 2,6 2 Berlin 0,6, Martin 3,4, Greek 0,3, Jan 0,4/0,6, name 1,3 3 quarterback 3,9, playoff 3,9 NBA 0,1, Houston 1,3, mayor 0,6 RPCA PCA

16