一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

Similar documents
word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

JAIST Reposi Title WWW における関連リンク集の自動生成 Author(s) 田村, 雅樹 Citation Issue Date Type Thesis or Dissertation Text version author U

Improving the Effectiveness of the Training of Civil Service by Applying Learning Science and Technology: The Case Study of the National Academy of Ci

标题

IT ebay PayPal B2B B2C ebay ebay Paypal

2015 年 第 24 卷 第 11 期 计 算 机 系 统 应 用 历 的 主 体 部 分 多 以 非 结 构 化 的 文 本 形 式 存 储, 很 多 研 究 只 能 基 于 有 限 的 结 构 化 数 据 进 行 [4,5], 无 法 满 足 临

Microsoft Word - sbs.doc

1 引言

Microsoft Word - A doc

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

Shanghai International Studies University THE STUDY AND PRACTICE OF SITUATIONAL LANGUAGE TEACHING OF ADVERB AT BEGINNING AND INTERMEDIATE LEVEL A Thes

Microsoft Word 定版

Microsoft Word - AQSI doc

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

g 100mv /g 0. 5 ~ 5kHz 1 YSV8116 DASP 1 N 2. 2 [ M] { x } + [ C] { x } + [ K]{ x } = { f t } 1 M C K 3 M C K f t x t 1 [ H( ω )] = - ω 2

財團法人張思恒文教基金會

國家圖書館典藏電子全文

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

附3

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

優 秀 的 構 圖 設 計 可 以 引 起 眾 的 注 意, 書 籍 封 面 的 構 圖 影 響 消 費 者 的 購 買 意 願 海 報 設 計 的 構 圖 影 響 的 傳 達 效 益 照 片 的 構 圖 影 響 美 感 的 表 現 與 傳 遞 經 典 名 作 在 構 圖 上 皆 有 細 膩 的 安

室内设计2015年第4期.indd

/3 CAD JPG GIS CAD GIS GIS 1 a CAD CAD CAD GIS GIS ArcGIS 9. x 10 1 b 1112 CAD GIS 1 c R2VArcscan CAD MapGIS CAD 1 d CAD U

untitled

2011 餐 年 旅 教 育 創 新 發 展 學 術 研 討 會 論 文 集 To Discuss the Implementation Status of the 99 Vocational Hospitality Programme Group -By C School for Example

1對外華語文詞彙教學的策略研究_第三次印).doc

标题

~ Capability Maturity Model Integration, CMMI CMMI

在 培 养 职 前 卓 越 化 学 教 师 的 院 校, 会 编 一 本 过 去 称 作 化 学 教 学 论 实 验, 现 在 拟 为 卓 越 化 学 教 师 教 育 实 验 教 学 研 究 的 教 材 各 院 校 对 这 门 课 程 所 给 的 学 时 不 太 一 样, 但 都 是 围 绕 实 验

66 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract This study aimed to analyze the implementing outcomes of ability grouping practice for freshman English at a u

cm /s c d 1 /40 1 /4 1 / / / /m /Hz /kn / kn m ~

untitled

% 30% % % % %

58 特 殊 教 育 與 復 健 學 報 壹 研 究 動 機 與 背 景 教 育 成 敗, 繫 於 師 資 之 良 窳 教 育 部 於 2010 年 8 月 召 開 第 八 次 全 國 教 育 會 議 中, 師 資 培 育 與 專 業 發 展 為 一 項 重 要 的 討 論 議 題, 其 中 研 修

附件4

Microsoft Word - 专论综述1.doc

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

報 告 議 員, 本 局 對 臺 北 市 列 管 的 地 下 加 油 站, 大 部 分 都 已 取 締 完 畢 目 前 只 剩 下 1 處, 我 們 還 在 持 續 觀 察 其 是 否 有 復 業 的 跡 象 臺 北 市 的 地 下 加 油 站 只 剩 下 1 處 而 已? 王 科 長 三 中 :

Fig. 1 1 The sketch for forced lead shear damper mm 45 mm 4 mm 200 mm 25 mm 2 mm mm Table 2 The energy dissip

Microsoft Word - 1-編者的話

214 年 第 3 期 郑 丹 青 等 : 高 职 学 生 个 性 特 征 及 职 业 能 力 调 查 与 分 析 61 一 问 题 的 提 出 随 着 高 等 教 育 大 众 化, 高 职 院 校 的 学 生 来 源 出 现 多 样 化, 学 生 的 基 本 素 质 和 职 业 能 力 参 差 不

(1) ( ) : (3), (12) (7) (10)

交流活动

44(1) (1) (4) (4) 63-88TSSCI Liu, W. Y., & Teele S. (2009). A study on the intelligence profile

然 而 打 开 目 前 市 场 上 流 行 的 任 意 一 款 智 能 输 入 法, 上 面 提 到 的 词 都 会 被 轻 轻 松 松 的 输 出 来 ; 不 仅 如 此, 所 有 的 智 能 输 入 法 都 支 持 用 户 短 句 级 别 以 及 句 子 级 别 的 输 入 方 法, 并 且 能

Microsoft Word - 01李惠玲ok.doc

Mechanical Science and Technology for Aerospace Engineering October Vol No. 10 Web SaaS B /S Web2. 0 Web2. 0 TP315 A

untitled

Microsoft Word doc

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 5 Oct /35 TU3521 P315.

T K mm mm Q345B 600 mm 200 mm 50 mm 600 mm 300 mm 50 mm 2 K ~ 0. 3 mm 13 ~ 15 mm Q345B 25

从调查统计( 表 1) 可以看出 工科学生英语学习关注目标在不同阶段存在较大差异 外在目标主要关注就业和专业发 展 尤其毕业后认为英语学习的目标应该为专业发展的达到了 90% ; 内在目标学生主要关注的是拓展知识和跨文化认知 且 在校生对内在目标的关注远低于毕业生 调查 2 语言技能 我们对南京工程

国土技術政策総合研究所資料

1.2 资 金 的 管 理 1.1 权 利 义 务 来 源 MOU 1.3 数 据 的 使 用 和 保 护 2 国 际 空 间 站 资 源 分 配 方 案 54

raw corpus a 129

第一章

8 DEA min θ - ε( ^e T S - + e T S ) [ + ] GDP n X 4 j λ j + S - = θx 0 j = 1 n Y j λ j - S + = Y 0 j = 1 5 λ J 0 j = 1 n S - 0 S + 0 ^e = ( 1 1

关于2007年硕士研究生培养方案修订几点要求的说明


一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 研 究 方 向 数 据 处 理 近 三 年 来

Maup re,,,,,, ;,,,,,,,,,, PC 1985 Cognac,, 80, [ 526 ], 420m 160m [ 728 ], PC,,,,,,,,, , [ 3 ] 3008mm, 488mm, 222mm, ( ) 2880mm , 4914, 6

国有大型能源企业财务风险内部控制研究

Theoretical Discussion / 理 论 研 讨 / 并 为 其 选 择 适 当 的 工 种 和 岗 位 省 自 治 区 直 辖 市 人 民 政 府 可 以 根 据 实 际 情 况 规 定 具 体 比 例 2008 年 4 月 24 日, 第 十 一 届 全 国 人 民 代 表 大

untitled

Microsoft Word - chnInfoPaper6

(Pattern Recognition) 1 1. CCD

2005硕士论文模版

Your Paper's Title Starts Here: Please Center use Helvetica (Arial) 14

Microsoft Word - A _ doc


标题

F4

532

陶艳.doc

. 3. MOOC 2006 MOOC Automated Text Marker 2014 e-rater Yigal et al MOOC Coursera Edx 97

48 Computer Education 课 程 体 系 设 置 2.1 科 学 设 置 培 养 方 案 课 程 模 块, 确 定 培 养 方 向 首 先, 我 们 通 过 对 人 才 市 场 需 求 分 析, 确 定 了 专 业 培 养 目 标 然 后, 根 据 教 育 部 高 等

Thesis for the Master degree in Engineering Research on Negative Pressure Wave Simulation and Signal Processing of Fluid-Conveying Pipeline Leak Candi

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

182 第 41 卷 方面发挥了重要作用 因此研究留日物理学生是中 国近现代物理学史研究的一项重要内容 出身 并任翰林院编修 不久 云贵总督李经羲上 奏 要求调其回云南兴办新学 他欣然回滇办学宣 1 统二年( 1910) 他接任云南优级师范学堂监督 兼 专任理化教员 负责筹办云南工矿学堂 并担任第一

中華民國建築學會第十二屆建築研究成果發表會

《医学英语》教学大纲

小论文草稿2_邓瀚

Microsoft Word - Preface_1_14.doc

输电线路智能监测系统通信技术应用研究

66 a T. S. Kuhn 2 b a b Thomas Kuhn disciplinary matrix examplars or shared examples incommensurability

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

如 语 言 研 究 型 数 据 库 那 样 成 熟, 但 可 为 构 建 华 文 教 材 数 据 库 提 供 借 鉴 此 类 数 据 库 中 有 代 表 性 的 有 北 京 语 言 大 学 的 对 外 汉 语 教 材 检 索 数 据 库, 中 央 民 族 大 学 的 国 际 汉 语 教 学 国 别

中医教育 版

穨423.PDF

水 土 保 持 學 報 47 (3): (2015) Journal of Soil and Water Conservation, 47 (3): (2015) ABSTRACT In this research, it is focused on the

, [3 ] Petri, 25 7, 500, [4,5 ], 3, (2), 2003, [ 6 ],,, ,, [7 ], 569, 26, ( ) : 2 ; 3 ; 4, ; 5, : (a) ( ) :,,

those four kinds of factors are significantly associated with the intention to institutional care of the elderly without ADL disability. However for t

MAXQ BA ( ) / 20

Microsoft Word - 05 許雪姬3校稿0123.doc

THE APPLICATION OF ISOTOPE RATIO ANALYSIS BY INDUCTIVELY COUPLED PLASMA MASS SPECTROMETER A Dissertation Presented By Chaoyong YANG Supervisor: Prof.D

清 华 大 学

1, : FLUENT 81 CA4113Z,,,,.,,. [ ] : :, 9 9t (<) + div (u<) = div ( < grad<) + S < (1) t, u, <, <, < S <,, 1., u i i, E,. k - RNG, () (3) [ 3-4 ],. 5

Ⅰ、Ⅱ类博士后中期考核表 贾布裕.docx

Transcription:

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE LOIS2016-85(2017-03) Technical Report INFORMATION AND COMMUNICATION ENGINEERS 263-8522 1-33 E-mail: afpa3246@chiba-u.jp, higaki.yasuhiko@faculty.chiba-u.jp 4 18 6 18 11 0.1 word2vec Application of distributed representations of words to tourist spots recommendation system Ryota KAICHI Yasuhiko HIGAKI Graduate School of Engineering, Chiba University 1-33 Yayoi-cho, Inage-ku, Chiba-shi, 263-8522 Japan E-mail: afpa3246@chiba-u.jp, higaki.yasuhiko@faculty.chiba-u.jp Abstract The purpose of this study is to examine the optimum condition for applying distributed representations of words to recommendation system of tourist spots and verify the effectiveness of this system applying word distribution expression. The system consists of four processes: word vector creation, data input and vectorization, similarity calculation, tourist spots extraction and presentation. In order to raise accuracy in this system, we conducted preliminary experiments on tourist spots databases and corpus. As a result of the evaluation experiment, the proposed method has better results than the existing method and the effectiveness was confirmed. Keywords Tourist Spots Recommendation SystemWord VectorWord2vecNatural Language Processing 1. 1.1. Web [1] TF-IDF 1.2. [2][3] [4] 2. 2.1. - 129 - This This article is is a a technical report without peer peer review, and and its its polished and/or extended version may may be be published elsewhere. Copyright Copyright 20 2017 by IEICE IEICE

[5] Distributional Semantic Models[6] ( ) skip-gram [7] 2.2. word2vec 1 word2vec[4] () skip-gram ( ) skip-gram 1 skip-gram c log-bilinear [8] (2) w,w word2vec Wikipedia 2 word2vec (1) [2] [4] 3. 2 2.2 word2vec 3 3.1. 3 Web word2vec g v (3) 1 https://code.google.com/p/word2vec 2 https://ja.wikipedia.org/wiki/ - 130 -

1 Google amusement_park establishment aquarium spa stadium place_of_worship museum park zoo 3.2. n n (4) (5) (6) 3.3. (7) 3.4. 4 4 4 4. 4.1. Web 4.1.1. a. Wikipedia b. Google Places API 3 1 Wikipedia 914,843 Google Places API 170,853 (1) (2) (3) 4.1.2..com 4.com.com 17119.com F 3 https://developers.google.com/places/ 4 http://www.rurubu.com/domestic/ - 131 -

2 (1) F (Wiki) 914,843 4,984 0.0107 Wiki 60,512 3,138 0.0808 3 (2) F (Wikipedia) 914,843 4,984 0.0107 (Wikipedia) 119,482 3,954 0.0579 4 3,693 6,703 29.8 43 9,306 0.249 369 484 41.2 14,807 17,957 44.6 732 12,375 3.20 2 112 0.965 (Google) 170,853 4,983 0.0530 (Google) 23,465 3,272 0.1612 F 4.1.3. (8) (9) (10) ( ) 2 2 F ( ) 3 Yahoo! 5 3 Wikipedia Google Places F ( ) Yahoo! (11) (12) 5 (3) 2015 11 1,790,753 96,790,696 (13) 4 0~54.05 4 5 (1)(2) 0.1 5 F Wikipedia (1) (2)(3) 0.9 5 http://chiebukuro.yahoo.co.jp - 132 -

5 7 (1) 6.6GB 161 34 3.6GB (2) 4.5GB 42 9 959MB (3) 15GB 110 74 2.5GB (4) 11GB 178 338 4.9GB (A) (B) (C) (D) (E),,,,,,,,,, 6 (100 ) (1) 71 9.70 (2) 75 8.56 (3) 72 9.30 (4) 66 10.56 4.2. word2vec [4] 4.2.1. 4 (1) Wikipedia (2) Yahoo! (3) Yahoo! (4) (1)(2) Mecab 6 word2vec word2vec size=600window size=5 (hs=0) 5 5 4.2.2..com 6 http://taku910.github.io/mecab/ (F),USJ, 5.com 7 10 10 [9] 10 4.2.3. 6 6 (2) (2) 5. 5.1. 7 7 6 3 4.2 18 1 17 5.2. [1] 2 3 7 http://www.rurubu.com/ranking/dom Sight.aspx - 133 -

8 1 0.289 1 0.286 2 0.280 2 0.279 3 0.262 3 0.273 4 0.260 4 0.251 5 0.252 5 0.231 6 5.3. 6 18 11 18 6 0.1 6. 8 8 8 7. Wikipedia (1) (2)(3) 0.9 Yahoo! [1],,, :,, 2011 2011,1566-1579,2011-06-30. [2], : AWA (artist2vec ), 9 (SIG- DOCMAS2015), 2015. [3] Mihajlo G, Vladan R, Nemanja D, and Narayan B: E- commerce in Your Inbox: Product Recommendations at Scale, KDD 15, (2015). () [4],,, :word2vec,. DE, 114(204), 41-46, 2014-09-03. [5] Peter Turney, Patrick Pantel:From frequency to meaning:vector space models of semantics, Journal of Artificial Intelligence Research 37, 141-288, 2010. [6] Harris:Distributional structure, Word.10(23), 146-162.1054. [7] Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean:Efficient Estimation of Word Representations in Vector Space:In Proceedings of Workshop at ICLR,2013. [8] Mnih, A. and Teh, Y. W.: A fast and simple algorithm for training neural probabilistic language models, Proceedings of the 29th International Conference on Ma- chine Learning, pp. 1751-1758 (2012). [9] :, 26. - 134 -