2013-comp-022.dvi

Similar documents
,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子

Microsoft Word - chnInfoPaper6

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

,,,,,,,,,, ; (),,,,,,,, 1862,1864 8,,() () () () () () (), :,,,,,,,,,,,,,,,, 95 %,, 1.,,, 20 (1838 ) (1873 ), ( )

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

Microsoft Word - 05張政偉

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

Microsoft Word doc

附3

2015 年 第 24 卷 第 11 期 计 算 机 系 统 应 用 历 的 主 体 部 分 多 以 非 结 构 化 的 文 本 形 式 存 储, 很 多 研 究 只 能 基 于 有 限 的 结 构 化 数 据 进 行 [4,5], 无 法 满 足 临

Microsoft Word - Preface_1_14.doc

mm ~

现代汉语语料库基本加工规格说明书

《中文信息学报》投稿模版

一种快速获取领域新词语的新方法

, [3 ] Petri, 25 7, 500, [4,5 ], 3, (2), 2003, [ 6 ],,, ,, [7 ], 569, 26, ( ) : 2 ; 3 ; 4, ; 5, : (a) ( ) :,,

Microsoft Word - KSAE06-S0262.doc

48 Computer Education 课 程 体 系 设 置 2.1 科 学 设 置 培 养 方 案 课 程 模 块, 确 定 培 养 方 向 首 先, 我 们 通 过 对 人 才 市 场 需 求 分 析, 确 定 了 专 业 培 养 目 标 然 后, 根 据 教 育 部 高 等

标题

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

% GIS / / Fig. 1 Characteristics of flood disaster variation in suburbs of Shang

小论文草稿2_邓瀚

Microsoft Word 定版

* CUSUM EWMA PCA TS79 A DOI /j. issn X Incipient Fault Detection in Papermaking Wa

中文模板

McGraw-Hill School Education Group Physics : Principles and Problems G S 24

江苏省高等学校

SWAN min TITAN Thunder Identification Tracking Analysis SWAN TITAN and Nowcasting 19 TREC Tracking Radar Echo by Correlaction T

第 猿 猿 卷 第 愿 期 20 员 猿 年 愿 月 张 媛 媛 等 院 肥 胖 与 雌 激 素 的 相 互 关 系 及 其 对 子 宫 的 作 用 研 究 原 员 远 员 原 素 等 多 种 原 因 有 关 袁 对 于 女 性 而 言 绝 经 后 雌 激 素 水 平 下 降 是 更 年 期 肥 胖

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

208 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2013 年 第 19 卷 第 6 期 节 目 录 上 卷 一 所 载 篇 名, 乃 总 目 录 中 篇 名 之 误, 正 文 卷 一 收 录 篇 名 为 月 支 使 者 玄 觉 杜 凝 妻 灌 国 婴 女 独 狐 及 吕 卿 均 五 篇

环境指标

a a a 1. 4 Izumi et al Izumi & Bigelow b

标题

1 引言

g 100mv /g 0. 5 ~ 5kHz 1 YSV8116 DASP 1 N 2. 2 [ M] { x } + [ C] { x } + [ K]{ x } = { f t } 1 M C K 3 M C K f t x t 1 [ H( ω )] = - ω 2

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

31 17 www. watergasheat. com km 2 17 km 15 km hm % mm Fig. 1 Technical route of p

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

Microsoft Word - A _ doc

LaDefense Arch Petronas Towers 2009 CCTV MOMA Newmark Hahn Liu 8 Heredia - Zavoni Barranco 9 Heredia - Zavoni Leyva

128 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2012 年 第 18 卷 第 5 期 毫 无 价 值, 而 且 还 会 遗 患 无 穷 随 着 社 会 生 活 节 奏 的 加 快 和 生 活 方 式 的 改 变, 食 品 供 应 将 日 益 社 会 化, 更 多 的 人 依 赖 食 品

山东省招生委员会

语篇中指代词的分布规律与心理机制*

基于因子分析法对沪深农业类上市公司财务绩效实证分析

: 307, [], [2],,,, [3] (Response Surface Methodology, RSA),,, [4,5] Design-Expert 6.0,,,, [6] VPJ33 ph 3,, ph, OD, Design-Expert 6.0 Box-Behnken, VPJ3

4 115,,. : p { ( x ( t), y ( t) ) x R m, y R n, t = 1,2,, p} (1),, x ( t), y ( t),,: F : R m R n.,m, n, u.,, Sigmoid. :,f Sigmoid,f ( x) = ^y k ( t) =

Microsoft Word doc

标题

第一章

cm /s c d 1 /40 1 /4 1 / / / /m /Hz /kn / kn m ~

D [1][2] [2] 2-2

Ansys /4 Ansys % 9 60% MU10 M m 1 Fig. Actual situation of measured building 1 Fig. 1 First floor plan of typical r

11.xps

acl2017_linguistically-regularized-lstm-MinlieHuang

1 VLBI VLBI 2 32 MHz 2 Gbps X J VLBI [3] CDAS IVS [4,5] CDAS MHz, 16 MHz, 8 MHz, 4 MHz, 2 MHz [6] CDAS VLBI CDAS 2 CDAS CDAS 5 2

标题

4 10% 90%

132 包 装 工 程 2016 年 5 月 网 产 品 生 命 周 期 是 否 有 与 传 统 产 品 生 命 周 期 曲 线 相 关 的 类 似 趋 势 旨 在 抛 砖 引 玉, 引 起 大 家 对 相 关 问 题 的 重 视, 并 为 进 一 步 研 究 处 于 不 同 阶 段 的 互 联 网

/3 CAD JPG GIS CAD GIS GIS 1 a CAD CAD CAD GIS GIS ArcGIS 9. x 10 1 b 1112 CAD GIS 1 c R2VArcscan CAD MapGIS CAD 1 d CAD U

Maup re,,,,,, ;,,,,,,,,,, PC 1985 Cognac,, 80, [ 526 ], 420m 160m [ 728 ], PC,,,,,,,,, , [ 3 ] 3008mm, 488mm, 222mm, ( ) 2880mm , 4914, 6

j.si

2005硕士论文模版

标题

IT 36% Computer Science Teachers Association, CSTA K K-12 CSTA K-12 K-12 K-6 K6-9 K STEM STEM STEM

曹美秀.pdf

170 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2012 年 第 18 卷 第 4 期 周 末 九 鼎 沦, 必 以 亡. 者 为 神, 三 山 九 鼎 有 知 也? 或 时 吏 知 怨 家 之 谋, 窃 举 持 亡, 惧 怨 家 怨 己, 云 自 去 凡 人 能 亡., 足 能 步 行

2 P30 ~ / 2 P P P122 3 P

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

1對外華語文詞彙教學的策略研究_第三次印).doc

2014 : 11 : ( 一 ) 再 和 又 词 汇 意 义 之 同 1. : (1)(a) (b) (2)(a), (b), (1) (2) ( ),, /, (1998),,,,,, [3] (1) (2), (a), (b), (a), (b), 2. : (3) (4), (5), (6)

2 137 [5]. [6].. [7]. [8-9].. (PCA) PCA HIS C1C2C3.. RGB Hotelling. [1-11]. R G B 3. RGB 1) RGB M N 3 x = [x R x G x B ] T. RGB 3 3 C x (1)

2012 D A % %

Microsoft Word - 4期中文目次.doc

VLBI2010 [2] 1 mm EOP VLBI VLBI [3 5] VLBI h [6 11] VLBI VLBI VLBI VLBI VLBI GPS GPS ( ) [12] VLBI 10 m VLBI 65 m [13,14] (referen

/MPa / kg m - 3 /MPa /MPa 2. 1E ~ 56 ANSYS 6 Hz (a) 一阶垂向弯曲 (b) 一阶侧向弯曲 (c) 一阶扭转 (d) 二阶侧向弯曲 (e) 二阶垂向弯曲 (f) 弯扭组合 2 6 Hz

标题

word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

网络“超常”形式单位认知研究与规范

Corpus Word Parser 183

Vol. 15 No. 1 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb O21 A

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

言语理解中的知觉表征与命题表征*

( ) [11 13 ] 2 211,,, : (1),, 1990 ( ) ( ),, ; OD, ( ) ( ) ; , ( ), (2) 50 %,, 1999 ( ) ( ) ; (3),,

TGF-β AngⅡ B SD ~ 220g SPF. SCXK No SYXK ~ 25 40% ~ 70% OR37G-C

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA38C6DA2D30362DC3F1D7E5D2BDD2A92E6D6469>

标题


92


,.,,.. :,, ,:, ( 1 ). Π,.,.,,,.,.,. 1 : Π Π,. 212,. : 1)..,. 2). :, ;,,,;,. 3

續論


清 华 大 学

% % 2 (1) 基 层 义 务 教 育 扩 张 的 产 物

ognitiongedr) CDC JHU ACE2005 CDC ACE2005 IBM CDC ACE2005 CDC 1 ACE [35-8] CDC CDC [ ] NIST ACE2008 GEDR CDC 1 1 CDC John Smiths [

并非没有必要的一些宏观思考

Transcription:

4 2014 7 ( ) Journal of East China Normal University (Natural Science) No. 4 Jul. 2014 : 1000-5641(2014)04-0062-07, (, 200062) :,.,,, ; N-POSW, 2-POS W,.,, F 7%. : ; ; N-POSW ; : TP39 : A DOI: 10.3969/j.issn.1000-5641.2014.04.008 Study on the extraction of Chinese microblog subjective sentences based on lexicon and corpus Abstract: ZHU Hai-huan, YU Qing-song (Computer Center, East China Normal University, Shanghai 200062, China) In this paper, we propose a new method for the extraction of Chinese microblog subjective sentence, which is based on a combination of lexicon and corpus. By determining whether the sentence contains emotional expressions, it can be classified as a subjective or objective sentence. Firstly, a highly credible sentiment lexicon was built based on the words whose emotional orientation is fixed from the existing sentiment dictionary. Based on the highly credible sentiment lexicon, sentiment expressions can be extracted with assurance of accuracy. Finally, a N-POSW model was proposed for the corpus-based learning method. Through the 2-POSW model, the remained sentiment expressions in the sentence can be extracted, thus guaranteeing the overall recall rate. Experimental results show that the F Value in this paper increases 7% compared with the traditional method, which is based on the large-scale sentiment lexicon. Key words: sentiment lexicon; highly credible lexicon; N-POSW model; subjective sentence : 2013-07 :,,,. E-mail: zhhh1988@gmail.com. :,,,, Web. E-mail: qsyu@cc.ecnu.edu.cn.

4, : 63 0,,.,.,. Kim [1].,. Wiebe [2 5],. Pang [6]. Long [7] Tweets,., [8] (2-POS). CHI 2-POS, 2-POS,. [9] SVM. [10], 2-POS,,...,.,,,.,,., : N-POS, N-POSW, 2-POSW,. : 1 ; 2, ; 3 ; 4 ; 5. 1..,,. :,.,. 1: #ipad#. 2: #ipad# 3: #ipad#,/.,. 1,. 2,. 3, /

64 ( ) 2014.,.,..,.,,,. 1. 1 Fig. 1 Main thoughts of extracting Chinese microblog subjective sentences 2,,.,. HowNet [11] NTUSD [12], 11 212, SentiDic. 1. 1 Tab. 1 A algorithm for extraction of subjective sentences based lexicon Input: Sentence Output: Sentence Sentence 1: if Sentence SentiDic then 2: Sentence 3: else Sentence 4: end if.,,,., :,,., : #ipad#., ; : # #,,

4, : 65. 3 3.1 ( 2 ),,.,,., SentiDic R SentiDic,. R SentiDic 2 143. 2 10 R SentiDic. 2 R SentiDic 10 Tab. 2 Ten words in the R SentiDic 3.2 N-POSW N-POSW, N-POS [8]. N-POS, N,. N=2, 2-POS. : :. : ( ) ( ) ( ) ( ). ( ). 2-POS -, -, -,, - 2-POS. [8] N-POS..,. N-POS,, N-POSW. 1 S. 2 w i S i. S=w 1 w 2 w 3... w i... w n, n S. 3 SqPOS=(c 1, c 2,...,c n ) S, c i w i. 4 N-Words=(w 1 w 2...w N, w 2 w 3...w N+1,..., w n N 1 w n N+1...w n ), N-Words S N. 5 N-POSW=(SqPOS,N-Words) S N-POSW., S, S N.,.. : ( ) ( ) ( ) ( ). ( )., SqPOS=(,,, ), 2-Words=(,, ). 3.3 2-POSW N-POSW, N 2, 2-POSW. 2-POSW,,.

66 ( ) 2014 { 1 subj(text) > α obj(text), subj(text) > β, 6 T(text)=, subj(text) 0. text, obj(text) text, α, β. { 1 w {w i, w i+1 }, c (a, v, n), 7 Q(w i w i+1 )=, w i w i+1 S 0., c w, a, v, n,. 8 P(S) = n 1 i=1 Q(w iw i+1 ) T(w i w i+1 ) S., w i S i, n S. P(S) S. S. α, β,, S. 3 2-POSW. ICTCLAS [13]. 3 2-POSW Tab. 3 A algovithm for extraction of subjective sentence base on 2-POSW Input: S Output: S S 1: S 2: S 2-POSW 3: P(S) 4: if P(S) > 0 then 5: S 6: else S 7: end if 3.4 2-POSW. R SentiDic., R SentiDic ;,. R SentiDic,.,. R SentiDic,., 2-POSW,,. 4. 2-POSW.,,.,. 2,, SentiDic.

4, : 67 4 Tab. 4 A algovithm for extraction of Chinese microblog subjective senterces based on lexicon and corpus Input: S Output: S S 1: if S then 2: S 3: else 4: if 2-POSW S then 5: S 6: else S 7: end if 8: end if 4 4.1 NLP&CC [14]., 7 040. xml,. NLP&CC :,., 1 000 1 000, 3.4. : <weibo id= 89 > <sentence id= 1 ># #,,, </sentence> <sentence id= 2 >,, </sentence> <sentence id= 3 > </sentence> <sentence id= 4 >,,,,,. </sentence> <hashtag id= 1 > </hashtag> </weibo> 4.2 F. =, =, F = 2 +.

68 ( ) 2014 4.3 5. 6.,, F 7%. 5 Tab. 5 The experiment result base on the traditional large-scale lexicon algorithm /% /% F /% /s 57.5 79.2 66.6 3.2 Tab. 6 6 The experiment result base on the lexicon and corpus algorithm α β /% /% F /% /s α=3, β=6 64.8 80.6 71.9 61.3 α=3, β=9 69.6 78.1 73.6 60.5 α=4, β=8 69.7 72.9 71.3 59.1 α=4, β=12 74.0 67.1 70.4 61.1,..,.,., α β.,.,.,,. 5. N-POSW, 2-POSW,,. N-POSW [8] N-POS. N-POS N ; N-POSW, N,., F 73.6%,. [ ] [ 1 ] KIM S M, HOVY E. Automatic detection of opinion bearing words and sentences[c]//companion Volume to the Proceedings of the International Joint Conference on Natural Language Processing (IJCNLP). Berlin: Springer, 2005: 61-66. [ 2 ] WIEBE J, WILSON T, BELL M. Identifying collocations for recognizing opinions[c]//proceedings of the ACL 01 Workshop on Collocation: Computational Extraction, Analysis, and Exploitation. Toulouse, FR: ACL, 2001: 24-31. [ 3 ] WIEBE J, WILSON T. Learning to disambiguate potentially subjective expressions[c]//proceedings of the 6th conference on Natural language learning-volume 20. Stroudsburg, PA: Association for Computational Linguistics, 2002: 1-7. ( 87 )

第 4 期 于波, 等 : 聚吡咯结构与导电性能的研究 87 [25] RAJAGOPALAN P,IROH JO.Characterizationofpolyaniline polypyrrolecompositecoatingsonlowcarbon steelaxpsandinfraredspectroscopystudy[j].appliedsurfacescience,2003,218:58 69. [26] STREET GB,CLARKETC,GEISSR H,etal.Characterizationofpolypyrrole[J].JournaldePhysique,1983, 44:c3,559 606. [27] LIU Y C,HWANGB J,JIAN W J,SANTHANAM R.Insitucyclicvoltammetry surface enhancedramanspec troscopystudiesonthedopingundopingofpolypyrrolefilm[j].thinsolidfilms,2000,374:85 91. ( 责任编辑李艺 ) ( 上接第 68 页 ) [4] WILSON T,WIEBEJ,HWA R.Justhow madareyou?findingstrongandweakopinionclauses[c]//proceed ingsofthenationalconferenceonartificialinteligence.menlopark,ca:mitpress,1999,2004:761 769. [5] WILSON T,WIEBEJ,HEA R.Recognizingstrongandweakopinionclauses[J].ComputationalInteligence. 2006,22(2):73 99. [6] PANGB,LEEL.Asentimentaleducation:Sentimentanalysisusingsubjectivitysummarizationbasedon mini mumcuts[c]//proceedingsofthe42ndannualmeetingonassociationforcomputationallinguistics.[s.l.]:as sociationforcomputationallinguistics,2004:271 278. [7] LONGJ,MOY.Target dependenttwitersentimentclassification[c]//proceedingofthe49thannualmeeting oftheassociationforcomputationallinguistics.stroudsburg,pa:acl,2011:151 160. [8] 叶强, 张紫琼, 罗振雄. 面问互联网评论情感分析的中文主观性自动判别方法研究 [J]. 信息系统学报,2007, 1(1):7 91. [9] 张博. 基于 SVM 的中文观点句抽取 [D]. 北京邮电大学,2011. [10] 杨武, 宋静静, 唐继强. 中文微博情感分析中主客观句分类方法 [J]. 重庆理工大学学报 : 自然科学,2013, 27(1):51 56. [11] 董振东, 董强. 知网简介 [DB/OL].[2013 7 20].htp://www.keenage.com. [12] 台湾大学.NTUSD 简体中文情感极性词典 [DB/OL].[2013 7 20].htp://www.datatang.com/data/11837. [13] ICTCLAS.ICTCLAS 汉语分词系统 [DB/OL].[2014 06 10].htp://www.ictclas.org. [14] 中文信息技术专业委员会. 中文微博情感分析评测 [EB/OL].[2013 7 20].htp://tcci.ccf.org.cn/conference/ 2012/pages/page04_eva.html. ( 责任编辑李艺 )