, CAS-IA morphology

Similar documents
14A 0.1%5% 14A 14A

(Chi)_.indb

穨_2_.PDF

中医疗法(下).doc

第 2 頁 (a) 擔 任 機 場 擴 建 統 籌 辦 總 監 的 首 席 政 府 工 程 師 職 位 第 3 點 ) ; (b) 擔 任 ( 機 場 擴 建 統 籌 辦 ) 的 首 長 級 丙 級 政 務 官 職 位 ; 以 及 (c) 擔 任 總 助 理 ( 機 場 擴 建 統 籌 辦 ) 的

cgn

39898.indb

穨ecr2_c.PDF

電腦相關罪行跨部門工作小組-報告書

i

发展党员工作手册

i

. (A) (B) (C) A (D) (E). (A)(B)(C)(D)(E) A

(As at 28

中医疗法(上).doc

香 港 舞 蹈 總 會    北 京 舞 蹈 學 院

Microsoft Word - EDB Panel Paper 2016 (Chi)_finalr

二零零六年一月二十三日會議

马太亨利完整圣经注释—雅歌

厨房小知识(四)

妇女更年期保健.doc

小儿传染病防治(上)

<4D F736F F D B875B9B5A448ADFBBADEB27AA740B77EA4E2A5555FA95EAED6A641ADD75F2E646F63>

女性青春期保健(下).doc

避孕知识(下).doc

孕妇饮食调养(下).doc

禽畜饲料配制技术(一).doc

中老年保健必读(十一).doc

怎样使孩子更加聪明健康(七).doc

i

509 (ii) (iii) (iv) (v) 200, , , , C 57

E. (A) (B) (C) (D). () () () (A) (B) (C) (D) (E). () () () (A) (B) (C) (D) (E). (A)(B)(C) (D) (E) (A) (B) (C) (D) (E) (A) (B)(C) (D) (E). (A) (B) (C)

尿路感染防治.doc

Microsoft Word - MP2018_Report_Chi _12Apr2012_.doc

南華大學數位論文

李天命的思考藝術

皮肤病防治.doc

性病防治

中国南北特色风味名菜 _一)

全唐诗24

mm mm

心理障碍防治(下).doc

中華民國青溪協會第四屆第三次理監事聯席會議資料

天主教永年高級中學綜合高中課程手冊目錄

《米开朗琪罗传》

第五条 非公开发行股票预案应当包括以下内容:

榫 卯 是 什 麼? 何 時 開 始 應 用 於 建 築 中? 38 中 國 傳 統 建 築 的 屋 頂 有 哪 幾 種 形 式? 40 大 內 高 手 的 大 內 指 什 麼? 42 街 坊 四 鄰 的 坊 和 街 分 別 指 什 麼? 44 北 京 四 合 院 的 典 型 格 局 是 怎 樣 的

I

Teaching kit_A4_part4.indd


2. 下 列 理 解 和 分 析, 不 符 合 原 文 意 思 的 一 项 是 ( ) A. 水 手 在 伦 敦 讲 东 印 度 群 岛 的 所 见 所 闻, 匠 人 在 火 炉 边 讲 自 己 的 人 生 经 历, 他 们 讲 的 故 事 各 有 特 点, 但 同 属 于 传 统 故 事 模 式

银河银联系列证券投资基金

「香港中學文言文課程的設計與教學」單元設計範本

优合会计考点直击卷子之财经法规答案——第八套

女性减肥健身(四).doc

4.进度控制(网络计划)0.ppt

2 A

全唐诗28

穨學前教育課程指引.PDF

眼病防治

中国南北特色风味名菜 _八)

綜合社會保障援助指引

单 元 / 页 数 内 容 标 准 学 习 标 准 教 学 步 骤 及 活 动 教 具 BC 1.1 男 孩 女 孩 BC 2.1 白 纸 有 礼 貌 地 与 人 沟 通 BC 3.3 认 识 字 词 ( 第 1 页 ) 单 元 一 : 我 1 男 女 作 出 反 应 BC 2.1.4(a) 应 用

項 訴 求 在 考 慮 到 整 體 的 財 政 承 擔 以 及 資 源 分 配 的 公 平 性 下, 政 府 採 取 了 較 簡 單 直 接 的 一 次 性 減 稅 和 增 加 免 稅 額 方 式, 以 回 應 中 產 家 庭 的 不 同 訴 求 ( 三 ) 取 消 外 傭 徵 費 6. 行 政 長

(f) (g) (h) (ii) (iii) (a) (b) (c) (d) 208

Microsoft Word - 08 单元一儿童文学理论

untitled

第三章

nb.PDF

bnbqw.PDF

南華大學數位論文

Microsoft Word 一年級散文教案.doc

米食天地教案

1. 本文首段的主要作用是 A. 指出 異蛇 的藥用功效 說明 永之人爭奔走焉 的原因 B. 突出 異蛇 的毒性 為下文 幾死者數矣 作鋪墊 C. 交代以蛇賦稅的背景 引起下文蔣氏有關捕蛇的敘述 2. 本文首段從三方面突出蛇的 異 下列哪一項不屬其中之一 A. 顏色之異 B. 動作之異 C. 毒性之

Microsoft Word - 發布版---規範_全文_.doc

概 述 随 着 中 国 高 等 教 育 数 量 扩 张 目 标 的 逐 步 实 现, 提 高 教 育 质 量 的 重 要 性 日 益 凸 显 发 布 高 校 毕 业 生 就 业 质 量 年 度 报 告, 是 高 等 学 校 建 立 健 全 就 业 状 况 反 馈 机 制 引 导 高 校 优 化 招

鱼类丰产养殖技术(二).doc

疾病诊治实务(一)

名人养生.doc

<4D F736F F D2040B9C5B871A661B0CFABC8AE61C2A7AB55ACE3A8735FA7F5ABD8BFB3B9C5B871A661B0CFABC8AE61C2A7AB55ACE3A8732E646F63>


中老年保健必读(十).doc

27 i

Transcription:

( 6 ) cqzong@nlpr.ia.ac.cn http://www.nlpr.ia.ac.cn/english/cip/cqzong.htm No.95, Zhongguancun East Road Beijing 100080, China http://www.ia.ac.cn Tel. No.: +86-10-6255 4263

, CAS-IA 2004-4-28 2 6.1 morphology

, CAS-IA 2004-4-28 3 6.1

, CAS-IA 2004-4-28 4 6.2

, CAS-IA 2004-4-28 5 6.2 (1) Mr. Green is a good English teacher. (2) I ll see prof. Zhang home after the concert. (1) Mr./ Green/ is/ a/ good/ English/ teacher/. (2) I/ will/ see/ prof./ Zhang/ home/ after/ the/ concert/.

6.2 (1) prof., Mr., Ms. Co., Oct. (2) Let s / let s => let + us (3) I am => I + am (4) {it, that, this, there, what, where} s => {it, that, this, there, what, where} + is (5) can t => can + not; won t => will + not (6) {is, was, are, were, has, have, had}n t => {is, was, are, were, has, have, had} + not (7) X ve => X + have; X ll=> X + will; X re => X + are, CAS-IA 2004-4-28 6

, CAS-IA 2004-4-28 7 6.2 (8) he s => he + is / has =>? she s => she + is / has =>? (9) X d Y => X + would ( Y ) => X + had ( Y )

6.2 1. 1) -ed ed *ed * (e.g., worked work) *ed *e (e.g., believed believe) *ied *y (e.g., studied study) 2) -ing *ing * (e.g., developing develop) *ing *e (e.g., saving save) *ying *ie (e.g., die dying), CAS-IA 2004-4-28 8

6.2 3) -s *s * (e.g., works work) *es * (e.g., discuss discusses) *ies *y (e.g., studies study) 4) -ly *ly * (e.g., hardly hard), CAS-IA 2004-4-28 9

, CAS-IA 2004-4-28 10 6.2 5) er/est *er * *ier *y (e.g., cold colder) (e.g., easier easy) 6) s/ses/xes/ches/shes/oes/ies/ves ies/ves bodies body, shelves shelf, boxes box, etc. 7) X s, Xs

6.2 2. choose, chose, chosen axis, axes bad, worse, worst, CAS-IA 2004-4-28 11

, CAS-IA 2004-4-28 12 6.2 3. 1) 1990s 1990 2) 82th th 3) $200 $ 200 4) 98.5% 98.5

, CAS-IA 2004-4-28 13 6.2 4. 1) e.g., one-fourth 2) e.g., Human-computer, multi-engine, mixed-initiative, large-scale 3) ed e.g., machine-readable, hand-coding, non-adjacent, contextfree, rule-based, speaker-independent

, CAS-IA 2004-4-28 14 6.2 4) e.g., job-hunt 5) - e.g., co-operate, 7-color, bi-directional, inter-lingua, Chinese-to-English, state-of-the-art, part-of-speech, OOV-words, spin-off, top-down, quick-and-dirty, text-to-speech, semi-automatically, i-th

, CAS-IA 2004-4-28 15 6.2 1) 2) 3)

, CAS-IA 2004-4-28 16 6.3

, CAS-IA 2004-4-28 17 6.3 1 2

6.3 1 / / / / / / / / / / / / / / / / / 2 / / / / / / / / / / /, CAS-IA 2004-4-28 18

, CAS-IA 2004-4-28 19 6.3 1 2

, CAS-IA 2004-4-28 20 6.3 1

, CAS-IA 2004-4-28 21 6.3 2 i) ii)

, CAS-IA 2004-4-28 22 6.3 1) / / / /

, CAS-IA 2004-4-28 23 6.3 2)

, CAS-IA 2004-4-28 24 6.3 3)

, CAS-IA 2004-4-28 25 6.3 4)

, CAS-IA 2004-4-28 26 6.3 5)

, CAS-IA 2004-4-28 27 6.3 6) i) / / / / ii) / / iii) / / / / / iv) / / / /

, CAS-IA 2004-4-28 28 6.3 v) / / / vi) / / / / / / / / / / vii) / /

, CAS-IA 2004-4-28 29 6.4 / /

, CAS-IA 2004-4-28 30 6.4 Maximum Matching, MM (Forward MM, FMM) (Backward MM, BMM) Bi-directional MM S = cc Lc 1 2 i 1 2 n w = c c L c m m

, CAS-IA 2004-4-28 31 6.4 FMM 0 i=0 p i 1 p i n if n=1 3) m= if n < m, m = n 2 p i m w i i) w i w i iii) ii) w i w i 1 w i 2) i) w i 1 w i w i iii) iii) w i p i p i 3 i=i+1 3

, CAS-IA 2004-4-28 32 6.4 7 p p FMM BMM

, CAS-IA 2004-4-28 33 6.4 95 [ 2003]

, CAS-IA 2004-4-28 34 6.4 S=c 1 c 2 c n c i i =1,2, n n n 1 n+1 G V 0 V 1 V 2 V n c v 1 c 0 v 2 1 c i-1 c v i i-1 c j c v j+1 j c n v n N-

, CAS-IA 2004-4-28 35 6.4 (1) v k-1, v k <v k-1, v k > c k ( k =1, 2,, n) (2) w= c i c i+1 c j (0<i<j n) v i-1, v j <v i-1, v j > w c v 1 c 0 v 2 1 c i-1 c v i i-1 c j c v j+1 j c n v n w=c i c i+1 c j (3) (2) (4)

, CAS-IA 2004-4-28 36 6.4 1) (6) (7) 2) (5) (5)

, CAS-IA 2004-4-28 37 6.4

, CAS-IA 2004-4-28 38 6.4 S = c 1 c 2 c n c i i =1,2, n n n 1 W = w 1 w 2 w k 1 k n P W P S W Wˆ ( ) ( ) = argmaxp( W S) = argmax W W P( S) = argmaxp( W) = W k i= 1 P( w w i 1, L, wi 1)

, CAS-IA 2004-4-28 39 6.4

, CAS-IA 2004-4-28 40 6.4 [ 2000]

, CAS-IA 2004-4-28 41 6.4

, CAS-IA 2004-4-28 42 6.5 ABC AB C A BC AB BC 1000 16 1 2 95 [ 2000 1997]

, CAS-IA 2004-4-28 43 6.5 1 1 1 2 ABC AB C >A BC ABC AB C A BC f( ) 3 f( ) 600 f( ) 0 f( ) 14

, CAS-IA 2004-4-28 44 6.5 2 2 2 ABCD AB CD 3 3 3 ABCDE ABC DE ABC 1

, CAS-IA 2004-4-28 45 6.5 1 A( ) BC / / / / / / / / / / / / / /

, CAS-IA 2004-4-28 46 6.5 AB C ( ) / / / / ( ) [ 1995]

, CAS-IA 2004-4-28 47 6.5 [ 1997] xy x, y N r( x, y) I ( x : y) = log 2 r( x) r( y) N r(x, y) x, y r(x), r(y) x, y

, CAS-IA 2004-4-28 48 6.5 xyz Pt 1 : xy z, Pt 2 : x yz I(x:y) I(y:z) α Pt 1 I(y:z) I(x:y) α Pt 2

, CAS-IA 2004-4-28 49 6.5 AB A B 1 2 3 4 5

, CAS-IA 2004-4-28 50 6.5 1 M + AB -> M + A(q) + B ( A B ) 2 3

, CAS-IA 2004-4-28 51 6.6 SARS (cool)

, CAS-IA 2004-4-28 52 6.6 5544 3410 1990 144 737 729 8 300 974 952 23 300 4064 [ 2002a, 2002b]

, CAS-IA 2004-4-28 53 6.6 : (1) (2) (3) (4)

, CAS-IA 2004-4-28 54 6.6 Step-1: Step-2: Cname = Xm 1 m 2 X m 1 m 2 F ( X ) = X X ( ) m1 F m1 = m m F ( m2) = 2 1 m 2

, CAS-IA 2004-4-28 55 6.6 Cname P( Cname) = F( X ) F( m1 ) F( m F( X ) F( m2 ) 2 ) X T min F( X ) Min( F( m1 ) F( m ( X ) = F( X ) Min( F( m2)) f = ln P( Cname) 2 )) X β X ( threshold value) f β X

, CAS-IA 2004-4-28 56 6.6 β X β =α T ( X)) 1 F( X) α X = 2 0.5 < α X 1 + X X ln( min Cname = Xm 1 m 2 F(X)=100% (α X =1) ln P ( Cname) > ln( Tmin( X )) F(X) 100% ln P( Cname) X ln( Tmin( X )) >α

, CAS-IA 2004-4-28 57 6.6. 2 Step-3: 100 100

6.6 Step-4:, CAS-IA 2004-4-28 58

, CAS-IA 2004-4-28 59 6.6 1994 88026 [ 2000], [ 1995a]

6.6, CAS-IA 2004-4-28 60

6.6 threshold value, CAS-IA 2004-4-28 61

, CAS-IA 2004-4-28 62 6.6 { } +

, CAS-IA 2004-4-28 63 6.6

, CAS-IA 2004-4-28 64 6.6

, CAS-IA 2004-4-28 65 6.6 [ 1993]

, CAS-IA 2004-4-28 66 6.6 HMM-Based [Zhou, 2002] Maximum-Entropy [Collins, 2002] Named Entity, NE

6.6 [Nie, 1995] MM 1) n 2) 3) n [Chang, 2002] [Chang, 2003], [, 1997], CAS-IA 2004-4-28 67

, CAS-IA 2004-4-28 68 6.7 S = A B A S B (Correct ratio): C 100 % = B S (Recall ratio): R 100% = A S F- 2 ( β + 1) C R F measure = 100% 2 β C + R β =1,

, CAS-IA 2004-4-28 69 MM,

, CAS-IA 2004-4-28 70 F-

, CAS-IA 2004-4-28 71 1. 2. {he, she} s he / she has he / she is 3. F- 4. 5. 6. GB13715

, CAS-IA 2004-4-28 72 Thanks