PowerPoint Presentation

Size: px
Start display at page:

Download "PowerPoint Presentation"

Transcription

1 第 10 章语义分析 北京市海淀区中关村东路 95 号 邮编 : 电话 : 邮件 :cqzong@nlpr.ia.ac.cn

2 10.1 概述 宗成庆 : 自然语言理解 讲义, 第 10 章 2/97

3 10.1 概述 语义计算的任务 : 解释自然语言句子或篇章各部分 ( 词 词组 句子 段落 篇章 ) 的意义 面临的困难 : 自然语言句子中存在大量的歧义, 涉及指代 同义 / 多义 量词的辖域 隐喻等 ; 同一句子对于不同的人来说可能有不同的理解 ; 语义计算的理论 方法 模型尚不成熟 宗成庆 : 自然语言理解 讲义, 第 10 章 3/97

4 10.1 概述 例子 (1) I bought a car with four wheels. I bought a car with four dollars. (2) These boys will be dedicated persons. These boys will be denied license. (3) 这件事情让我感到很头疼 (4) 这人真恶心! (5) 他也算个男人?! 简直是个饭桶! 宗成庆 : 自然语言理解 讲义, 第 10 章 4/97

5 10.2 语义理论简介 宗成庆 : 自然语言理解 讲义, 第 10 章 5/97

6 10.2 语义理论简介 词的指称作为意义 该理论认为, 词或词组的意义就是它们在现实世界上所指的事物 那么计算语义学的任务就是将词或词组与世界模型中的物体对应起来 常用的现实世界模型假设世界上存在各种物体, 包括人 问题 : 对于复杂的问题这种定义无法处理 启明星 / 暮星 金星 ; 神仙? 鬼? 妖怪? 宗成庆 : 自然语言理解 讲义, 第 10 章 6/97

7 10.2 语义理论简介 心理图像 大脑图像或思想作为意义 该理论认为, 词或词组的意义就是词或词组在人心理上或大脑中所产生的图像 问题 : 在计算机中把心理图像有效地表示出来并不是一件容易的事情, 而且, 不一定所有的词义都有清晰的心理图像 宗成庆 : 自然语言理解 讲义, 第 10 章 7/97

8 10.2 语义理论简介 说话者的意图作为意义 该理论试图解释语言中一种被称为言语行为 (Speech Acts) 的现象 说话者把自己的话语当作行为, 希望听者理解 作出反应 这种意义被认为是独立于逻辑意义之外的 宗成庆 : 自然语言理解 讲义, 第 10 章 8/97

9 10.2 语义理论简介 例如 : 我想预订明天下午的火车票 c: give-information + reservation +ticket (ticket-spec=(ticket-type=train, Concepts time=(relative-time=tomorrow, Speaker tod=afternoon))) Speech-act Arguments 问题 : 意图的定义 划分和表示是困难的 宗成庆 : 自然语言理解 讲义, 第 10 章 9/97

10 10.2 语义理论简介 过程语义 该理论认为, 句子的语义定义为接受该句后所执行的程序或者所采取的某种动作 优点 : 简单明了, 对于计算机智能应用系统来说, 这种定义在某种程度上是有效的 问题 : 对于语言本身缺乏解释, 且句子的语义与应用之间的连接过于紧密, 缺乏独立性 宗成庆 : 自然语言理解 讲义, 第 10 章 10/97

11 10.2 语义理论简介 词汇分解学派 该理论把句子的语义基于它所含有的词和词组的意义之上, 而词的意义则基于一组有限特征, 这组特征通常称为语义基元 这样, 只要给出一组语义基元和一些操作符, 就可以把句子的语义描述出来 类似于化学中的元素学说 问题 : 语义基元的定义 分解标准等难以把握, 基元和组合操作的合理性直接影响句子语义描写的准确性 宗成庆 : 自然语言理解 讲义, 第 10 章 11/97

12 10.2 语义理论简介 条件真理模型 该理论以谓词逻辑为基础, 句子的语义定义为它所对应的命题或谓词在全体模型 ( 或世界 ) 中的真伪 例如 : 雪是白的 为真, 当且仅当在这个世界上雪是白的 优点 : 对上下文无关部分的语义描写很有效 问题 : 对时间 场景有关的语言现象不能很好地描述 不能很好地解释一句多义的问题 宗成庆 : 自然语言理解 讲义, 第 10 章 12/97

13 10.2 语义理论简介 情景语义学 该理论认为句子的语义不仅和逻辑意义有关, 而且和句子被使用的场景有关 在语义表达式中引入一些与场景相关的变量, 如事件变量 时间变量等, 并用逻辑 与 算子对这些变量加以限制 宗成庆 : 自然语言理解 讲义, 第 10 章 13/97

14 10.2 语义理论简介 例如 : 雪是白的 : 是白的 ( 雪, e) 等同 (e, 地球世界 ) 前缀表示 谓词 场景变量 宗成庆 : 自然语言理解 讲义, 第 10 章 14/97

15 10.2 语义理论简介 模态逻辑 起源于 20 世纪 80 年代初,AI 如 : 缺省逻辑 时态逻辑 真值维护系统等 这类逻辑是试图用一套公理系统来刻画现实世界和自然语言中常见的一些现象 这类现象从哲学上说就是一般性和特殊性的矛盾 问题 : 公理系统 总是刻画世界普遍成立的一般性真理, 难以涵盖特殊情况下的特殊事实 例如 : 鸟会飞 企鹅不会飞 宗成庆 : 自然语言理解 讲义, 第 10 章 15/97

16 10.3 格语法 宗成庆 : 自然语言理解 讲义, 第 10 章 16/97

17 背景 10.3 格语法 格语法 (Case Grammar) 是美国语言学家 Charless J. Fillmore 于 1966 年提出的 代表作 : 1966, Towards a modern theory of case 1968, The case for case 1971, Some problems for case grammar 宗成庆 : 自然语言理解 讲义, 第 10 章 17/97

18 10.3 格语法 基本观点 C. J. Fillmore 指出 : 诸如主语 宾语等语法关系实际上都是表层结构上的概念, 在语言的底层, 所需要的不是这些表层的语法关系, 而是用施事 受事 工具 受益等概念所表示的句法语义关系 这些句法语义关系, 经各种变换之后才在表层结构中成为主语或宾语 宗成庆 : 自然语言理解 讲义, 第 10 章 18/97

19 10.3 格语法 格的定义 格语法中的格是 深层格, 它是指句子中体词 ( 名词 代词等 ) 和谓词 ( 动词 形容词等 ) 之间的及物性关系 (transitivity), 如 : 动作和施事者的关系 动作和受事者的关系等, 这些关系是语义关系, 它是一切语言中普遍存在的现象 宗成庆 : 自然语言理解 讲义, 第 10 章 19/97

20 10.3 格语法 这种格是在底层结构中依据名词与动词之间的句法语义关系确定的, 这种关系一经确定就固定不变, 不管经什么操作 在表层结构中处于什么位置 与动词形成什么语法关系, 底层上的格与任何具体语言中的表层结构上的语法概念, 如主语, 宾语等, 没有对应关系 宗成庆 : 自然语言理解 讲义, 第 10 章 20/97

21 10.3 格语法 例如 :(1) The door opened. (2) The key opened the door. (3) The boy opened the door. (4) The door was opened by the boy. (5) The boy opened the door with a key. the boy: 施事格 the door: 客体格 ( 受事格 ) the key: 工具格 宗成庆 : 自然语言理解 讲义, 第 10 章 21/97

22 10.3 格语法 格语法的三条基本原则 : (1) S M+P 句子 S 可以改写成情态 (Modality) 和命题 (Proposition) 两大部分, 情态部分包括否定 时 式 体以及其他被理解为全句情态成分的状语 命题牵涉到动词和名词短语 动词和内嵌小句之间的关系, 动词是句子的中心, 名词短语按其特定的格属关系依附于该动词 宗成庆 : 自然语言理解 讲义, 第 10 章 22/97

23 10.3 格语法 (2) P V+C 1 +C 2 + C n 命题 P 都可以改写成一个动词 V 和若干个格 C 动词是广义上的动词, 包括 : 动词 形容词 甚至包 括名词 副词和连词 (3) C K + NP K 为格标, 是各种格范畴在底层结构中的标记, 可以有各种标记形式, 如 : 前置词 后缀词 词缀 零形式等 宗成庆 : 自然语言理解 讲义, 第 10 章 23/97

24 格表 10.3 格语法 C. J. Fillmore 在 1968 年的论文中认为, 命题中的格包括 6 种 : (1) 施事格 (Agentive): 动作的发生者 ; (2) 工具格 (Instrumental): 对动作或状态而言作为某种因素而牵涉到的无生命的力量或客体 (3) 承受格 (Dative): 由动词确定的动作或状态所影响的有生物 如,He is tall. 宗成庆 : 自然语言理解 讲义, 第 10 章 24/97

25 10.3 格语法 (4) 使成格 (Factitive): 由动词确定的动作或状态所形成的客体或有生物 或理解为 : 动词意义的一部分的客体或有生物 如 :John dreamed a dream about Mary. (5) 方位格 (Locative): 由动词确定的动作或状态的处所或空间方位 如 :He is in the house. (6) 客体格 (Objective): 由动词确定的动作或状态所影响的事物 如 :He bought a book. 宗成庆 : 自然语言理解 讲义, 第 10 章 25/97

26 10.3 格语法 后来 Fillmore 在语言分析时又增加了一些格 : (7) 受益格 (Benefactive): 由动词确定的动作为之服务的有生命的对象 如 :He sang a song for Mary. (8) 源点格 (Source): 由动词确定的动作所作用到的事物的来源或发生位置变化过程中的起始位置 如 :He bought a book from Mary. 宗成庆 : 自然语言理解 讲义, 第 10 章 26/97

27 10.3 格语法 (9) 终点格 (Goal): 由动词确定的动作所作用到的事物的终点或发生位置变化过程中的终端位置 如 :I sold a car to Mary. (10) 伴随格 (Comitative): 由动词确定的与施事共同完成动作的伴随者 如 :He sang a song with Mary. * 格的数目和名称并不是确定的 宗成庆 : 自然语言理解 讲义, 第 10 章 27/97

28 10.3 格语法 用格语法分析语义 : 格框架约束分析 格框架表示 格框架中可以有语法信息, 也可以有语义信息, 语义信息是整个格框架最基本的部分 一个格框架可由一个主要概念和一组辅助概念组成, 这些辅助概念以一种适当定义的方式与主要概念相联系 一般地, 在实际应用中, 主要概念可理解为动词, 辅助概念理解为施事格 受事格 处所格 工具格等语义深层格 宗成庆 : 自然语言理解 讲义, 第 10 章 28/97

29 10.3 格语法 例 : In the room, he broke a window with a hammer. [BREAK [ Case-frame: [Agentive: HE Objective: WINDOW Instrumental: HAMMER Locative: ROOM ] [MODALs: Time: past Voice: active ]]] 宗成庆 : 自然语言理解 讲义, 第 10 章 29/97

30 10.3 格语法 分析的基础 词典中记录动词的格框架和名词的语义信息 对于动词 : 规定它们所属的必备格 可选格或禁用格, 同时填充这些格的名词的语义条件 如 : 动词用法词典 把名词按其与动词格的关系分为 14 类 : 受事 结果 对象 工具 方式 处所 时间 目的 原因 致使 施事 同源 等同 杂类 对于名词 : 填充语义信息, 建立名词语义分类体系 宗成庆 : 自然语言理解 讲义, 第 10 章 30/97

31 10.3 格语法 分析步骤 (1) 判断待分析词序列中主要动词, 在动词词典中找出该词的格框架 ; (2) 识别必备格 : 如果格带有位置标志, 则从指定位置查找格的填充物 ; 如果格带有语法标志, 则在这个分析的词序列中查找语法标志, 进入相应的填充 ; 如果格框架还需要其它必备格, 查找其它名词的语义信息, 按格框架的语义信息要求进行相应的填充 宗成庆 : 自然语言理解 讲义, 第 10 章 31/97

32 10.3 格语法 (3) 识别可选格 (4) 判断句子的情态 Modal 格框架分析可以和句法分析结合起来 : (a) 句法分析 : 判断出句子的动词 名词短语 介词短语等 ; (b) 查找动词的格框架与名词短语 介词短语的格关系, 并进行相应的填充 必须首先找到动词 ( 谓词 ), 从而获得格框架 宗成庆 : 自然语言理解 讲义, 第 10 章 32/97

33 10.3 格语法 The young athlete will be running in Los Angeles next week. 从词典中查找 run 的格框架 : Verb: run Case-Frame [ Neutral -required ( 中性格 ) Dative Locative -not allowed -optional Instrumental -not allowed Agentive -required] 与格, 通常表示动词的间接宾语 run 的中性格像一个物理实体或组织, 如 : John ran the machine. He ran the corporation. 宗成庆 : 自然语言理解 讲义, 第 10 章 33/97

34 10.3 格语法 CASE [Agentive: the young athlete Locative: Los Angeles Neutral: the young athlete [Modal [Tense: Future ( 将来时 ) MOOD: Declarative ( 陈述语气 ) Time: next week]]] 宗成庆 : 自然语言理解 讲义, 第 10 章 34/97

35 10.3 格语法 格语法描写汉语的局限性 汉语的一些无动句 流水句 连动句 紧缩 动补 省略等结构, 无法或不必用一个统率全句的模式来描述, 其中连动句和兼语句尤为突出 例如 : (1) 他拿了书就上楼去了 (2) 我们选他当班长 宗成庆 : 自然语言理解 讲义, 第 10 章 35/97

36 10.4 语义网络 宗成庆 : 自然语言理解 讲义, 第 10 章 36/97

37 背景 10.4 语义网络 语义网络 (semantic network) 由美国心理学家 M. R. Quilian 于 1968 年在研究人类联想记忆时提出 1977 年美国 AI 学者 G. Hendrix 提出了分块语义网络的思想, 把语义的逻辑表示与 格语法 结合起来, 把复杂问题分解为几个较为简单的子问题, 每个子问题用一个语义网络表示, 把自然语言理解的研究向前推进了一步 宗成庆 : 自然语言理解 讲义, 第 10 章 37/97

38 10.4 语义网络 语义网络的概念 语义网络通过由概念和语义关系组成的有向图来表达知识 描述语义 有向图 : 图的结点表示概念, 图的边表示概念之间的关系 边的类型 :(1) 是一种 :A 到 B 的边表示 A 是 B 的一种特例 ;(2) 是部分 : A 到 B 的边表示 A 是 B 的一部分 ; 宗成庆 : 自然语言理解 讲义, 第 10 章 38/97

39 10.4 语义网络 R A [ 在水中生活 ] (1) B 鱼 IS-A [ 有生命 ] [ 吃食物 ] (2) 动物 老虎 IS (3) 肉食动物 桌面 PART-OF (4) 桌子 宗成庆 : 自然语言理解 讲义, 第 10 章 39/97

40 10.4 语义网络 语义网络的概念关系 语义网络各概念之间的关系, 主要由 IS-A, PART-OF, IS, COMPOSED-OF, HAVE, BEFORE, LOCATED-ON 等谓词表示 IS-A: 表示 具体 - 抽象 关系 PART-OF: 表示 整体 - 构件 关系 IS: 一个结点是另一个结点的属性 中国首都 IS 北京 宗成庆 : 自然语言理解 讲义, 第 10 章 40/97

41 10.4 语义网络 HAVE: 表示 占有 具有 关系 BEFORE/AFTER/AT: 表示事物间的次序关系 LOCATED-ON/UNDER/AT: 表示事物之间的位置关系 宗成庆 : 自然语言理解 讲义, 第 10 章 41/97

42 10.4 语义网络 事件的语义网络表示 当语义网络表示事件时, 结点之间的关系可以是施事 受事 时间等 例如 : 张三帮助李四 张三 Agentive 事件 Objective 李四 IS 帮助 宗成庆 : 自然语言理解 讲义, 第 10 章 42/97

43 10.4 语义网络 事件的语义关系 (1) 分类关系 : 事物之间的类属关系 (2) 聚焦关系 : 多个下位概念构成一个上位概念 IS-A 动物 IS-A IS-A 鸟鱼 IS-A IS-A IS-A 教师 IS-A 助教讲师教授 鸵鸟鹦鹉鲨鱼鲸鱼 宗成庆 : 自然语言理解 讲义, 第 10 章 43/97

44 10.4 语义网络 (3) 推论关系 : 由一个概念推出另一个概念 (4) 时间 位置关系 : 事实发生或存在的时间 位置 带雨伞 推出 下雨 宗成庆 : 自然语言理解 讲义, 第 10 章 44/97

45 10.4 语义网络 基于语义网络的推理 分析 (1) 根据提出的问题构成局部网络 ; (2) 用变量代表待求的客体 Agentive Objective? 事件李四张三 IS 帮助网络知识库 宗成庆 : 自然语言理解 讲义, 第 10 章 45/97

46 10.4 语义网络 词义 内涵 : 词本身的意义, 是对词代表的概念 描述 外延 : 词所指代的物体 问题 : 如何在语义网络中表示和区分词的内涵和 外延? 宗成庆 : 自然语言理解 讲义, 第 10 章 46/97

47 10.5 概念依存理论 宗成庆 : 自然语言理解 讲义, 第 10 章 47/97

48 背景 10.5 概念依存理论 Schank 和他的同事在 70 年代提出概念依存理论 (Concept Dependence, CD) 1975, Conceptual Information 1977, Scripts, Plans, Goals and Understanding 宗成庆 : 自然语言理解 讲义, 第 10 章 48/97

49 10.5 概念依存理论 CD 理论的组成 : 三个层次之一 : 动作基元 (1) 在概念依存层次 : 规定了一组动作基元, 其他动作是由这些动作基元组合而成的 如 : 抓 (Grasp) 移动 (Move) 传送(Trans) 去(Go) 推(Propel) 吸收 (Ingest) 撞击(Hit) 等 (2) 关于精神世界的概念 : 心传 (MTrans) 概念化 (Conceptualize) 心建(MBuild) (3) 关于手段或工具 : 闻 (Smell) 看(Look-at) 听 (Listen-to) 说(Speak) 宗成庆 : 自然语言理解 讲义, 第 10 章 49/97

50 10.5 概念依存理论 三个层次之二 : 剧本用来描写遇到一些常见场景或场合时所采取的一些固定的成套的动作 如 : (a) A 推购物车或拿购物筐 ; (b) A 根据购物单或随意选购一些物品 B; (c) A 把选购好的 B 给收帐员算帐 付款 宗成庆 : 自然语言理解 讲义, 第 10 章 50/97

51 10.5 概念依存理论 三个层次之三 : 计划 计划中的每一步都是一个剧本, 如, 外出旅游的安排 : (a) 出门前的准备 ; (b) 搭乘交通工具到目的地 ; (c) 找住宿地点安顿下来 ; (d) 在旅游地游玩 ; (e) 若还未尽兴, 转 (b), 否则, 转 (f); (f) 搭乘交通工具回家 宗成庆 : 自然语言理解 讲义, 第 10 章 51/97

52 10.5 概念依存理论 依据 CD 理论理解语言 一般文章中一些动作的细节被忽略, 计算机难以发现事件 人物 地点等各种指代之间的联系, 而 CD 理论试图建立这种联系, 正确描述常识, 并利用基本动作推理 该理论对限定领域内的特定应用比较有效 缺陷 : 对常识的描写过于刻板和定式 宗成庆 : 自然语言理解 讲义, 第 10 章 52/97

53 10.6 词义消歧 宗成庆 : 自然语言理解 讲义, 第 10 章 53/97

54 10.6 词义消歧 词义消歧问题 (word sense disambiguation, WSD) 例如 : 英文 : bank: 银行 / 河岸 plant: 工厂 / 植物 汉语 : 打 :play/ take/ dial/ weave 包 :package/ guarantee / 宗成庆 : 自然语言理解 讲义, 第 10 章 54/97

55 10.6 词义消歧 基本方法 早期基于规则的消歧方法 统计机器学习消歧方法 有监督学习方法 无监督学习方法 基本思路 : 一个词的不同语义一般发生在不 同的上下文中 基于词典信息的消歧方法 宗成庆 : 自然语言理解 讲义, 第 10 章 55/97

56 10.6 词义消歧 有监督的词义消歧方法 总体思路 : 通过建立分类器, 利用划分多义词的上下文类别的方法来区分多义词的词义 基于互信息的消歧方法 (Brown et al., 1991) 基本思想 : 假设我们有一个双语对齐的平行语料库, 以法语和英语为例, 通过词语对齐模型每个法语单词可以找到对应的英语单词, 一个多义的法语单词在不同的上下文中对应多种不同的英语翻译 宗成庆 : 自然语言理解 讲义, 第 10 章 56/97

57 10.6 词义消歧 例子 : prendre une mesure to take a measure prendre une décision to make a decision 也就是说, 法语动词 prendre 可以被翻译成 to take, 也可以被翻译成 to make, 这取决于它所带的宾语是 mesure 还是 décision 宗成庆 : 自然语言理解 讲义, 第 10 章 57/97

58 10.6 词义消歧 可以把一个多义的法语单词的英语译词看作是这个法语单词的语义解释, 而决定法语多义词语义的条件看作是语义指示器 (indicator), 如 : 前面例子中法语单词 prendre 所带的宾语 因此, 只要我们知道了多义词的语义指示器, 也就确定了该词在特定上下文中的语义 这样, 多义词的词义消歧问题就变成了语义指示器的分类问题 假设 T 1, T 2,, T m 是一个多义法语词的英语译文 ( 或语义 ),V 1, V 2,, V n 是指示器可能的取值 宗成庆 : 自然语言理解 讲义, 第 10 章 58/97

59 10.6 词义消歧 利用 Flip-Flop 算法来解决指示器分类问题 ( 假设多义 法语词只有两个语义 ): (1) 随机地将 T 1, T 2,, T m 划分为两个集合 P={P 1, P 2 } (2) 执行如下循环 : (a) 找到 V 1, V 2,, V n 的一种划分 Q={Q 1, Q 2 }, 使 Q i 与 P i 之间的互信息最大 ; (b) 找到的一种改进的划分 P, 使 P 与 Q 的互信息 最大 宗成庆 : 自然语言理解 讲义, 第 10 章 59/97

60 宗成庆 : 自然语言理解 讲义, 第 10 章 60/ 词义消歧根据互信息的定义 : P x Q y y p x p y x p y x p Q P I ) ( ) ( ), ( ) log, ( ) ; ( 算法终止的条件自然是互信息不再增加或者增加甚少 ) ; ( Q P I

61 10.6 词义消歧 一旦指示器的取值划分确定了, 词义消解就变成 了如下简单的过程 : (1) 对于出现的歧义词确定其指示器值 V i ; (2) 如果 V i 在 Q 1 中, 指定该歧义词的语义为语 义 1, 如果在 Q 2 中, 指定其语义为语义 2 如果法语词有多个歧义的话, 扩展算法请见 : Peter F. Brown, Stephen A. Della Pietra et al., A Statistical Approach to Sense Disambiguation in Machine Translation, Proc. DARPA Workshop on Speech and Natural Language, 1991, pp 宗成庆 : 自然语言理解 讲义, 第 10 章 61/97

62 10.6 词义消歧 基于贝叶斯分类器的词义消歧方法 基于最大熵的词义消歧方法 参见本讲义第 2 章 2.3 节 宗成庆 : 自然语言理解 讲义, 第 10 章 62/97

63 10.6 词义消歧 基于词典的词义消歧方法 (1) 基于语义定义的消歧 基本思想 : 词典中词条本身的定义作为判断其语义的条件 宗成庆 : 自然语言理解 讲义, 第 10 章 63/97

64 10.6 词义消歧 例如,cone 在词典中有两个定义 : 一个是指 松树的球果, 另一个是指 用于盛放其他东西的锥形物, 比如, 盛放冰激凌的锥形薄饼 如果在文本中, 树 (tree) 或者 冰 (ice) 与 cone 出现在相同的上下文中, 那么, cone 的语义就可以确定了,tree 对应 cone 的语义 1,ice 对应 cone 的语义 2 宗成庆 : 自然语言理解 讲义, 第 10 章 64/97

65 10.6 词义消歧 (2) 基于义类辞典 (thesaurus) 的消歧 基本思想 : 多义词的不同义项在使用时往往具有不同的上下文语义类, 即通过上下文的语义范畴可以判断多义词的使用义项 宗成庆 : 自然语言理解 讲义, 第 10 章 65/97

66 10.6 词义消歧 如 crane 的两个词义 鹤 和 起重机 分别属于语义类 ANIMAL 和 MACHINERY 不同的语义类往往具有不同的上下文环境, 如 : 经常表示 ANIMAL 语义类的共现词语为 species family eat 等, 而表示 MACHINE 语义类的共现词语则为 tool engine blade 等 因此, 只要确定多义词的上下文词的义类范畴, 就确定了多义词的词义 宗成庆 : 自然语言理解 讲义, 第 10 章 66/97

67 10.6 词义消歧 (3) 基于双语词典的消歧 基本思想 : 需要消歧的语言称为第一语言, 把需要借助的另一种语言称为第二语言 建立多义词 x 与相关词 y 之间的搭配关系, 然后, 在第二种语言的语料库中统计对应 x 不同词义的翻译与相关词 y 的翻译同现的次数, 同现次数高的搭配对应的义项即为消歧后的词义 宗成庆 : 自然语言理解 讲义, 第 10 章 67/97

68 10.6 词义消歧 例如 : 单词 plant 有两个含义 : 植物 和 工厂 当对 plant 进行词义消歧时, 需要首先识别出含有 plant 的短语, 如 :manufacturing plant, 然后, 在汉语语料库中搜索与这个短语对应的汉语短语实例, 由于 manufacturing 的汉语翻译 制造 只和 工厂 共现, 因此, 可以确定在这个短语中 plant 的词义为 工厂 而短语 plant life 在汉语翻译中, 生命 (life) 与 植物 共现的机会更多, 因此, 可以确定在短语 plant life 中 plant 的词义为 植物 宗成庆 : 自然语言理解 讲义, 第 10 章 68/97

69 10.6 词义消歧 (4)Yarowsky 消歧算法基本思想 : 基于词典的词义消歧算法都是分别处理每个出现的歧义词, 且对歧义词有两个限制 : 每篇文本只有一个意义 : 在任意给定的文本中, 目标词的词义具有高度的一致性 ; 每个搭配只有一个意义 : 目标词和周围词之间的相对距离 词序和句法关系, 为目标词的意义提供了很强的一致性的词义消歧线索 宗成庆 : 自然语言理解 讲义, 第 10 章 69/97

70 10.6 词义消歧 在 Yarowsky 消歧算法中的处理方法 : (1) 对于第一个约束, 如果一个给定的多义词第一次出现时使用某个义项, 那么, 它在后面出现时也很有可能使用这个义项 (2) 对于第二个约束,Yarowsky (1995) 采用基于自举 (bootstrapping) 的 ( 半监督 ) 学习技术 搭配特征依据如下比率排序 : p( sk f ) 1 两个义项与特征同现的 其中, s ki p( s f ) k 2 次数之比 为词义,f 为搭配特征 宗成庆 : 自然语言理解 讲义, 第 10 章 70/97

71 10.6 词义消歧 无监督的词义消歧方法 H. Schütze (1998) 提出的上下文分组辨识 (contextgroup discrimination) 方法是无监督的词义消歧方 法的典型代表 与 (Gale, 1992) 方法类似, 对于一个具有 k 个义 项的词 w, 估计使用义项 ( k i 1) 出现词的概率, 即 j s i v p( v s ) j i 的上下文中 宗成庆 : 自然语言理解 讲义, 第 10 章 71/97

72 10.6 词义消歧 但是, 在该方法中参数 p( v s ) 的估计不是根据有标 注的训练语料, 而是在无标注的语料上进行, 开始时 随机地初始化参数, 然后根据 EM 算法重新估计该概率值 主要问题在于, 很多同义词的同一个意义出现的上下文往往有很大的差异, 因此, 很难保证同一个意义的上下文被划分到同一个等价类中 j i 宗成庆 : 自然语言理解 讲义, 第 10 章 72/97

73 10.6 词义消歧 为了解决这个问题,H. Schütze (1992) 对词汇集中的每一个词 w 定义了关联向量 (associate vector), 该向量为 w 的 平均上下文 上标表示词汇集中的词形 (type), 如 表示词汇集中的第 j 个 词 ; 下标表示一个词在语料库中的一次具体使用, 简称为 w k 词用 (token), 表示语料库中的第 k 个词 ;n 为词的个数, c j 1 2 A ( w) ( wk, w ) ck, ck,, c j n i 1 j 即语料库大小 ; k为词形 w 出现在 w k 的上下文中的次数 ; ( x, y) 为 Kronecker 函数 w j w k 宗成庆 : 自然语言理解 讲义, 第 10 章 73/97

74 10.6 词义消歧 关于该工作的详细介绍请参阅 : [Schütze, 1992a] Schütze, Hinrich Context Space. In Working Notes of the AAAI Fall Symposium on Probabilistic Approaches to Natural Language, Menlo Park, CA. AAAI Press. Pages [Schütze, 1992b] Schütze, Hinrich Word Sense Disambiguation with Sublexical Representation. In Proceedings of the 1992 AAAI Workshop on Statisticallybased Natural Language Programming Techniques. Pages 宗成庆 : 自然语言理解 讲义, 第 10 章 74/97

75 10.6 词义消歧 严格地讲, 利用完全无监督的消歧方法进行词义标注是不可能的, 因为词义标注毕竟需要提供一些关于语义特征的描述信息 但是, 词义辨识 (word sense discrimination) 却可以利用完全无监督的机器学习方法实现 宗成庆 : 自然语言理解 讲义, 第 10 章 75/97

76 10.7 语义角色标注 宗成庆 : 自然语言理解 讲义, 第 10 章 76/97

77 10.7 语义角色标注 语义角色标注 (semantic role labeling, SRL) 的任务 自动语义角色标注方法是近几年来国际研究的热点, 其基本任务是以句子为分析单位, 以句子中的谓词为核心, 分析句子中的其他成分与谓词之间的关系 如 : [ 他们 ] Agent [ 昨天 ] Time [ 在北京 ] Location [ 讨论 ] Pred 了 [ 方案 ] Patient 语义角色标注一般是在句法分析的基础上进行的 宗成庆 : 自然语言理解 讲义, 第 10 章 77/97

78 10.7 语义角色标注 SRL 的主要用途 : 信息抽取 自动文摘 机器翻译等 目前用于 SRL 研究的主要资源有 : 框架网 (FrameNet) 英语命题库 (Proposition Bank, PropBank) 英语名词命题库 (NomBank) 宗成庆 : 自然语言理解 讲义, 第 10 章 78/97

79 10.7 语义角色标注 语义角色标注的基本流程 : 给定句子句法分析结果句法分析器 尽量减少候选项的数目 候选论元剪除 SRL 结果 后处理 论元标注 论元识别 删除重复论元等 标注过程 : 多类分类问题 识别真正的论元 : 两类分类问题 宗成庆 : 自然语言理解 讲义, 第 10 章 79/97

80 10.7 语义角色标注 1. 基于短语结构句法分析的 SRL 方法 (Xue and Palmer, 2004) 剪除方法 : 第 1 步 : 将谓词作为当前节点, 依次考察它的兄弟节点 : 如果一个兄弟节点和当前节点在句法结构上不是并列的 (coordinated) 关系, 则将它作为候选项 如果该兄弟节点的句法标签是 PP, 在将它的所有子节点也都作为候选项 第 2 步 : 将当前节点的父节点设为当前节点, 重复第 1 步的操作, 直至当前节点是句法树的根节点 宗成庆 : 自然语言理解 讲义, 第 10 章 80/97

81 10.7 语义角色标注 并列结构 宗成庆 : 自然语言理解 讲义, 第 10 章 81/97

82 10.7 语义角色标注 论元识别和标注 : 在论元识别和标注阶段, 最重要的工作是为分类器选择有效的特征 常用的一些有效特征有 : 谓词 (predicate) 谓词本身 路径 (path): 句法树上从论元到谓词的路径, 如上面图中的 A0 论元到谓词的路径就是 : NP IP VP VP VP VV 宗成庆 : 自然语言理解 讲义, 第 10 章 82/97

83 10.7 语义角色标注 短语类型 (phrase type): 论元所对应的句法树节点的句法标签 位置 (position): 论元出现在谓词之前还是之后 语态 (Voice): 谓词是主动语态还是被动语态 中心词 (Head Word): 论元的中心词及其词性 从属类别 (Sub-categorization): 展开谓词父节点的上下文无关规则, 如前面图中谓词的从属类别就是 VP ADVP ADVP VP 论元的第一个和最后一个词 宗成庆 : 自然语言理解 讲义, 第 10 章 83/97

84 10.7 语义角色标注 组合特征 (Combination features): 谓词 + 中心词, 谓词 + 短语类型等 分类器 : 最大熵 SVM 感知机等 宗成庆 : 自然语言理解 讲义, 第 10 章 84/97

85 10.7 语义角色标注 2. 基于依存关系的 SRL 方法 与基于短语结构句法分析的 SRL 方法的区别 : 基于短语结构句法分析的语义角色标注方法中, 一个论元被表示为连续的几个词和一个语义角色标签 但在基于依存句法分析的语义角色标注中, 一个论元被表示为一个中心词和一个语义角色标签 因此, 在这种方法中, 谓词论元关系可以表示为谓词与论元的中心词之间的关系 宗成庆 : 自然语言理解 讲义, 第 10 章 85/97

86 10.7 语义角色标注 依存关系 调查 的论元关系 宗成庆 : 自然语言理解 讲义, 第 10 章 86/97

87 10.7 语义角色标注 剪除方法 : 第 1 步 : 将谓词作为当前节点, 将它所有的孩子都作为候选项 第 2 步 : 将当前节点设为它的父节点, 重复第 1 步的操作, 直到当前节点是依存句法树的根节点 宗成庆 : 自然语言理解 讲义, 第 10 章 87/97

88 10.7 语义角色标注 谓词 调查 的所有孩子 { 正在, 详细, 原因, 警察 } 都加入到候选项中 这里该些孩子恰好是该谓词的所有论元 宗成庆 : 自然语言理解 讲义, 第 10 章 88/97

89 10.7 语义角色标注 从上述过程可以看出, 基于依存句法的语义角色标注最终都是在判断谓词和候选的词之间的关系 于是, 无论是论元识别还是论元标注, 其核心都是判断一对词之间的关系 论元识别和论元标注都被作为分类问题 几种最常用的特征包括 : 谓词 (predicate): 谓词本身及其词根 谓词的词义 : 谓词在语料中的词义类别 谓词词性 (predicate POS): 谓词的词性 谓词父节点的词及词性 谓词与其父节点之间的依存关系类别 宗成庆 : 自然语言理解 讲义, 第 10 章 89/97

90 10.7 语义角色标注 依存关系路径 (relation path): 依存句法树上从候选词到谓词的路径 ; 例如上图中从 事故 到谓词的路径就是 NMOD OBJ 位置 (position): 论元出现在谓词之前还是之后 语态 (voice): 谓词是主动语态还是被动语态 从属类别 (dependency sub-categorization): 谓词的所有孩子对它的依存关系, 如上图中谓词 调查 的依存从属类别是 SBJ_VMOD_VMOD_OBJ 候选词本身 候选词最左边和最右边的孩子的词与词性 候选词左边和右边最近的兄弟的词与词性 宗成庆 : 自然语言理解 讲义, 第 10 章 90/97

91 10.7 语义角色标注 3. 基于语块分析的 SRL 方法 用语块分析 (Chunking) 的结果来进行语义角色标注 谓词 - 论元关系的表示方法与基于短语句法分析中的表示方法相同, 每一个论元都表示为连续的几个词 将语义角色标注作为一个序列标注 基本思路 : 将语义角色标注作为一个序列标注问题来解决 一般采用 IBO 的方式来定义序列标注的标签集, 将不同的语块赋予不同的标签 不需要剪除候选论元, 论元识别和标注同时进行 宗成庆 : 自然语言理解 讲义, 第 10 章 91/97

92 举例 : 10.7 语义角色标注 宗成庆 : 自然语言理解 讲义, 第 10 章 92/97

93 10.7 语义角色标注 其他方法 : 多种方法的融合策略 基于深度信念网络 (deep belief network, DBN) 的 SRL 方法 宗成庆 : 自然语言理解 讲义, 第 10 章 93/97

94 10.7 语义角色标注 现有方法存在的主要问题 : 对句法分析器性能的严重依赖性 领域适应能力差 基本性能 : 英语 汉语 :F1 值大约为 : 70 % 左右 (68%~76%) 宗成庆 : 自然语言理解 讲义, 第 10 章 94/97

95 本章小结 语义分析的基本任务及其面临的困难 语义计算研究概括及常见的语义理论 格语法 ( 定义 格框架约束分析 ) 语义网络 ( 概念 关系 语义网络表示 事件的语义关系 基于语义网络的推理分析 ) CD 理论 ( 三个层次 : 基本动作 剧本 计划 ) 词义消歧 ( 规则方法 统计方法 词典法 ) 语义角色标注的基本概念和方法 宗成庆 : 自然语言理解 讲义, 第 10 章 95/97

96 习题 阅读有关 HowNet 和 HNC 理论的文献, 了解相关工作及其 同义词词林 在自然语言处理中的应用 了解蒙塔格语法 (Montague Grammar) 阅读有关词义消歧的论文, 了解词义消歧的相关工作 阅读有关语义角色标注的论文, 了解相关工作 宗成庆 : 自然语言理解 讲义, 第 10 章 96/97

97 Thanks 谢谢! 宗成庆 : 自然语言理解 讲义, 第 10 章 97/97

, CAS-IA

, CAS-IA ( 10 ) cqzong@nlpr.ia.ac.cn http://www.nlpr.ia.ac.cn/english/cip/cqzong.htm No.95, Zhongguancun East Road Beijing 100080, China http://www.ia.ac.cn Tel. No.: +86-10-6255 4263 , CAS-IA 2004-5-13 2 10.1

More information

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A83130A3A9D3EFD2E5BCC6CBE32E707074>

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A83130A3A9D3EFD2E5BCC6CBE32E707074> 第 10 章语义计算 No.95, Zhongguancun East Road Beijing 100080, China http://www.ia.ac.cn Tel. No.: +86-10-6255 4263 10.1 概述 10.1 概述 语义计算的任务 : 解释自然语言句子各个部分 ( 词 词组及句子 ) 的意义 面临的困难 : (1) 自然语言句子中存在大量的歧义, 涉及指代 同义

More information

PowerPoint Presentation

PowerPoint Presentation 第 10 章语义分析 北京市海淀区中关村东路 95 号 邮编 :100190 电话 : +86-10-8254 4688 邮件 :cqzong@nlpr.ia.ac.cn 10.1 概述 宗成庆 : 自然语言处理 讲义, 第 10 章 2/125 10.1 概述 语义计算的任务 : 解释自然语言句子或篇章各部分 ( 词 词组 句子 段落 篇章 ) 的含义 面临的困难 : 自然语言句子中存在大量的歧义,

More information

+$ 6" 空格前是动词 " 因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此

+$ 6 空格前是动词  因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此 选词填空练习参考答案和解析 /$3 分析句子结构 空格处应填动词谓语 " 明显是一个定语从句 且时态是现在式 因此空格处应填的动词应是动词现在式 再从语义上分析 只有 反映 合适 *$ 空格前是一个形容词 后面是介词 因此只能填名词 而且应该是单数 $ 空格前是形容词 因此应填名词或代词 仔细分析句子 可以判断 "! 在句中作动词 从词义搭配上来看 只有 合适.$8 &"! 空格前是介词 #" 而后面则一个逗号

More information

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 Cet 4 大学英语四级翻译 Jesse Yang Lu Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 I am a student. 基本句式 I am a student. 基本句式 I am beautiful. I am a student. 主系表 基本句式

More information

PowerPoint Presentation

PowerPoint Presentation (Chinese FrameNet CFN) Web CFN , 80 MT IE WSD (1) PropbankPenn TreeBank 50 1999 Sinica Treebank (2) Schank(1975) Conceptual Dependency, CD (3) Fillmore Frame WordNet MindNet ILD FrameNet HowNet CCD 1

More information

Microsoft PowerPoint - 诓敧-8.19

Microsoft PowerPoint - 诓敧-8.19 考研英语二语法与长难句 王丽 关于词的那些事 1 学习目标 什么是词? 什么是语? 英语中的词性有哪些? 每种词性最重要的使用规则是什么? 什么是词? 什么是语? 单词 : persistence [pəˈsistəns] n. 坚持不懈 句子 : Persistence is the key to success. 坚持不懈是成功的关键 句法核心 :XX 词在句中作 XX 语 词 : 词性, 每个单词自然属性

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

并非没有必要的一些宏观思考

并非没有必要的一些宏观思考 第 一 章 引 论 第 一 章 引 论 1.1 课 题 的 提 出 1 本 课 题 的 研 究 工 作 是 尝 试 在 句 法 和 语 义 两 个 层 级 上 归 纳 现 代 汉 语 短 语 结 构 的 组 合 规 则, 解 决 计 算 机 分 析 现 代 汉 语 短 语 时 碰 到 的 结 构 歧 义 问 题 有 别 于 以 往 主 要 是 面 向 人 的 语 法 研 究, 本 课 题 的 研 究

More information

控儔湮悝笢恅炵蔡釱 2005爛3堎28

控儔湮悝笢恅炵蔡釱 2005爛3堎28 2005 3 28 讲 认础 统 论 学 1. 2. - - 语 语 语义 - - - - Pinker 1999: 298-299 - - the mind competence system - - performance systems Chomsky 2000: 28 competence as a generative procedure Chomksy I-Language (1993/1995,

More information

22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research IF: Interchange Format [12] C-STAR IF 1. IF IF [14

22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research IF: Interchange Format [12] C-STAR IF 1. IF IF [14 Journal of Chinese Language and Computing, 14 (1) 21-34 21 100080 {caowj, cqzong, xubo}@nlpr.ia.ac.cn 1 22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research

More information

幻灯片 1

幻灯片 1 Custom makes all things easy! 本讲任务 一. 人称代词主格, 宾格 二. 形容词性物主代词与名词性物主代词 三. 反身代词 一. 人称代词 主格, 宾格 句子成分 I broke two windows. 句子成分 I broke two windows. 句子成分 I broke two windows. 主语 句子成分 I broke two windows. 主语

More information

数理逻辑 I Mathematical Logic I

数理逻辑 I  Mathematical Logic I 前情提要 前情提要 我们定义了两种 可定义 概念结构内的可定义性 : 给定结构关于该结构论域上的 k 元关系的性质由一个公式定义定义结构类 : 给定语言关于该语言的结构类的由一则闭语句定义 ( 初等类 ); 由一集闭语句定义 ( 广义初等类 ) 前情提要 我们定义了两种 可定义 概念结构内的可定义性 : 给定结构关于该结构论域上的 k 元关系的性质由一个公式定义定义结构类 : 给定语言关于该语言的结构类的由一则闭语句定义

More information

器之 间 向一致时为正 相反时则为负 ③大量电荷的定向移动形成电 流 单个电荷的定向移动同样形成电流 3 电势与电势差 1 陈述概念 电场中某点处 电荷的电势能 E p 与电荷量 q Ep 的比值叫做该点处的电势 表达式为 V 电场中两点之间的 q 电势之差叫做电势差 表达式为 UAB V A VB 2 理解概念 电势差是电场中任意两点之间的电势之差 与参考点的选择无关 电势是反映电场能的性质的物理量

More information

深教〔2013〕 号

深教〔2013〕   号 深 教 2015 120 号 深 圳 市 教 育 局 关 于 公 布 2014 年 中 小 学 优 质 课 例 视 频 资 源 建 设 获 奖 单 位 和 个 人 名 单 的 通 知 各 区 教 育 局 各 新 区 公 共 事 业 局, 市 局 直 属 各 学 校 : 我 局 2014 年 开 展 的 中 小 学 优 质 课 例 视 频 资 源 征 集 及 在 线 展 播 活 动 第 二 届 微 课

More information

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending]

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending] Ch. 7 形容词 [Adjectives]: 目标 有些教科书要求掌握形容词的屈折变化 我的课不要求 你需要掌握的内容 : 1. 基于形容词的字尾识别其性和数 2. 找出形容词的词典形 3. 识别形容词在上下文中的具体用法 ( 名词 [substantival], 谓语 [predicate], 或属性 [attributive]). 4. 根据不同的用法翻译形容词 7-1 Ch. 7 形容词 [Adjectives]:

More information

Microsoft PowerPoint - 8.第喫竀主仔呥义咓诓敧仔呥

Microsoft PowerPoint - 8.第喫竀主仔呥义咓诓敧仔呥 考研英语二语法与长难句 王丽 学习目标 什么是名词性从句? 名词性从句分为几类? 名词性从句引导词的用法? 名词性从句的位置? 1 名词 名词 : 表示人或事物的名称的词 名词在句中充当什么成分? Tom majors in chemistry. My brother, Tom, is a teacher. The handsome man is Tom. She dislikes Tom. 名词性从句的分类

More information

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作 * 夏传玲 : 本文简要回顾了国内外定性研究在最近 多年的发展概况, 总结 了定性研究的六个发展趋势和分析策略上的三种流派 在上述两种背景下, 本文探讨了计算机辅助的定性分析给定性研究带来的机遇和挑战, 特别是它和手工操作对比时的优势和劣势, 以及应用这种定性分析技术所可能面临的困难 : 定性研究定性分析 文化差异,, (, ),,,, ( - ) ( - ) ( - ) ( - ) ( - ) (

More information

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai ATR-SLT (Advanced Telcommunications Research Institute Internat

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai ATR-SLT (Advanced Telcommunications Research Institute Internat Journal of Chinese Language and Computing 12(1)63-77 63 语译 汉语语 写 + * * 2 * * * + 100080, 2728 cqzong@nlpr.ia.ac.cn * ATR 619-0288 {yujie.zhang, kazuhide.yamamoto, masashi.sakamoto, satoshi.shirai}@atr.co.jp

More information

穨想覺得認為以為.PDF

穨想覺得認為以為.PDF -- d898702@oz.nthu.edu.tw mliu@cc.nctu.edu.tw -- (MARVS) 1. ( 1982) 1997 1988 1991 1986 1996 1 ( ) ( ) 2 1 2 3 4 5 6 1 2 6,005 4,132 719 4,441 Huang et al (2000) (Module-Attribute Representation of Verbal

More information

! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $ %% " $ "--/

!  #   $ %   # #  $  #  #!  $ ! # # # #! &$! ( % !!! )$ %  (!!!! *$ ( %  (!!!! +$ %  #! $!, $ $ $ $ $ $ $, $ $ --. %/ % $ %%  $ --/ "##$ "% "##& " "##( )$ "##%! ) "##$ * "##( "##$ "##(!!!!!!!!! ! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $

More information

: 1, ( high2accessibil2 ity),,,,,, : (3),,,,!,,? :,!?? ( ) ( ),, :?? ( ),,,,, (3),,,,,,,, : (4) a., :,, b.,,:,,, (4aΠb),,,,,,, 2 + + N + V + + N + V,

: 1, ( high2accessibil2 ity),,,,,, : (3),,,,!,,? :,!?? ( ) ( ),, :?? ( ),,,,, (3),,,,,,,, : (4) a., :,, b.,,:,,, (4aΠb),,,,,,, 2 + + N + V + + N + V, 2002 1 ( 59 ) Ξ + + Np + V + + Np + V, + + Np + V+ Np, + + Np + V : 0 (1) a.,,, b.,,,, ( ) (2) a.???, b. (,1985) (1a) (1b) ; (2a) (2b),,,, (1a) (2a),, (1b) (2b),,,,,,,? Ξ,, 18 : 1, ( high2accessibil2 ity),,,,,,

More information

博士论文答辩报告.ppt

博士论文答辩报告.ppt 博士论文答辩报告 树到串统计翻译模型研究 答辩人 : 刘洋 指导教师 : 林守勋研究员 时间 :2007 年 6 月 16 日 提纲 引言 词语对齐的对数线性模型 树到串统计翻译模型 模型 1 模型 2 模型 3 实验 总结 MT Strategies (1954-2004) Knowledge Acquisition Strategy All manual Electronic dictionaries

More information

Genius English Grammar Glossary

Genius English Grammar Glossary www.alo7.com INDEX abbreviation 缩略语... 3 action verb 行为动词... 3 active voice 主动语态... 3 adjective 形容词... 3 adjective, comparative 形容词比较级... 3 adjective, demonstrative 指示形容词... 3 adjective, superlative 形容词最高级...

More information

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC>

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC> 句子对齐算法介绍 Weigang I IRab, HIT 2002-11-6 对齐的算法的简单描述 给定双语语料, 在所有可能的对齐中找出概率最大的对齐如用公式表示, 就有 arg max P A / S, T α 其中 A 是对齐文本,S 和 T 分别是英语和汉语文本 一个对齐的例子 英语文本 Most of us, however, take life for granted. We know

More information

山 东 大 学 博 士 学 位 论 文 晚 清 四 大 谴 责 小 说 词 汇 研 究 姓 名 : 张 威 申 请 学 位 级 别 : 博 士 专 业 : 汉 语 言 文 字 学 指 导 教 师 : 杨 端 志 20080415 山东大学博士学位论文

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 多策略的机器翻译 王海峰 2006 年 11 月 21 日 提纲 概述 东芝的机器翻译研究 概况 规则方法 实例方法 统计方法 其它 多种方法的融合 讨论与展望 Page 2 三种主流机器翻译方法 对语言规律良好的概括和描述能力 规则方法 机器翻译产品仍以规则系统为主 仍有不断提高的潜力 (Zhu. 2005) 实例方法 统计方法 对相似句子相当精确的翻译能力 依然活跃 (MT Journal, MT

More information

第三章 语义解释

第三章 语义解释 谢炯坤 中国科学技术大学 多智能体系统实验室 语义解释 语义解释存在的问题 句法和语义的衔接 常见的语言现象 指代 论旨角色 (Thematic Role) 语义网络 (Semantic Network) 语义解释 语义解释存在的问题 句法和语义的衔接 常见的语言现象 指代 论旨角色 (Thematic Role) 语义网络 (Semantic Network) 句法和语义的衔接 上下文无关意义的表示称为逻辑形式

More information

数理逻辑 I Mathematical Logic I

数理逻辑 I  Mathematical Logic I 前情提要 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理一阶逻辑特色的元定理

More information

112 V1 V2 (nativespeaker) V1 V2 : (1) 獉獉 ( ) (2) (2010 ) 獉獉 (3) 獉獉 ( ) 獉獉 V1 V2 V R V R V R ( ) V1 V2 ( ) Li(1990) (1993) (1995) ( ) (2001) (2

112 V1 V2 (nativespeaker) V1 V2 : (1) 獉獉 ( ) (2) (2010 ) 獉獉 (3) 獉獉 ( ) 獉獉 V1 V2 V R V R V R ( ) V1 V2 ( ) Li(1990) (1993) (1995) ( ) (2001) (2 * : ( ) ( V1V2) ( V R) V1 V2 : (1)V1 V2 ;(2)V1 V2 ;(3)V1 V2 : ; ; ; ; (a) (b) (c) (d) a b c d (2005) ( V1V2) ( V1 V2 V R 1 ) * ( : 111098) ( :12YJA740104) 1 V ( ) V R; V1 V2 112 V1 V2 (nativespeaker) V1

More information

基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 ) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干,

基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 ) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干, 基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 830054) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干, 提高名词识别效率 首先陈述形态分析概念和通过这些形态特征可以准确地识别其词性的意义 其 次讨论维吾尔语的词类划分标准

More information

MAXQ BA ( ) / 20

MAXQ BA ( ) / 20 MAXQ BA11011028 2016 6 7 () 2016 6 7 1 / 20 1 2 3 4 () 2016 6 7 2 / 20 RoboCup 2D 11 11 100ms/ 1: RoboCup 2D () 2016 6 7 3 / 20 2: () 2016 6 7 4 / 20 () 2016 6 7 5 / 20 Markov Decision Theory [Puterman,

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

数学分析(I)短课程 [Part 2] 4mm 自然数、整数和有理数

数学分析(I)短课程 [Part 2]   4mm 自然数、整数和有理数 .. 数学分析 (I) 短课程 [Part 2] 自然数 整数和有理数 孙伟 华东师范大学数学系算子代数中心 Week 2 to 18. Fall 2014 孙伟 ( 数学系算子代数中心 ) 数学分析 (I) 短课程 Week 2 to 18. Fall 2014 1 / 78 3. 自然数理论初步 孙伟 ( 数学系算子代数中心 ) 数学分析 (I) 短课程 Week 2 to 18. Fall 2014

More information

2 形 式 方 法 刻 画 动 词 的 意 义 和 所 有 科 学 一 样, 作 者 认 为 人 们 理 解 语 言 是 有 一 些 不 需 要 解 释 的 语 义 初 始 点 的, 计 算 机 也 一 样 一 个 完 整 的 语 义 平 台 应 该 包 含 所 有 的 语 义 初 始 点 以 及

2 形 式 方 法 刻 画 动 词 的 意 义 和 所 有 科 学 一 样, 作 者 认 为 人 们 理 解 语 言 是 有 一 些 不 需 要 解 释 的 语 义 初 始 点 的, 计 算 机 也 一 样 一 个 完 整 的 语 义 平 台 应 该 包 含 所 有 的 语 义 初 始 点 以 及 从 事 件 语 义 学 角 度 分 析 动 词 的 形 式 化 方 法 张 文 彦 我 打 算 采 用 形 式 语 义 学 的 办 法 来 研 究 动 词, 而 动 词 语 义 结 构 又 和 事 件 语 义 学 的 研 究 密 切 相 关 所 以 这 次 报 告 我 们 主 要 来 看 一 下 事 件 语 义 学 的 内 容 以 及 相 关 学 者 们 对 事 件 语 义 学 中 的 一 些 理

More information

工程合同管理 一 民事法律关系概述 1-1 主体 拥有权利承担义务的当事人 法律关系三要素 客体 当事人权利义务所指的对象 内容 具体的权利和义务的内容 图 1-1 法律关系的构成要素

工程合同管理 一 民事法律关系概述 1-1 主体 拥有权利承担义务的当事人 法律关系三要素 客体 当事人权利义务所指的对象 内容 具体的权利和义务的内容 图 1-1 法律关系的构成要素 学习目标 1. 2. 3. 4. 5. 导言 第一节民事法律关系 工程合同管理 一 民事法律关系概述 1-1 主体 拥有权利承担义务的当事人 法律关系三要素 客体 当事人权利义务所指的对象 内容 具体的权利和义务的内容 图 1-1 法律关系的构成要素 1. 2. 2 3. 1 2 3 4 3 工程合同管理 1-1 A. B. C. D. C C C A B D 二 民事法律行为的构成要件 1. 1-1

More information

006 2014 年 第 6 期 总 第 322 期 一 寻 找 博 尔 赫 斯 向 中 心 汇 聚 过 来 的 街 道, 五 条 街 道, 六 条 街 道, 我 在 水 中 央 仿 佛 一 朵 莲 花 盛 开, 有 千 万 片 花 瓣 在 摇 曳 舒 展 不 知 道 该 往 哪 个 方 向 走 布

006 2014 年 第 6 期 总 第 322 期 一 寻 找 博 尔 赫 斯 向 中 心 汇 聚 过 来 的 街 道, 五 条 街 道, 六 条 街 道, 我 在 水 中 央 仿 佛 一 朵 莲 花 盛 开, 有 千 万 片 花 瓣 在 摇 曳 舒 展 不 知 道 该 往 哪 个 方 向 走 布 005 葛 芳,1975 年 出 生 于 江 苏 江 阴 中 国 作 家 协 会 会 员, 江 苏 省 作 家 协 会 签 约 作 家, 获 紫 金 山 文 学 奖 和 冰 心 散 文 奖 鲁 迅 文 学 院 第 十 九 届 中 青 年 作 家 高 研 班 学 员 著 有 散 文 集 空 庭 隐 约 江 南 中 短 篇 小 说 集 纸 飞 机 现 居 苏 州 实 力 作 家 向 南 极 眺 望 葛

More information

Dependency Grammar) 特征结构理论 (Feature Structure Theory), 选取汉语动补结构的十五种语义关系类型 ( 吕叔湘,1980) 进行了形式化的描述和语义分析, 与传统依存语法的方法进行对比, 得到了比较好的结果 2 汉语动补结构语义研究简介 2.1 语言学

Dependency Grammar) 特征结构理论 (Feature Structure Theory), 选取汉语动补结构的十五种语义关系类型 ( 吕叔湘,1980) 进行了形式化的描述和语义分析, 与传统依存语法的方法进行对比, 得到了比较好的结果 2 汉语动补结构语义研究简介 2.1 语言学 基于扩展依存语法模型的汉语动补结构语义标注研究 * 陈波 12, 吕晨 2, 姬东鸿 2 (1. 湖北文理学院文学院, 湖北襄阳 441053;2. 武汉大学计算机学院, 湖北武汉 430072) 摘要 : 汉语的动补结构中主 宾 动 补四个成分之间的语义关系错综复杂, 自然语言处理很难对动补结构的语义关系进行完整的形式化描述 本文提出了一个新颖的扩展依存语法模型, 运用特征结构的方法形式化地描述动补结构中的主

More information

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5>

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5> 中文自然语言处理平台 FudanNLP: 从词法到句法, 再到语义 报告人 : 邱锡鹏 xpqiu@fudan.edu.cn http://jkx.fudan.edu.cn/~xpqiu/ 提纲 1 FudanNLP 系统介绍 2 算法原理 3 词法 句法 语义 FudanNLP 系统介绍 设计目标 为中文自然语言处理研发一个开源平台, 使用统一框架, 集成先进研究成果, 降低中文分析门槛, 促进中文自然语言处理的发展

More information

Microsoft Word - 5-王慧兰.doc

Microsoft Word - 5-王慧兰.doc 北京大学学报 ( 自然科学版 ), 第 49 卷, 第 1 期, 2013 年 1 月 Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 49, No. 1 (Jan. 2013) 汉语句类依存树库的构建研究 王慧兰 解放军外国语学院二系, 洛阳 471003; E-mail: hlwang9@hotmail.com 摘要以机器翻译领域为应用目标,

More information

A B A B S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * X Y

A B A B S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * X Y * / 1. 1 + + + 1 NPL + V + + NP A 1 B 5 2 6 3 7 4 8 * 1 2009. 10 557 24 2010 4 1996 2001 2001 2005 2006 2006 A B A B 2003 64 S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * 11 12 1. 2 1 + +

More information

北京大学

北京大学 北京大学 博士学位论文 面向中文信息处理的现代汉语短语结构规则研究 A Study of Constructing Rules of Phrases in Contemporary Chinese for Chinese Information Processing 姓 名 : 詹卫东 学 号 : 19620822 系 别 : 中国语言文学系 专 业 : 现代汉语 研究方向 : 计算语言学 导 师

More information

第三讲非谓语动词之动词不定式 1. to arrive 解析 :to arrive 作 one 的定语 2. to love and to be loved 3. to be working 解析 :pretend to be doing sth. 假装正在做某事 4.to finish 解析 :i

第三讲非谓语动词之动词不定式 1. to arrive 解析 :to arrive 作 one 的定语 2. to love and to be loved 3. to be working 解析 :pretend to be doing sth. 假装正在做某事 4.to finish 解析 :i 第一讲句子成分简析 答案与解析 I.1. People s living standards are going up steadily. 定语定语主语谓语状语 2.The nursery takes good care of our children. 主语谓语定语宾语 3.I have a lot of work to do. 主语谓语定语宾语后置定语 II.1. achievement 解析

More information

Worksheet 2: The Complete Subject To identify complete subjects. To discover that a subject is the part of a sentence that tells whom or what the sent

Worksheet 2: The Complete Subject To identify complete subjects. To discover that a subject is the part of a sentence that tells whom or what the sent Worksheet 1: What is a sentence? To discover that a sentence is a group of words that tells a complete thought. To identify complete sentences and to add words to make incomplete sentences complete. Read

More information

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An - 23 5 2009 9 J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G Vol. 23, No. 5 Sep., 2009 : 100320077 (2009) 0520009210, (,) :,, ;,,,, ;,, : ;; ;;; : TP391 : A A Semantic Construction Model bet ween Adjectives

More information

<4D6963726F736F667420576F7264202D20CDB6D7CAD5DFB1A3BBA4B5E4D0CDB0B8C0FDA3A831322D3234A3A9>

<4D6963726F736F667420576F7264202D20CDB6D7CAD5DFB1A3BBA4B5E4D0CDB0B8C0FDA3A831322D3234A3A9> 案 例 12 信 披 错 漏 引 震 荡 规 范 披 露 保 公 平 为 顺 应 某 市 政 府 城 市 中 心 区 退 二 进 三 整 体 规 划 的 需 要,B 上 市 公 司 将 位 于 城 市 中 心 区 域 的 旧 厂 区 生 产 线 逐 步 搬 迁 到 市 郊 和 省 外 开 发 区 2012 年 7 月, 公 司 在 完 成 旧 厂 区 的 搬 迁 后, 与 土 地 管 理 部 门 签

More information

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是 还是 ) 动词 有

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是 还是 ) 动词 有 汉语依存句法树库构建标注规范 此规范还未正式发表 未经编者允许, 请不要转发或传播 参与编者 : 李正华郭丽娟龚晨张月 zhli13@suda.edu.cn 年 月 日版本自 年 月开始编制 苏州大学人类语言计算研究所 目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解

More information

級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師

級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師 李 志 達 紀 念 學 校 15-16 年 度 二 年 級 家 會 級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師 校 致 辭 讓 學 生 成 為 有 用 的 人 成 才 的 孩 子, 他 們 都 做 過 同

More information

标注体系以及标注特点, 树库包含的标注信息决定 了树库已开发的以及潜在的应用领域 从句法标注层面来看, PennCTB 以乔姆斯基的 短语结构语法为理论基础, 标注了句子的层次关 系 短语的结构类型 功能类型以及词语的词类 [2] 采用的词类标注集共包含 33 种词类标记符, 将动 词 形容词作为一

标注体系以及标注特点, 树库包含的标注信息决定 了树库已开发的以及潜在的应用领域 从句法标注层面来看, PennCTB 以乔姆斯基的 短语结构语法为理论基础, 标注了句子的层次关 系 短语的结构类型 功能类型以及词语的词类 [2] 采用的词类标注集共包含 33 种词类标记符, 将动 词 形容词作为一 Acta Scientiarum Naturalium Universitatis Pekinensis 汉语句类依存树库的构建研究 王慧兰 解放军外国语学院二系, 洛阳 471003; E-mail: hlwang9@hotmail.com 摘要以机器翻译领域为应用目标, 以概念层次网络理论的语义网络和句类分析方法为理论基础, 探讨句类依存树库构建的理论和标注实践等问题, 详细描述了构建树库所需的概念类别标注集和句类关系标注集,

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 The BitCoin Scripting Language 交易实例 交易结构 "result": { "txid": "921a dd24", "hash": "921a dd24", "version": 1, "size": 226, "locktime": 0, "vin": [ ], "vout": [ ], "blockhash": "0000000000000000002c510d

More information

南華大學數位論文

南華大學數位論文 I II Abstract This study aims at understanding and analysing the general situation and predicament of current educational development in Savigi tribe and probing the roles played by the school, the family

More information

Microsoft PowerPoint - 10,.盹æ®−呥垉-åŁ¦çflŁç›‹æœ¬

Microsoft PowerPoint - 10,.盹æ®−呥垉-åŁ¦çflŁç›‹æœ¬ 考研英语二语法与长难句 王丽 学习目标 什么是强调句? 构建强调句的方法有哪些? 什么是倒装句? 倒装句的分类和使用规则有哪些? 什么是否定句? 包含否定词汇的句子如何理解? 1 强调句 定义 : 一种修辞手法, 突出句中的部分内容 三种构成手段 : 解密强调句 词汇手段 规则 1.1: 在谓语动词前使用助动词 do 表示强调 原形 :I appreciate your help. 强调 : 原形

More information

第一章

第一章 6.1 1. N-gram 2. 3. 4. 60 6.2 4.114.13 4.124.14 Rong Jin[7] TF*IDF - SARS SARS SARS SARS 61 62 [1] Michele Banko, Vibhu O. Mittal, and Michael J. Witbrock. 2000. Headline Generation Based on Statistical

More information

YSSNLP2013 会议报告 构式语法标注规范与系统初探 --- 读王寅 构式语法研究 有感 陈清才 哈尔滨工业大学深圳研究生院 2013/05/31

YSSNLP2013 会议报告 构式语法标注规范与系统初探 --- 读王寅 构式语法研究 有感 陈清才 哈尔滨工业大学深圳研究生院 2013/05/31 YSSNLP2013 会议报告 构式语法标注规范与系统初探 --- 读王寅 构式语法研究 有感 陈清才 qingcai.chen@gmail.com 哈尔滨工业大学深圳研究生院 2013/05/31 主要内容 从生成语法到构式语法构式的基本概念 CxG 语法分析 CxG 形式化描述与标注规范 CxG 标注例子与系统 从生成语法到构式语法 20 世纪 60 年代, 乔姆斯基的标准理论 Standard

More information

论中日 囚徒困境 的存在及逃逸 马亚华 本文试图用博弈论方法分析中日关系发生困难的原因 并在此基础上提出一点解决问题的思路 目前中日关系已在重复博弈中陷入了 囚徒困境 状态 囚徒困境 不仅为第三方势力提供了渔利的空间 直接损害了两国战略利益 而且其 溢出效应 还损害了全体东亚人民的利益 只有透过中国和平发展的参照系考察中日关系的过去 现在和未来 才能把握当前中日关系困难的本质并找到解决问题的办法 当前中日两国的综合国力基本处于同一层次

More information

基于矩阵分解和矩阵变换的多义词向量研究

基于矩阵分解和矩阵变换的多义词向量研究 hyshi@pku.edu.cn 2018 6 9 Content 1 PCA VS. RPCA 2 2 3 [1] star s1 star s2 star s3 algorithm s1 algorithm s2 stars, movie, song, MVP stars, award, eagle, two-time supergiant, constellation, aurigae hash,

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 新初三英语 讲师 : 杨仕森丨三好网认证讲师教师帮俱乐部会员 本系列课程共 14 课时,10 课时复习课,4 课时预习课 课程目录 复习 : ( 一 ) 中考词法 : ( 二 ) 情态动词和非谓语 ( 三 ) 主谓一致和倒装句 ( 四 ) 非谓语 ( 五 ) 状语从句 学习 : ( 一 ) 现在完成时态 ; ( 二 ) 宾语从句 ; ( 三 ) 定语从句 ; ( 四 ) 时态下的被动语态 记笔记,

More information

中三級 英國語文科

中三級 英國語文科 中 三 級 英 國 語 文 科 (2014-2015) ( 一 ) 本 科 的 目 標 1. 學 生 能 有 足 夠 的 英 語 能 力 以 輔 助 他 們 繼 續 學 習 或 就 業 2. 學 生 能 了 解 及 有 足 夠 的 練 習 來 掌 握 各 級 應 有 的 語 言 水 準 3. 學 生 對 學 習 英 語 有 興 趣 及 動 力 4. 學 生 能 主 動 參 與 課 堂 內 外 的 英

More information

<4D F736F F D20B4D3CAF4B9D8CFB5D3EFB7A8B5C4D0CECABDCCD8D0D42E444F43>

<4D F736F F D20B4D3CAF4B9D8CFB5D3EFB7A8B5C4D0CECABDCCD8D0D42E444F43> 从属关系语法的某些形式特性 冯志伟 ( 教育部语言文字应用研究所 ) Abstract Some formal properties of dependency grammar Feng Zhiwei (State Language Commission) The dependency grammar is very useful in natural language processing. in

More information

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w 2013 2 计算机工程与设计 Feb. 2013 34 2 COMPUTER ENGINEERING AND DESIGN Vol. 34 No. 2 夏 静, 柴玉梅, 昝红英 : ( 郑州大学信息工程学院, 河南郑州 450001) 词的兼类问题是汉语词性标注中的关键问题之一针对常用词的兼类识别进行研究, 综合考虑了影响兼类词识别 的不同特征, 分别使用条件随机场模型 最大熵模型和 k 最近邻等统计方法,

More information

Microsoft Word doc

Microsoft Word doc 2016 International Conference on Education, Management and Applied Social Science (EMASS 2016) ISBN: 978-1-60595-400-4 A Study on the Usage of English Non-predicate Verbs Serving as Adverbials Chun-ge

More information

TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) MCQ 20 10% MCQ 20 10% Language Use and (1) Grammar (2) Vocabulary (3) Vocabulary Cloze (8m) 28 (

TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) MCQ 20 10% MCQ 20 10% Language Use and (1) Grammar (2) Vocabulary (3) Vocabulary Cloze (8m) 28 ( Standard English Language TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) Writing (15m) (40m) Write a story of at least 150 words about a given topic. A set of 3 unrelated pictures are provided.

More information

Microsoft Word doc

Microsoft Word doc 第 38 卷第 7 期 Vol.38 No.7 计算机工程 Computer Egieerig 202 年 9 月 September 202 人工智能及识别技术 文章编号 :000 3428(202)7 020 04 文献标识码 :A 中图分类号 :TP30.6 改进的 VSM 算法及其在 FAQ 中的应用 郑诚, 李清, 刘福君 ( 安徽大学计算机科学与技术学院, 合肥 230039) 摘要 :

More information

PowerPoint Presentation

PowerPoint Presentation 6/14 AI Marr ELIZA SHRDLU DENDRAL, MYIN, AM, Eurisko, yc Deep Blue, 2010 Alpha-o ASON AI AI 1 2 HAL 9000 2001 AI 3 AI AI AI AI AI spin-off AI 4 HMM (Hidden Markov Model) SVM 5 6 ... ASON (IBM) echnological

More information

分层次构建汉语树库

分层次构建汉语树库 分阶段构建汉语树库 周强 1, 任海波 2, 孙茂松 1,3 清华大学计算机系 2 上海师范大学 智能技术与系统国家重点实验室 国际文化交流学院 北京 100084 上海 200234 zhouq@s1000e.cs.tsinghua.edu.cn, renhb@shtu.edu.cn lkc-dcs@mail.tsinghua.edu.cn 3 摘要 : 本文介绍了一种分阶段构建汉语树库的研究思路

More information

ru'he

ru'he 如何自动建构社会标签中的语义关系? 三人行语义沙龙, 上海,2017.8.19 董行 (Hang) ( 西交 ) 利物浦大学计算机系博士生 导师 : Wei Wang, Frans Coenen, Kaizhu Huang ( 之前是 Kevin Kung Fung Yuen) 鸣谢本报告中用到的各类网络与学术资源 1 从社交媒体数据中提取语义关系 语义网与社交网络数据,Social Semantic

More information

Microsoft Word - ccl2014jia0728pic.doc

Microsoft Word - ccl2014jia0728pic.doc 文章编号 :1003-0077(2011)00-0000-00 汉语语义选择限制知识自动获取研究 贾玉祥 1, 王浩石 1, 昝红英 1, 俞士汶 2, 王治敏 (1. 郑州大学信息工程学院, 河南省郑州市 450001; 2. 北京大学计算语言学教育部重点实验室, 北京市 100871; 3. 北京语言大学汉语学院, 北京市 100083) 摘要 : 语义选择限制刻画谓语对论元的语义选择倾向, 是一种重要的词汇语义知识,

More information

2/80 2

2/80 2 2/80 2 3/80 3 DSP2400 is a high performance Digital Signal Processor (DSP) designed and developed by author s laboratory. It is designed for multimedia and wireless application. To develop application

More information

PowerPoint Presentation

PowerPoint Presentation 第 9 章句法分析 (1/2) 北京市海淀区中关村东路 95 号 邮编 :100190 电话 : +86-10-8254 4688 邮件 :cqzong@nlpr.ia.ac.cn 9.1 概述 宗成庆 : 自然语言理解 讲义, 第 9 章 2/146 9.1 概述 任务 : 句法分析 (syntactic parsing) 的任务就是识别句子的句法结构 (syntactic structure)

More information

工程项目进度管理 西北工业大学管理学院 黄柯鑫博士 甘特图 A B C D E F G 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 甘特图的优点 : 直观明了 ( 图形化概要 ); 简单易懂 ( 易于理解 ); 应用广泛 ( 技术通用 ) 甘特图的缺点 : 不能清晰表示活动间的逻辑关系 WBS 责任分配矩阵 ( 负责〇审批

More information

Microsoft PowerPoint - Chapter_05.ppt

Microsoft PowerPoint - Chapter_05.ppt 自然语言处理导论课程讲义 第五讲语义分析 http://ccl.pku.edu.cn/alcourse/nlp 提纲 一从形式到意义 : 引入语义知识的必要性二语义知识的类型及语义知识的获取三语义知识的应用四小结 2 1 从形式到意义 : 引入语义知识的必要性 B B 心智的世界 A C A 是对 B 的抽象,B 是对 C 的抽象 ; A 符号 / 形式的世界 C 真实的世界 A 通过 B, 与 C

More information

一种快速获取领域新词语的新方法

一种快速获取领域新词语的新方法 1 一 种 快 速 获 取 领 域 新 词 语 的 新 方 法 2 刘 华 ( 暨 南 大 学 华 文 学 院, 广 州,510610) 摘 要 : 针 对 新 词 语 识 别 问 题, 直 接 抽 取 分 类 网 页 上 人 工 标 引 的 关 键 词, 按 照 其 网 页 栏 目 所 属 类 目 存 储 进 各 分 类 词 表, 快 速 完 成 新 词 语 识 别 和 聚 类 任 务, 简 单

More information

2017 CCAFL Chinese in Context

2017 CCAFL Chinese in Context Student/Registration Number Centre Number 2017 PUBLIC EXAMINATION Chinese in Context Reading Time: 10 minutes Working Time: 2 hours and 30 minutes You have 10 minutes to read all the papers and to familiarise

More information

无论中国的传统学术还是西方的大学制度 因 修道 之旨而生 教化 之需的轨迹是颇为相似的 正如中国的 小学 是为 大学 的读经作准备 欧洲中世纪大学的 人文学科 也是要帮助凡人理解神圣的文本 在西方 进一步使语言成为民族国家的根本标志 并通过强势族群与强势语言的共生互动 为后世的殖民扩张提供了基本 原型 中国早期教会大学对于语言的选用 当代西方国家的相关语言政策 也都可以成为语言标准之统治性力量的生动例证

More information

第壹章

第壹章 資訊管理系 德州撲克之 智慧型喊注系統 指導教授 萬 絢 教授 組員名單 游子祥 蔡宗益 張宇祥 李姵嫺 978C019 978C043 978C089 978C101 中華民國101年5月 嶺 東 科 技 大 學 資 訊 管 理 系 德 州 撲 克 之 智 慧 型 喊 注 系 統 資訊管理系專題口試委員審定書 德州撲克之 智慧型喊注系統 指導教授 萬 絢 教授 組員名單 游子祥 978C019 蔡宗益

More information

1 医 疗 养 生 求 医 不 如 求 己 第 一 章 常 见 病 治 疗 牙 痛 的 简 单 止 痛 法 002 洋 葱 泥 去 头 屑 002 消 退 吻 痕 的 方 法 002 痔 疮 的 简 易 治 疗 法 002 快 速 止 鼻 血 的 秘 方 002 生 嚼 大 蒜 治 感 冒 002 葱 姜 粥 预 防 风 寒 感 冒 002 用 生 姜 红 糖 防 感 冒 003 蒸 白 糖 豆 腐

More information

WHF

WHF April, 2014 Company LOGO 王厚峰 (wanghf@pku.edu.cn) 北京大学计算语言学研究所 北京大学计算语言学教育部重点实验室 语言知识资源库的重要性 语言知识资源是 NLP 的基础 基于规则的方法需要知识 ( 库 ) 支撑 ( 规则本身也是知识 ) 基于统计的方法需要语料库作为训练数据 建模 带标语料库作为黄金标准用于评测 评测推动技术的发展 Application

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 文章编号 :1003-0077(2011)00-0000-00 汉语二语教学领域词义标注语料库的研究及构建 王敬, 杨丽姣, 蒋宏飞, 苏靖杰, 付静玲 (. 北京师范大学中文信息处理研究所, 北京市 100875) 摘要 : 汉语二语教学领域, 词汇教学在其中占有极为重要的地位, 其中多义词又是词汇教学的重点和难点 本 研究通过分析三部经典领域词表, 选取了 1181 个重点多义词, 以 现代汉语词典

More information

实用大学英语语法新编 New Practical English Grammar for College Students 母语环境中, 因此对于母语语法规则系统的获得过程是一个不断对母语规则系统进行假设和修正的过程 这个过程是学习者自主完成的 对于英语学习者来说, 主要是通过课堂教学活动, 激发他

实用大学英语语法新编 New Practical English Grammar for College Students 母语环境中, 因此对于母语语法规则系统的获得过程是一个不断对母语规则系统进行假设和修正的过程 这个过程是学习者自主完成的 对于英语学习者来说, 主要是通过课堂教学活动, 激发他 第一章 英语语法概论 第一节语法在英语学习中的地位 语法在英语学习中的地位, 原本是一个很简单的问题, 但后来却被复杂化了 20 世纪 60 年代以前, 语法翻译法一直处于英语教学的中心地位 语法翻译法的主要特点有 : 教材内容按语法概念编排 每一课的学习内容由两部分组成 : 一是语法规则及其说明, 二是供翻译练习用的语句 教师在教学中的作用主要是解释语法规则 教学的目的是要学生记住那些不容违背的词法句法的条条框框

More information

未命名-1

未命名-1 1 2 3 4 5 6 7 8 9 10 11 12 ss a c y e vg 13 14 15 16 17 18 19 H 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 发现生命的螺旋 克里克在提出 中心法则 时曾指出 遗传信息是沿 D N A - R N A - 蛋白质的方向流动的 遗传信息不可能从 R N A 回到 D N

More information

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位 自然科学版 文章编号 视网膜图像中视盘的快速自动定位方法 赵晓芳 林土胜 李碧 摘 要 基于眼底视网膜血管的分布结构及视盘本身的特点 提出一种快速自动定位视盘的方法 首先根据视网膜血管的网络分布结构大致定位视盘的垂直坐标 然后根据视盘 的亮度信息及视盘与血管的关系来定位视盘的水平坐标 最后把视盘限定在以粗定位的视盘为中心的一个小窗口内 用 变换精确定位视盘中心 该方法不需要事先分割视网膜血管 也不需要对算法进行训练

More information

从 他的老师当得好 谈起 黄正德 哈佛大学语言学系 波士顿 黄正德 美国麻省理工学院语言学博士 美国哈佛大学语言学系教授 先后执教于美国夏威夷大学 台湾清华大学 台湾师范大学 美国康乃尔大学 美国加州大学 在法国 日本 西班牙 澳大利亚等国家担任客座教授 学术研究专治语 法理论 着重于句法学 句法语义接口 语言参数理论以及汉语语法研究方面 出版学术专书与期刊论文数十部

More information

前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣

前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣 前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣的人士简要介绍相关领域的基本概念和应用方向, 向高校 科研院所和高技术企业中从事相关工作的专业人士介绍相关领域的前沿技术和发展趋势

More information

,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( ) (1

,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( ) (1 /,, ( ),, ; ; ;?,,,,,,,,, ( ) ( ), ; ; ;?,, :, ;, 147 23 2009 2,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( )

More information

李鹏飞 从小说对社会风俗 时代环境 自然风物 服饰器物等社会生活内容的不同描写方式及其效果出发, 可以将中国 古代小说分成具体型 抽象型与半具体半抽象型三大类这一分类方法不再以小说的情节 人物 主题等基本要素作为 分类标准, 从而为考察古代小说的艺术特色与作家的思维特点提供了一个新的视角 中国古代小说 ; 具体型小说 ; 抽象型小说 ; 半具体半抽象型小说 李鹏飞, 北京大学中文系副教授, 文学博士,

More information

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注技巧和说明 利用已有的词典资源 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注技巧和说明 利用已有的词典资源 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是 汉语依存句法树标注规范 此规范还未正式发表 未经编者允许, 请不要转发或传播 参与编者 : 李正华郭丽娟龚晨张月 zhli13@suda.edu.cn 年 月 日版本自 年 月开始编制 苏州大学人类语言计算研究所 目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注技巧和说明 利用已有的词典资源 依存关系类型 总 依存关系类型

More information

一量动…

一量动… 语 言 教 学 与 研 究,1998(3):102-113. 一 量 VP 的 语 法 语 义 特 点 李 宇 明 根 据 量 词 的 不 同, 一 量 VP 可 以 分 为 三 类 : (1) 畜 力 车, 哪 怕 是 牛 车, 竟 一 辆 没 有 ( 陈 冲 不 自 然 的 黑 色, 十 月 1989 年 6 期 34 (2) 一 刻 都 不 敢 离 开 你 呢 ( 小 牛 上 路 谣, 当 代

More information

第四章 102 图 4唱16 基于图像渲染的理论基础 三张拍摄图像以及它们投影到球面上生成的球面图像 拼图的圆心是相同的 而拼图是由球面图像上的弧线图像组成的 因此我 们称之为同心球拼图 如图 4唱18 所示 这些拼图中半径最大的是圆 Ck 最小的是圆 C0 设圆 Ck 的半径为 r 虚拟相机水平视域为 θ 有 r R sin θ 2 4畅11 由此可见 构造同心球拼图的过程实际上就是对投影图像中的弧线图像

More information

17

17 17 應 用 案 例 式 推 理 建 立 顧 客 關 係 管 理 之 行 銷 決 策 系 統 張 百 棧 * 王 彥 文 劉 鎮 豪 元 智 大 學 工 業 工 程 與 管 理 研 究 所 桃 園 縣 中 壢 市 遠 東 路 135 號 03-463-8800#287 iepchang@saturn.yzu.edu.tw 摘 要 近 年 來, 資 料 庫 行 銷 蓬 勃 發 展, 讓 許 多 企 業

More information

前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣

前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣 前言 当前已经进入以互联网 大数据和深度学习为标志的海量信息时代, 互联网和机器学习技术的快速发展对中文信息处理提出了许多新的挑战 中文信息处理发展报告(2016) 是中国中文信息学会召集专家对本领域学科方向和前沿技术的一次梳理, 我们的定位是深度科普, 旨在向政府 企业 媒体等对中文信息处理感兴趣的人士简要介绍相关领域的基本概念和应用方向, 向高校 科研院所和高技术企业中从事相关工作的专业人士介绍相关领域的前沿技术和发展趋势

More information

Microsoft Word - 07第四章華語第二語言教材趣味分析第4.2節20121209_8版.doc

Microsoft Word - 07第四章華語第二語言教材趣味分析第4.2節20121209_8版.doc 4.2 格 式 及 范 畴 的 连 结 方 式 与 功 能 的 连 续 性 前 面 我 们 已 从 课 程 发 展 的 角 度, 就 语 法 点 的 排 序 状 况 做 考 察, 发 现 该 教 材 的 先 行 话 题 是 语 法, 语 法 点 依 形 式 繁 简 及 概 念 具 体 抽 象 的 程 度 排 序 ; 随 后 话 题 是 课 文, 课 文 及 其 图 画 是 对 语 法 形 式 概 念

More information

构建大规模的汉语语块库

构建大规模的汉语语块库 智能技术与系统国家重点实验室, 清华大学计算机系, 北京 100084 构建大规模的汉语语块库 周强 詹卫东 任海波 北京大学中文系, 北京 100871 上海师范大学国际文化交流学院, 上海 200234 摘要 : 本文介绍了构建 200 万字的汉语语块库的主要工作, 包括设计语块标注体系 总结语块标注规范和协调语块加工流程等, 分析了我们的标注体系与英语的 CONLL-2000 语块任务的主要差异,

More information

骨头的故事

骨头的故事 头 1 图 206 33 7 12 5 5 4 12 2 54 10 200-400 3 500 图 类 图 图 动 节 4 5 图 发 图 节 180 Youtube 180 [1] 7 2 7 6 9 270 6 图 树懒 块颈 13-25 14 17 25 7 图 扭头 头鹰 鹅 8 图 红 为 关节 绿 为 关节 9 图 类 10 图 类 11 图 盘 动 类 图 阴 犸 艺 你可能会以为图

More information

育儿故事(八)

育儿故事(八) 9998.00 (1CD, ) I...1...4 BOY...7...9...10...12...14...16...24...26...28...30 VS...34...40...42...45...46...52...53...55...56...60...62...64 ...73...75...77...79...81...84...86 II 1 2 3 4 5 6 boy 7 8 9

More information

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W http://kns.cnki.net/kcms/detail/11.2442.n.20180822.1814.010.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2018.055 基于词模式嵌入的词语上下位关系分类 孙佳伟 李正华 陈文亮张民

More information

2014-社会类产品目录2015.01.29.indd

2014-社会类产品目录2015.01.29.indd 阶 段 学 前 教 育 中 小 学 基 础 教 育 成 人 继 续 教 育 社 会 教 育 分 社 : 致 力 于 为 建 构 学 习 型 社 会 提 供 终 身 教 育 解 决 方 案 学 习 资 源 备 考 资 源 评 估 体 系 教 材 读 物 工 具 书 体 验 幼 儿 英 语 + 数 码 课 堂 P01 体 验 英 语 少 儿 阅 读 文 库 预 备 级 + 点 读 笔 P04 幼 师 英

More information

English grammar

English grammar English grammar Email: yungchin@163.com Website: http://www.yungchin.org Mobile: 159 2039 5794 1 Unit 4 Determiners & Articles 2 Determiners 3 限定词表达了名词词组中心词的所指意义 ( 特指和类指 ) 和数量意义 ( 确定数量和非确定数量 ) 4 定冠词, 不定冠词,

More information

厦门大学学位论文原创性声明 本人呈交的学位论文是本人在导师指导下, 独立完成的研究成 果 本人在论文写作中参考其他个人或集体已经发表的研究成果, 均 在文中以适当方式明确标明, 并符合法律规范和 厦门大学研究生学 术活动规范 ( 试行 ) 另外, 该学位论文为 ( ) 课题 ( 组 ) 的研究成果,

厦门大学学位论文原创性声明 本人呈交的学位论文是本人在导师指导下, 独立完成的研究成 果 本人在论文写作中参考其他个人或集体已经发表的研究成果, 均 在文中以适当方式明确标明, 并符合法律规范和 厦门大学研究生学 术活动规范 ( 试行 ) 另外, 该学位论文为 ( ) 课题 ( 组 ) 的研究成果, 学校编码 :10384 分类号密级 学号 :10220061150015 UDC 硕士学位论文 面向计算机词义自动甄别的 多义形容词义项划分研究 A Study on Sense Discrimination of Polysemous Adjectives for Computer Automatic Meaning Discernment 指导教师姓名 : 专业名称 : 论文提交日期 : 论文答辩日期

More information

A 类 大 作 文 题 目 教 育 Some people think that older schoolchildren should learn wide range subjects and develop knowledge, other people think that they sho

A 类 大 作 文 题 目 教 育 Some people think that older schoolchildren should learn wide range subjects and develop knowledge, other people think that they sho 2013.05.11 澳 大 利 亚 考 区 A 类 G 类 全 面 预 测 预 测 适 用 时 间 : 2013 年 5 月 11 日 考 试 (A 类 G 类 ) 预 测 适 用 考 区 : 主 要 为 澳 大 利 亚 考 区, 中 国 大 陆 地 区, 港 澳 台 地 区, 亚 洲 其 他 地 区 ( 日 韩 泰 ) 均 可 参 考 本 预 测 以 上 地 区 笔 试 部 分 ( 听 力 阅

More information