PowerPoint Presentation

Size: px
Start display at page:

Download "PowerPoint Presentation"

Transcription

1 第 10 章语义分析 北京市海淀区中关村东路 95 号 邮编 : 电话 : 邮件 :cqzong@nlpr.ia.ac.cn

2 10.1 概述 宗成庆 : 自然语言处理 讲义, 第 10 章 2/125

3 10.1 概述 语义计算的任务 : 解释自然语言句子或篇章各部分 ( 词 词组 句子 段落 篇章 ) 的含义 面临的困难 : 自然语言句子中存在大量的歧义, 涉及指代 同义 / 多义 量词的辖域 隐喻等 ; 同一句子对于不同的人来说可能有不同的理解 ; 语义计算的理论 方法 模型尚不成熟 宗成庆 : 自然语言处理 讲义, 第 10 章 3/125

4 例子 10.1 概述 (1) I bought a car with four wheels. I bought a car with four dollars. (2) These boys will be dedicated persons. These boys will be denied license. (3) 这件事情让我感到很头疼 (4) 这人真恶心! (5) 他也算个男人?! 简直是个饭桶! 宗成庆 : 自然语言处理 讲义, 第 10 章 4/125

5 10.2 语义理论简介 宗成庆 : 自然语言处理 讲义, 第 10 章 5/125

6 10.2 语义理论简介 词的指称作为意义 该理论认为, 词或词组的意义就是它们在现实世界上所指的事物 那么计算语义学的任务就是将词或词组与世界模型中的物体对应起来 常用的现实世界模型假设世界上存在各种物体, 包括人 问题 : 对于复杂的问题这种定义无法处理 启明星 / 暮星 金星 ; 神仙? 鬼? 妖怪? 宗成庆 : 自然语言处理 讲义, 第 10 章 6/125

7 10.2 语义理论简介 心理图像 大脑图像或思想作为意义 该理论认为, 词或词组的意义就是词或词组在人心理上或大脑中所产生的图像 问题 : 在计算机中把心理图像有效地表示出来并不 是一件容易的事情, 而且, 不一定所有的词义都有 清晰的心理图像 宗成庆 : 自然语言处理 讲义, 第 10 章 7/125

8 10.2 语义理论简介 说话者的意图作为意义 该理论试图解释语言中一种被称为言语行为 (Speech Acts) 的现象 说话者把自己的话语当作行为, 希望听者理解 作出反应 这种意义被认为是独立于逻辑意义之外的 宗成庆 : 自然语言处理 讲义, 第 10 章 8/125

9 10.2 语义理论简介 例如 : 我想预订明天下午的火车票 c: give-information + reservation +ticket (ticket-spec=(ticket-type=train, Concepts time=(relative-time=tomorrow, Speaker tod=afternoon))) Speech-act Arguments 问题 : 意图的定义 划分和表示是困难的 宗成庆 : 自然语言处理 讲义, 第 10 章 9/125

10 10.2 语义理论简介 过程语义 该理论认为, 句子的语义定义为接受该句后所执行的程序或者所采取的某种动作 优点 : 简单明了, 对于计算机智能应用系统来说, 这种定义在某种程度上是有效的 问题 : 对于语言本身缺乏解释, 且句子的语义与应用之间的连接过于紧密, 缺乏独立性 宗成庆 : 自然语言处理 讲义, 第 10 章 10/125

11 10.2 语义理论简介 词汇分解学派 该理论把句子的语义基于它所含有的词和词组的意义之上, 而词的意义则基于一组有限特征, 这组特征通常称为语义基元 这样, 只要给出一组语义基元和一些操作符, 就可以把句子的语义描述出来 类似于化学中的元素学说 问题 : 语义基元的定义 分解标准等难以把握, 基元和组合操作的合理性直接影响句子语义描写的准确性, 而且如何定义 操作 也是个困难的问题 宗成庆 : 自然语言处理 讲义, 第 10 章 11/125

12 10.2 语义理论简介 条件真理模型 该理论以谓词逻辑为基础, 句子的语义定义为它所对应的命题或谓词在全体模型 ( 或世界 ) 中的真伪 例如 : 雪是白的 为真, 当且仅当在这个世界上雪是白的 优点 : 对上下文无关部分的语义描写很有效 问题 : 对时间 场景有关的语言现象不能很好地描述 不能很好地解释一句多义的问题 宗成庆 : 自然语言处理 讲义, 第 10 章 12/125

13 10.2 语义理论简介 情景语义学 该理论认为句子的语义不仅和逻辑意义有关, 而且与句子被使用的场景有关 在语义表达式中引入一些与场景相关的变量, 如事件变量 时间变量等, 并用逻辑 与 算子对这些变量加以限制 宗成庆 : 自然语言处理 讲义, 第 10 章 13/125

14 10.2 语义理论简介 例如 : 雪是白的 : 是白的 ( 雪, e) 等同 (e, 地球世界 ) 前缀表示 谓词 场景变量 宗成庆 : 自然语言处理 讲义, 第 10 章 14/125

15 10.2 语义理论简介 模态逻辑 起源于 20 世纪 80 年代初,AI 如 : 缺省逻辑 时态逻辑 真值维护系统等 这类逻辑是试图用一套公理系统来刻画现实世界和自然语言中常见的一些现象 这类现象从哲学上说就是一般性和特殊性的矛盾 问题 : 公理系统 总是刻画世界普遍成立的一般性真理, 难以涵盖特殊情况下的特殊事实 例如 : 鸟会飞企鹅不会飞 宗成庆 : 自然语言处理 讲义, 第 10 章 15/125

16 10.3 格语法 宗成庆 : 自然语言处理 讲义, 第 10 章 16/125

17 背景 10.3 格语法 格语法 (Case Grammar) 是美国语言学家 Charless J. Fillmore 于 1966 年提出的 代表作 : 1966 年发表 关于现代的格理论 (Towards a modern theory of case) 1968 年发表 格辨 (The case for case) ( 代表作 ) 1971 年发表 格语法的某些问题 ( Some problems for case grammar) 1977 年发表 再论格辨 (The Case for Case Reopened) 宗成庆 : 自然语言处理 讲义, 第 10 章 17/125

18 10.3 格语法 基本观点 C. J. Fillmore 指出 : 诸如主语 宾语等语法关系实际上都是表层结构上的概念, 在语言的底层, 所需要的不是这些表层的语法关系, 而是用施事 受事 工具 受益等概念所表示的句法语义关系 这些句法语义关系, 经各种变换之后才在表层结构中成为主语或宾语 宗成庆 : 自然语言处理 讲义, 第 10 章 18/125

19 10.3 格语法 格的定义 格语法中的格是 深层格, 它是指句子中体词 ( 名词 代词等 ) 和谓词 ( 动词 形容词等 ) 之间的及物性关系 (transitivity), 如 : 动作和施事者的关系 动作和受事者的关系等, 这些关系是语义关系, 它是一切语言中普遍存在的现象 宗成庆 : 自然语言处理 讲义, 第 10 章 19/125

20 10.3 格语法 这种格是在底层结构中依据名词与动词之间的句法语义关系确定的, 这种关系一经确定就固定不变, 不管经什么操作 在表层结构中处于什么位置 与动词形成什么语法关系, 底层上的格与任何具体语言中的表层结构上的语法概念, 如主语, 宾语等, 没有对应关系 宗成庆 : 自然语言处理 讲义, 第 10 章 20/125

21 10.3 格语法 例如 :(1) The door opened. (2) The key opened the door. (3) The boy opened the door. (4) The door was opened by the boy. (5) The boy opened the door with a key. the boy: 施事格 the door: 客体格 ( 受事格 ) the key: 工具格 宗成庆 : 自然语言处理 讲义, 第 10 章 21/125

22 10.3 格语法 格语法的三条基本规则 : (1) S M+P 句子 S 可以改写成情态 (Modality) 和命题 (Proposition) 两大部分, 情态部分包括否定 时 式 体以及其他被理解为全句情态成分的状语 命题牵涉到动词和名词短语 动词和内嵌小句之间的关系, 动词是句子的中心, 名词短语按其特定的格属关系依附于该动词 宗成庆 : 自然语言处理 讲义, 第 10 章 22/125

23 10.3 格语法 (2) P V+C 1 +C 2 + C n 命题 P 都可以改写成一个动词 V 和若干个格 C 动词是广义上的动词, 包括 : 动词 形容词 甚至包括名词 副词和连词 (3) C K + NP K 为格标, 是各种格范畴在底层结构中的标记, 可以有各种标记形式, 如 : 前置词 后缀词 词缀 零形式等 宗成庆 : 自然语言处理 讲义, 第 10 章 23/125

24 格表 10.3 格语法 C. J. Fillmore 在 1968 年的论文中认为, 命题中的格包括 6 种 : (1) 施事格 (Agentive): 动作的发生者 (2) 工具格 (Instrumental): 对动作或状态而言作为某种因素而牵涉到的无生命的力量或客体 (3) 承受格 (Dative): 由动词确定的动作或状态所影响的有生物 如,He is tall. 宗成庆 : 自然语言处理 讲义, 第 10 章 24/125

25 10.3 格语法 (4) 使成格 (Factitive): 由动词确定的动作或状态所形成的客体或有生物 或理解为 : 动词意义的一部分的客体或有生物 如 :John dreamed a dream about Mary. (5) 方位格 (Locative): 由动词确定的动作或状态的处所或空间方位 如 :He is in the house. (6) 客体格 (Objective): 由动词确定的动作或状态所影响的事物 如 :He bought a book. 宗成庆 : 自然语言处理 讲义, 第 10 章 25/125

26 10.3 格语法 后来 Fillmore 在语言分析时又增加了一些格 : (7) 受益格 (Benefactive): 由动词确定的动作为之服务的有生命的对象 如 :He sang a song for Mary. (8) 源点格 (Source): 由动词确定的动作所作用到的事物的来源或发生位置变化过程中的起始位置 如 : He bought a book from Mary. 宗成庆 : 自然语言处理 讲义, 第 10 章 26/125

27 10.3 格语法 (9) 终点格 (Goal): 由动词确定的动作所作用到的事物的终点或发生位置变化过程中的终端位置 如 :I sold a car to Mary. (10) 伴随格 (Comitative): 由动词确定的与施事共同 完成动作的伴随者 如 :He sang a song with Mary. * 格的数目和名称并不是确定的 宗成庆 : 自然语言处理 讲义, 第 10 章 27/125

28 10.3 格语法 用格语法分析语义 : 格框架约束分析 格框架表示 格框架中可以有语法信息, 也可以有语义信息, 语义信息是整个格框架最基本的部分 一个格框架可由一个主要概念和一组辅助概念组成, 这些辅助概念以一种适当定义的方式与主要概念相联系 一般地, 在实际应用中, 主要概念可理解为动词, 辅助概念理解为施事格 受事格 处所格 工具格等语义深层格 宗成庆 : 自然语言处理 讲义, 第 10 章 28/125

29 10.3 格语法 例 : In the room, he broke a window with a hammer. [BREAK [ Case-frame: [Agentive: HE Objective: WINDOW Instrumental: HAMMER Locative: ROOM ] [MODALs: Time: past Voice: active ]]] 宗成庆 : 自然语言处理 讲义, 第 10 章 29/125

30 10.3 格语法 分析的基础 词典中记录动词的格框架和名词的语义信息 对于动词 : 规定它们所属的必备格 可选格或禁用格, 同时填充这些格的名词的语义条件 如 : 动词用法词典 把名词按其与动词格的关系分为 14 类 : 受事 结果 对象 工具 方式 处所 时间 目的 原因 致使 施事 同源 等同 杂类 对于名词 : 填充语义信息, 建立名词语义分类体系 宗成庆 : 自然语言处理 讲义, 第 10 章 30/125

31 10.3 格语法 分析步骤 : (1) 判断待分析词序列中主要动词, 在动词词典中找出该词的格框架 (2) 识别必备格 : 如果格带有位置标志, 则从指定位置查找格的填充物 ; 如果格带有语法标志, 则在这个分析的词序列中查找语法标志, 进入相应的填充 ; 如果格框架还需要其它必备格, 查找其它名词的语义信息, 按格框架的语义信息要求进行相应的填充 (3) 识别可选格 (4) 判断句子的情态 Modal 宗成庆 : 自然语言处理 讲义, 第 10 章 31/125

32 10.3 格语法 格框架分析可以和句法分析结合起来 : (a) 句法分析 : 判断出句子的动词 名词短语 介词短语等 ; (b) 查找动词的格框架与名词短语 介词短语的格关系, 并进行相应的填充 必须首先找到动词 ( 谓词 ), 从而获得格框架 宗成庆 : 自然语言处理 讲义, 第 10 章 32/125

33 10.3 格语法 The young athlete will be running in Los Angeles next week. 从词典中查找 run 的格框架 : Verb: run Case-Frame [ Neutral -required ( 中性格 ) Dative Locative -not allowed -optional Instrumental -not allowed Agentive -required] 与格, 通常表示动词的间接宾语 run 的中性格像一个物理实体或组织, 如 : John ran the machine. He ran the corporation. 宗成庆 : 自然语言处理 讲义, 第 10 章 33/125

34 10.3 格语法 CASE [Agentive: the young athlete Locative: Los Angeles Neutral: the young athlete [Modal [Tense: Future ( 将来时 ) MOOD: Declarative ( 陈述语气 ) Time: next week]]] 宗成庆 : 自然语言处理 讲义, 第 10 章 34/125

35 10.3 格语法 格语法描写汉语的局限性 汉语的一些无动句 流水句 连动句 紧缩 动补 省略等结构, 无法或不必用一个统率全句的模式来描述, 其中连动句和兼语句尤为突出 例如 : (1) 他拿了书就上楼去了 (2) 我们选他当班长 宗成庆 : 自然语言处理 讲义, 第 10 章 35/125

36 10.4 语义网络 宗成庆 : 自然语言处理 讲义, 第 10 章 36/125

37 背景 10.4 语义网络 语义网络 (semantic network) 由美国心理学家 M. R. Quilian 于 1968 年在研究人类联想记忆时提出 1977 年美国 AI 学者 G. Hendrix 提出了分块语义网络的思想, 把语义的逻辑表示与 格语法 结合起来, 把复杂问题分解为几个较为简单的子问题, 每个子问题用一个语义网络表示, 把自然语言理解的研究向前推进了一步 宗成庆 : 自然语言处理 讲义, 第 10 章 37/125

38 10.4 语义网络 语义网络的概念 语义网络通过由概念和语义关系组成的有向图来表达知识 描述语义 有向图 : 图的结点表示概念, 图的边表示概念之 间的关系 边的类型 :(1) 是一种 :A 到 B 的边表示 A 是 B 的一种特例 ;(2) 是部分 : A 到 B 的边 表示 A 是 B 的一部分 ; 宗成庆 : 自然语言处理 讲义, 第 10 章 38/125

39 10.4 语义网络 R A [ 在水中生活 ] (1) B 鱼 IS-A [ 有生命 ] [ 吃食物 ] (2) 动物 老虎 IS (3) 肉食动物 桌面 PART-OF (4) 桌子 宗成庆 : 自然语言处理 讲义, 第 10 章 39/125

40 10.4 语义网络 语义网络的概念关系 语义网络各概念之间的关系, 主要由 IS-A, PART-OF, IS, COMPOSED-OF, HAVE, BEFORE, LOCATED-ON 等谓词表示 IS-A: 表示 具体 - 抽象 关系 PART-OF: 表示 整体 - 构件 关系 IS: 一个结点是另一个结点的属性 中国首都 IS 北京 宗成庆 : 自然语言处理 讲义, 第 10 章 40/125

41 10.4 语义网络 HAVE: 表示 占有 具有 关系 BEFORE/AFTER/AT: 表示事物间的次序关系 LOCATED-ON/UNDER/AT: 表示事物之间的位置关系 宗成庆 : 自然语言处理 讲义, 第 10 章 41/125

42 10.4 语义网络 事件的语义网络表示 当语义网络表示事件时, 结点之间的关系可以是施事 受事 时间等 例如 : 张三帮助李四 张三 Agentive 事件 Objective 李四 IS 帮助 三元组表示 : 帮助 ( 张三, 李四 ) ( 张三, 帮助, 李四 ) 宗成庆 : 自然语言处理 讲义, 第 10 章 42/125

43 10.4 语义网络 事件的语义关系 (1) 分类关系 : 事物之间的类属关系 (2) 聚焦关系 : 多个下位概念构成一个上位概念 IS-A 动物 IS-A IS-A 鸟鱼 IS-A IS-A IS-A 教师 IS-A 助教讲师教授 鸵鸟鹦鹉鲨鱼鲸鱼 宗成庆 : 自然语言处理 讲义, 第 10 章 43/125

44 10.4 语义网络 (3) 推论关系 : 由一个概念推出另一个概念 (4) 时间 位置关系 : 事实发生或存在的时间 位置 带雨伞 推出 下雨 宗成庆 : 自然语言处理 讲义, 第 10 章 44/125

45 10.4 语义网络 基于语义网络的推理 分析 (1) 根据提出的问题构成局部网络 ; (2) 用变量代表待求的客体 Agentive Objective? 事件李四张三 IS 帮助网络知识库 宗成庆 : 自然语言处理 讲义, 第 10 章 45/125

46 10.4 语义网络 词义 内涵 : 词本身的意义, 是对词代表的概念 描述 外延 : 词所指代的物体 问题 : 如何在语义网络中表示和区分词的内涵和 外延? 宗成庆 : 自然语言处理 讲义, 第 10 章 46/125

47 10.5 概念依存理论 宗成庆 : 自然语言处理 讲义, 第 10 章 47/125

48 背景 10.5 概念依存理论 R. C. Schank 和他的同事在 70 年代提出了概念依存 (Concept Dependence, CD) 理论 1975, Conceptual Information 1977, Scripts, Plans, Goals and Understanding 宗成庆 : 自然语言处理 讲义, 第 10 章 48/125

49 10.5 概念依存理论 CD 理论的组成 : 三个层次之一 : 动作基元 (1) 在概念依存层次 : 规定了一组动作基元, 其他动作是由这些动作基元组合而成的 如 : 抓 (Grasp) 移动 (Move) 传送 (Trans) 去 (Go) 推 (Propel) 吸收 (Ingest) 撞击 (Hit) 等 (2) 关于精神世界的概念 : 心传 (MTrans) 概念化 (Conceptualize) 心建 (MBuild) (3) 关于手段或工具 : 闻 (Smell) 看 (Look-at) 听 (Listen-to) 说 (Speak) 宗成庆 : 自然语言处理 讲义, 第 10 章 49/125

50 10.5 概念依存理论 三个层次之二 : 剧本用来描写遇到一些常见场景或场合时所采取的一些固定的成套的动作 如 : (a) A 推购物车或拿购物筐 ; (b) A 根据购物单或随意选购一些物品 B; (c) A 把选购好的 B 给收帐员算帐 付款 宗成庆 : 自然语言处理 讲义, 第 10 章 50/125

51 10.5 概念依存理论 三个层次之三 : 计划 计划中的每一步都是一个剧本, 如, 外出旅游的安排 : (a) 出门前的准备 ; (b) 搭乘交通工具到目的地 ; (c) 找住宿地点安顿下来 ; (d) 在旅游地游玩 ; (e) 若还未尽兴, 转 (b), 否则, 转 (f); (f) 搭乘交通工具回家 宗成庆 : 自然语言处理 讲义, 第 10 章 51/125

52 10.5 概念依存理论 依据 CD 理论理解语言 一般文章中一些动作的细节被很多处理方法忽略, 计算机难以发现事件 人物 地点等各种指代之间的联系, 而 CD 理论试图建立这种联系, 正确描述常识, 并利用基本动作推理 该理论对限定领域内的特定应用比较有效 缺陷 : 对常识的描写过于刻板和定式 宗成庆 : 自然语言处理 讲义, 第 10 章 52/125

53 10.6 词义消歧 宗成庆 : 自然语言处理 讲义, 第 10 章 53/125

54 10.6 词义消歧 词义消歧问题 (word sense disambiguation, WSD) 例如 : 英文 : bank: 银行 / 河岸 plant: 工厂 / 植物汉语 : 打 :play/ take/ dial/ weave 包 :package/ guarantee / 宗成庆 : 自然语言处理 讲义, 第 10 章 54/125

55 10.6 词义消歧 基本方法 早期基于规则的消歧方法 统计机器学习消歧方法 有监督学习方法 无监督学习方法 基本思路 : 一个词的不同语义一般发生在不同的上下文中 基于词典信息的消歧方法 宗成庆 : 自然语言处理 讲义, 第 10 章 55/125

56 10.6 词义消歧 有监督的词义消歧方法 总体思路 : 通过建立分类器, 利用划分多义词的上下文类别的方法来区分多义词的词义 基于互信息的消歧方法 (Brown et al., 1991) 基本思想 : 假设我们有一个双语对齐的平行语料库, 以法语和英语为例, 通过词语对齐模型每个法语单词可以找到对应的英语单词, 一个多义的法语单词在不同的上下文中对应多种不同的英语翻译 宗成庆 : 自然语言处理 讲义, 第 10 章 56/125

57 10.6 词义消歧 例子 : prendre une mesure to take a measure prendre une décision to make a decision 也就是说, 法语动词 prendre 可以被翻译成 to take, 也可以被翻译成 to make, 这取决于它所带的宾语是 mesure 还是 décision 宗成庆 : 自然语言处理 讲义, 第 10 章 57/125

58 10.6 词义消歧 可以把一个多义的法语单词的英语译词看作是这个法语单词的语义解释, 而决定法语多义词语义的条件看作是语义指示器 (indicator), 如 : 前面例子中法语单词 prendre 所带的宾语 因此, 只要我们知道了多义词的语义指示器, 也就确定了该词在特定上下文中的语义 这样, 多义词的词义消歧问题就变成了语义指示器的分类问题 假设 T 1, T 2,, T m 是一个多义法语词的英语译文 ( 或语义 ),V 1, V 2,, V n 是指示器可能的取值 宗成庆 : 自然语言处理 讲义, 第 10 章 58/125

59 10.6 词义消歧 利用 Flip-Flop 算法来解决指示器分类问题 ( 假设多义 法语词只有两个语义 ): (1) 随机地将 T 1, T 2,, T m 划分为两个集合 P={P 1, P 2 } (2) 执行如下循环 : (a) 找到 V 1, V 2,, V n 的一种划分 Q={Q 1, Q 2 }, 使 Q i 与 P i 之间的互信息最大 ; (b) 找到的一种改进的划分 P, 使 P 与 Q 的互信息 最大 宗成庆 : 自然语言处理 讲义, 第 10 章 59/125

60 10.6 词义消歧 一旦指示器的取值划分确定了, 词义消解就变成了如下简单的过程 : (1) 对于出现的歧义词确定其指示器值 V i ; (2) 如果 V i 在 Q 1 中, 指定该歧义词的语义为语义 1, 如果在 Q 2 中, 指定其语义为语义 2 如果法语词有多个歧义的话, 扩展算法请见 : Peter F. Brown, Stephen A. Della Pietra et al., A Statistical Approach to Sense Disambiguation in Machine Translation, Proc. DARPA Workshop on Speech and Natural Language, 1991, pp 宗成庆 : 自然语言处理 讲义, 第 10 章 60/125

61 10.6 词义消歧 基于贝叶斯分类器的词义消歧方法 基于最大熵的词义消歧方法参见本讲义第 2 章 宗成庆 : 自然语言处理 讲义, 第 10 章 61/125

62 10.6 词义消歧 基于词典的词义消歧方法 (1) 基于语义定义的消歧基本思想 : 词典中词条本身的定义作为判断其语义的条件 宗成庆 : 自然语言处理 讲义, 第 10 章 62/125

63 10.6 词义消歧 例如,cone 在词典中有两个定义 : 一个是指 松树的球果, 另一个是指 用于盛放其他东西的锥形物, 比如, 盛放冰激凌的锥形薄饼 如果在文本中, 树 (tree) 或者 冰 (ice) 分别与 cone 同现时,cone 的语义就可以确定了, tree 对应 cone 的语义 1,ice 对应 cone 的语义 2 宗成庆 : 自然语言处理 讲义, 第 10 章 63/125

64 10.6 词义消歧 (2) 基于义类辞典 (thesaurus) 的消歧 基本思想 : 多义词的不同义项在使用时往往具有不同的上下文语义类, 即通过上下文的语义范畴可以判断多义词的使用义项 宗成庆 : 自然语言处理 讲义, 第 10 章 64/125

65 10.6 词义消歧 如 crane 的两个词义 鹤 和 起重机 分别属于语义类 ANIMAL 和 MACHINERY 不同的语义类往往具有不同的上下文环境, 如 : 经常表示 ANIMAL 语义类的共现词语为 species family eat 等, 而表示 MACHINE 语义类的共现词语则为 tool engine blade 等 因此, 只要确定多义词的上下文词的义类范畴, 就确定了多义词的词义 宗成庆 : 自然语言处理 讲义, 第 10 章 65/125

66 10.6 词义消歧 (3) 基于双语词典的消歧 基本思想 : 需要消歧的语言称为第一语言, 把需要借助的另一种语言称为第二语言 建立多义词 x 与相关词 y 之间的搭配关系, 然后, 在第二种语言的语料库中统计对应 x 不同词义的翻译与相关词 y 的翻译同现的次数, 同现次数高的搭配对应的义项即为消歧后的词义 宗成庆 : 自然语言处理 讲义, 第 10 章 66/125

67 10.6 词义消歧 例如 : 单词 plant 有两个含义 : 植物 和 工厂 当对 plant 进行词义消歧时, 需要首先识别出含有 plant 的短语, 如 :manufacturing plant, 然后, 在汉语语料库中搜索与这个短语对应的汉语短语实例, 由于 manufacturing 的汉语翻译 制造 只和 工厂 共现, 因此, 可以确定在这个短语中 plant 的词义为 工厂 而短语 plant life 在汉语翻译中, 生命 (life) 与 植物 共现的机会更多, 因此, 可以确定在短语 plant life 中 plant 的词义为 植物 宗成庆 : 自然语言处理 讲义, 第 10 章 67/125

68 10.6 词义消歧 (4)Yarowsky 消歧算法基本思想 : 基于词典的词义消歧算法都是分别处理每个出现的歧义词, 且对歧义词有两个限制 : 每篇文本只有一个意义 : 在任意给定的文本中, 目标词的词义具有高度的一致性 ; 每个搭配只有一个意义 : 目标词和周围词之间的相对距离 词序和句法关系, 为目标词的意义提供了很强的一致性的词义消歧线索 宗成庆 : 自然语言处理 讲义, 第 10 章 68/125

69 10.6 词义消歧 在 Yarowsky 消歧算法中的处理方法 : (1) 对于第一个约束, 如果一个给定的多义词第一次出现时使用某个义项, 那么, 它在后面出现时也很有可能使用这个义项 (2) 对于第二个约束,Yarowsky (1995) 采用基于自举 (bootstrapping) 的 ( 半监督 ) 学习技术 搭配特征依据如下比率排序 : p( sk f ) 1 两个义项与特征同现的 p( s f ) k 2 次数之比 其中, s ki 为词义,f 为搭配特征 宗成庆 : 自然语言处理 讲义, 第 10 章 69/125

70 10.6 词义消歧 无监督的词义消歧方法 H. Schütze (1998) 提出的上下文分组辨识 (context-group discrimination) 方法是无监督的词义消歧方法的典型代表 与 (Gale, 1992) 方法类似, 对于一个具有 k 个义项的词 w, 估计使用义项 s i (k i 1) 的上下文中出现词 v j 的概率, 即 p(v j s i ) 宗成庆 : 自然语言处理 讲义, 第 10 章 70/125

71 10.6 词义消歧 但是, 在该方法中参数 p(v j s i ) 的估计不是根据有标注的训练语料, 而是在无标注的语料上进行, 开始时随机地初始化参数, 然后根据 EM 算法重新估计该概率值 主要问题在于, 很多同义词的同一个意义出现的上下文往往有很大的差异, 因此, 很难保证同一个意义的上下文被划分到同一个等价类中 宗成庆 : 自然语言处理 讲义, 第 10 章 71/125

72 10.6 词义消歧 为了解决这个问题,H. Schütze (1992) 对词汇集中的每一个词 w 定义了关联向量 (associate vector), 该向量为 w 的 平均上下文 上标表示词汇集中的词形 (type), 如 表示词汇集中的第 j 个 词 ; 下标表示一个词在语料库中的一次具体使用, 简称为 w k j 词用 (token), 表示语料库中的第 k 个词 ;n 为词的个数, c n j 1 2 A ( w) ( wk, w ) ck, ck,, c i 1 j 即语料库大小 ; k为词形 w 出现在 w k 的上下文中的次数 ; (, ) 为 Kronecker 函数 w j w k 宗成庆 : 自然语言处理 讲义, 第 10 章 72/125

73 10.6 词义消歧 关于该工作的详细介绍请参阅 : [Schütze, 1992a] Schütze, Hinrich Context Space. In Working Notes of the AAAI Fall Symposium on Probabilistic Approaches to Natural Language, Menlo Park, CA. AAAI Press. Pages [Schütze, 1992b] Schütze, Hinrich Word Sense Disambiguation with Sublexical Representation. In Proceedings of the 1992 AAAI Workshop on Statistically-based Natural Language Programming Techniques. Pages 宗成庆 : 自然语言处理 讲义, 第 10 章 73/125

74 10.7 语义角色标注 宗成庆 : 自然语言处理 讲义, 第 10 章 74/125

75 10.7 语义角色标注 语义角色标注 (semantic role labeling, SRL) 的任务 自动语义角色标注方法是近几年来国际研究的热点, 其基本任务是以句子为分析单位, 以句子中的谓词为核心, 分析句子中的其他成分与谓词之间的关系 如 : [ 他们 ] Agent [ 昨天 ] Time [ 在北京 ] Location [ 讨论 ] Pred 了 [ 方案 ] Patient 语义角色标注一般是在句法分析的基础上进行的 宗成庆 : 自然语言处理 讲义, 第 10 章 75/125

76 10.7 语义角色标注 SRL 的主要用途 : 信息抽取 自动文摘 机器翻译等 目前用于 SRL 研究的主要资源有 : 框架网 (FrameNet) 英语命题库 (Proposition Bank, PropBank) 英语名词命题库 (NomBank) 宗成庆 : 自然语言处理 讲义, 第 10 章 76/125

77 10.7 语义角色标注 命题库将宾州树库 (Treebank) 中的 华尔街日报 语料和一部分布朗语料 (Brown Corpus) 进行了人工的语义角色标注 两类语义角色 : 与具体谓词直接相关的, 这些角色用 ARG0,ARG1,, ARG5 表示, 如 ARG0 通常表示动作的施事,ARG1 通常表示动作的影响等,ARG2-ARG5 对于不同的谓语动词会有不同的语义含义 ; 起修饰作用的辅助性角色, 其角色标签都以 ARGM 开头, 常见的有表示时间的角色 ARGM-TMP, 表示地理位置的角色 ARGM-LOC, 表示一般性修饰成分的角色 ARGM- ADV 等 宗成庆 : 自然语言处理 讲义, 第 10 章 77/125

78 10.7 语义角色标注 例句 :It operates stores mostly in Iowa and Nebraska. NP PRP It ARG 0 S VBZ operates predicate VP NP NNS stores ARG1 宗成庆 : 自然语言处理 讲义, 第 10 章 78/125 NP PP mostly in Iowa and Nebraska ARGM-LOC 谓词是 : operates, 它有三个论元 : It (ARG0) stores (ARG1) mostly in Iowa and Nebraska (ARGM-LOC), 这三个语义角色都处在句法树的某个节点上

79 10.7 语义角色标注 命题库仅针对动词性谓词进行了标注, 但名词化的谓词 ( 如 :investment) 也会经常出现 因此, 为了弥补命题库仅标注动词性谓词的缺陷, 纽约大学的研究人员同样对宾州树库中的 华尔街日报 语料进行了标注, 但标注的谓词是句子中名词化的谓词, 所以该语料称作名词命题库 (NomBank) 例如, 在名词短语 John s replacement Ben 中, 名词 replacement 是谓词,Ben 是 ARG0, 表示替代者 ;John 是 ARG1 表示被替代者 目前, 名词命题库共包含 个名词化谓词的标注实例 宗成庆 : 自然语言处理 讲义, 第 10 章 79/125

80 10.7 语义角色标注 中文语义角色标注的语料库主要有 Chinese PropBank (CPB) 和 Chinese NomBank 它们都是在中文树库 (Chinese Treebank) 的句法成分中加入了人工标注的语义角色信息 也把语义角色分为两类 : 核心语义角色 ARG0, ARG1,,ARG4, 如 ARG0 表示动作的施事者,ARG1 表示受事者 ; 起修饰作用的辅助性角色, 其角色标签都以 ARGM 开头, 如 ARGM-TMP 表示时间, ARGM- LOC 表示地点等 语义角色 ARG0 ARG1 ARG2 ARG3 ARG4 ARGM-ADV ARGM-BNF ARGM-CND ARGM-DIR ARGM-LOC ARGM-MNR ARM-PRP ARGM-TMP ARGM-TPC ARGM-PRD 角色描述施事者受事者范围或程度动作起点动作结束点状语受益者条件方向地点方式目的时间主题次谓词 宗成庆 : 自然语言处理 讲义, 第 10 章 80/125

81 10.7 语义角色标注 语义角色标注的基本流程 : 给定句子句法分析结果句法分析器 尽量减少候选项的数目 候选论元剪除 SRL 结果 后处理 论元标注 论元识别 删除重复论元等 标注过程 : 多类分类问题 识别真正的论元 : 两类分类问题 宗成庆 : 自然语言处理 讲义, 第 10 章 81/125

82 10.7 语义角色标注 1. 基于短语结构句法分析的 SRL 方法 (Xue and Palmer, 2004) 候选论元剪枝 : 第 1 步 : 将谓词作为当前节点, 依次考察它的兄弟节点 : 如果一个兄弟节点和当前节点在句法结构上不是并列的 (coordinated) 关系, 则将它作为候选项 如果该兄弟节点的句法标签是 PP, 将它的所有子节点也都作为候选项 第 2 步 : 将当前节点的父节点设为当前节点, 重复第 1 步的操作, 直至当前节点是句法树的根节点 宗成庆 : 自然语言处理 讲义, 第 10 章 82/125

83 10.7 语义角色标注 候选论元集合 { } +NP: 事故原因 +ADVP: 正在 详细 出现并列情况, 不加 +NP: 警方 宗成庆 : 自然语言处理 讲义, 第 10 章 83/125

84 10.7 语义角色标注 论元识别和标注 : 论元识别和标注看作一个分类问题, 在这一阶段最重要的工作是为分类器选择有效的特征 常用的一些有效特征有 : 谓词本身 路径 (path): 句法树上从论元到谓词的路径, 如上面图中的 A0 论元到谓词的路径就是 :NP IP VP VP VP VV 宗成庆 : 自然语言处理 讲义, 第 10 章 84/125

85 10.7 语义角色标注 短语类型 (phrase type): 论元所对应的句法树节点的句法标签 位置 (position): 论元出现在谓词之前还是之后 语态 (Voice): 谓词是主动语态还是被动语态 中心词 (Head Word): 论元的中心词及其词性 从属类别 (Sub-categorization): 展开谓词父节点的上下文无关规则, 如前面图中谓词的从属类别就是 VP ADVP ADVP VP 论元的第一个和最后一个词 组合特征 (Combination features): 谓词 + 中心词, 谓词 + 短语类型等 分类器 : 最大熵 SVM 感知机等 宗成庆 : 自然语言处理 讲义, 第 10 章 85/125

86 10.7 语义角色标注 2. 基于依存关系的 SRL 方法 与基于短语结构句法分析的 SRL 方法的区别 : 基于短语结构句法分析的语义角色标注方法中, 一个论元被表示为连续的几个词 ( 短语 ) 和一个语义角色标签 但在基于依存句法分析的语义角色标注中, 一个论元被表示为一个中心词和一个语义角色标签 因此, 在这种方法中, 谓词论元关系可以表示为谓词与论元的中心词之间的关系 宗成庆 : 自然语言处理 讲义, 第 10 章 86/125

87 10.7 语义角色标注 依存关系 调查 的论元关系 宗成庆 : 自然语言处理 讲义, 第 10 章 87/125

88 10.7 语义角色标注 候选论元剪除方法 : 第 1 步 : 将谓词作为当前节点, 将它所有的孩子都作为候选项 ; 第 2 步 : 将当前节点设为它的父节点, 重复第 1 步的操作, 直到当前节点是依存句法树的根节点 宗成庆 : 自然语言处理 讲义, 第 10 章 88/125

89 10.7 语义角色标注 谓词 调查 的所有孩子 { 正在, 详细, 原因, 警察 } 都加入到候选项中 这里该些孩子节点恰好是该谓词的所有论元 宗成庆 : 自然语言处理 讲义, 第 10 章 89/125

90 10.7 语义角色标注 从上述过程可以看出, 基于依存句法的语义角色标注最终都是在判断谓词和候选的词之间的关系 于是, 无论是论元识别还是论元标注, 其核心都是判断一对词之间的关系 论元识别和论元标注都被作为分类问题 几种最常用的特征包括 : 谓词 (predicate): 谓词本身及其词根 谓词的词义 : 谓词在语料中的词义类别 谓词词性 (predicate POS): 谓词的词性 谓词父节点的词及词性 谓词与其父节点之间的依存关系类别 宗成庆 : 自然语言处理 讲义, 第 10 章 90/125

91 10.7 语义角色标注 依存关系路径 (relation path): 依存句法树上从候选词到谓词的路径 ; 例如上图中从 事故 到谓词的路径就是 NMOD OBJ 位置 (position): 论元出现在谓词之前还是之后 语态 (voice): 谓词是主动语态还是被动语态 从属类别 (dependency sub-categorization): 谓词的所有孩子对它的依存关系, 如上图中谓词 调查 的依存从属类别是 SBJ_VMOD_VMOD_OBJ 候选词本身 候选词最左边和最右边的孩子的词与词性 候选词左边和右边最近的兄弟的词与词性 宗成庆 : 自然语言处理 讲义, 第 10 章 91/125

92 10.7 语义角色标注 3. 基于语块分析的 SRL 方法 用语块分析 (Chunking) 的结果来进行语义角色标注 谓词 - 论元关系的表示方法与基于短语句法分析中的表示方法相同, 每一个论元都表示为连续的几个词 将语义角色标注作为一个序列标注 基本思路 : 将语义角色标注作为一个序列标注问题来解决 一般采用 IBO 的方式来定义序列标注的标签集, 将不同的语块赋予不同的标签 不需要剪除候选论元, 论元识别和标注同时进行 宗成庆 : 自然语言处理 讲义, 第 10 章 92/125

93 举例 : 10.7 语义角色标注 宗成庆 : 自然语言处理 讲义, 第 10 章 93/125

94 10.7 语义角色标注 其他方法 : 多种方法的融合策略 基于深度信念网络 (deep belief network, DBN) 的 SRL 方法 宗成庆 : 自然语言处理 讲义, 第 10 章 94/125

95 10.7 语义角色标注 现有方法存在的主要问题 : 对句法分析器性能的严重依赖性 领域适应能力差 基本性能 : 英语 汉语 :F1 值大约为 : 70 % 左右 (68%~76%) 宗成庆 : 自然语言处理 讲义, 第 10 章 95/125

96 10.8 词向量表示 宗成庆 : 自然语言处理 讲义, 第 10 章 96/125

97 10.8 词向量表示 如何建立有效的词汇表示? 这个那个这些 今天明天昨天 单调枯燥无聊 一月三月五月 低维 稠密的连续实数空间 枯燥 无聊 Word2Vec Word embedding 宗成庆 : 自然语言处理 讲义, 第 10 章 97/125

98 10.8 词向量表示 985 个英语词汇在大脑中的分布图 语义加工在大脑左右半球基本上是对称的, 打破了传统研究中认为语言加工左半球偏侧化的情况 不同个体大脑的整个语义网络 看起来特别相似 Alezander G. Huth, Wendly A. Heer et al., Natural speech reverals the semantic maps that tile human cerebral cortex, Nature, April 28, 2016, 532: 453~ 458 宗成庆 : 自然语言处理 讲义, 第 10 章 98/125

99 10.8 词向量表示 如何实现语义组合? 蓝 + 天 = 蓝天? 白 + 云 白云 疾 + 病 疾病 图 + 书 图书 宗成庆 : 自然语言处理 讲义, 第 10 章 99/125

100 10.8 词向量表示 实现短语 句子语义组合 蓝天白云间回荡着悠悠牧歌 宗成庆 : 自然语言处理 讲义, 第 10 章 100/125

101 10.8 词向量表示 颜色 天空 海洋, 蓝天, 草原 天空, 云朵, 彩虹 云朵 蓝天白云 牧歌 草原, 羊群, 歌声 概念 i =? i=1 n 概念 + 语法? 宗成庆 : 自然语言处理 讲义, 第 10 章 101/125

102 10.8 词向量表示 基于文本的词汇语义表示模型 共现矩阵方法 计数 我 爱 大 自然 我 爱 大 自然 训练样本 宗成庆 : 自然语言处理 讲义, 第 10 章 102/125

103 10.8 词向量表示 神经网络方法 基于文本学习词汇语义表示 用周围词预测中间词的方法 连续词包模型 (CBOW) 将相邻的词向量直接相加得到隐层, 用隐层预测中间词的概率 Mikolov et al. (2013) 宗成庆 : 自然语言处理 讲义, 第 10 章 103/125

104 10.8 词向量表示 连续 skip-gram 模型 : 通过中间词预测周围词的概率 Mikolov et al. (2013) 宗成庆 : 自然语言处理 讲义, 第 10 章 104/125

105 10.8 词向量表示 基于图像学习词汇语义表示 特征描述子, 如 SIFT 算法, 直接提取图像的关键点等特征 利用卷积神经网络 (CNN) 提取图像的特征 宗成庆 : 自然语言处理 讲义, 第 10 章 105/125

106 10.8 词向量表示 基于语音学习词汇语义表示 利用声学特征 宗成庆 : 自然语言处理 讲义, 第 10 章 106/125

107 10.8 词向量表示 基于多模态信息学习词汇语义表示 same weight different weight 宗成庆 : 自然语言处理 讲义, 第 10 章 107/125

108 10.8 词向量表示 (1) 我们的思路 : 利用关联词对作为弱监督信号 才华 - 知识 / 蓝天 - 白云 / 快乐 - 开心 宗成庆 : 自然语言处理 讲义, 第 10 章 108/125

109 10.8 词向量表示 模型结构 : 训练目标函数 : 最大间距 (MM) 宗成庆 : 自然语言处理 讲义, 第 10 章 109/125

110 10.8 词向量表示 词汇相似度 / 相关度数据集测试结果 : MEN, SIMLEX, SEMSIM, SIMVERB, WORDSIM, WORDREL 为不同的测试集 ; VIS: 有图片模态的词汇 ; ZS: 没有图片模态的词汇 宗成庆 : 自然语言处理 讲义, 第 10 章 110/125

111 10.8 词向量表示 (2) 多模态词汇表示的可解释性研究 Brain semantic representation 宗成庆 : 自然语言处理 讲义, 第 10 章 111/125

112 10.8 词向量表示 基于人脑的成分语义表征 happy dog J. R. Binder et al Toward a brain-based componential semantic representation. Cognitive Neuropsychology, 33(3-4): 宗成庆 : 自然语言处理 讲义, 第 10 章 112/125

113 10.8 词向量表示 计算模型得到的语义表征 维度的含义未知 happy dog 宗成庆 : 自然语言处理 讲义, 第 10 章 113/125

114 10.8 词向量表示 我们提出 : 用表征相似性分析方法和大脑的成分语义表征解释 Dissimilarity matrices of brain-based representations Vision Somatic 2 基于计算词汇向量的每两个词间的相似度 1 Dissimilarity matrix of distributed representations 基于成分语义中特征向量的每两个词间的相似度 Audition Motor Emotion 3 Correlation analysis 宗成庆 : 自然语言处理 讲义, 第 10 章 114/125

115 10.8 词向量表示 发现 1: 不同模态得到的词汇表示编码了不同类型的属性 Sensory and motor Abstract 宗成庆 : 自然语言处理 讲义, 第 10 章 115/125

116 10.8 词向量表示 发现 2: 词汇语义表示模型在实体词和抽象词上的表现不同 Sensory and motor Abstract 宗成庆 : 自然语言处理 讲义, 第 10 章 116/125

117 10.8 词向量表示 (3) 融合词汇内部结构的中文句子表示模型 不同类型的字对词汇含义影响不同 原子词汇表示和组合词汇表示对最终词汇含义影响不同 - 宗成庆 : 自然语言处理 讲义, 第 10 章 117/125

118 10.8 词向量表示 (4) 借鉴人类注意力分配机制的语义表示模型 Dundee 人类阅读时间语料库 : Reading time/word the two young sea-lions took RTfpass RTgopast RTrb 预测因素 : Surprisal POS tag CCG supertag Word length Word frequency 宗成庆 : 自然语言处理 讲义, 第 10 章 118/125

119 10.8 词向量表示 s x t = log(p(x t x 1,, x t 1 )) Composition function: Addition / Multiplication / RNN 惊异度 (Surprisal) Attention model attention x t = exp(s x t) i [1,,n] exp(sx i ) 词汇向量 词性向量 CCG 范畴向量 the two young sea-lions attention x t = x exp(w t x w W t c ) x i x W i c ) i [1,,n] exp(w w 宗成庆 : 自然语言处理 讲义, 第 10 章 119/125

120 10.8 词向量表示 实验对比 宗成庆 : 自然语言处理 讲义, 第 10 章 120/125

121 10.8 词向量表示 注意力模型是否与人阅读是的眼动数据一致呢? 宗成庆 : 自然语言处理 讲义, 第 10 章 121/125

122 10.8 词向量表示 欢迎参阅 : S. Wang and C. Zong. Comparison Study on Critical Components in Composition Model for Phrase Representation, ACM TALLIP, 16(3), Article 16, 25 pages, January 2017 S. Wang et al. Empirical Exploration of Chinese Sentence Representation with Innerword Characters. ACM TALLIP, accepted S. Wang et al. Learning Sentence Representation with Guidance of Human Attention. Proc. IJCAI 2017, pp S. Wang et al. Learning Multimodal Word Representation via Dynamic Fusion Methods. Proc. AAAI-2018 S. Wang et al. Investigating Inner Properties of Multimodal Representation and Semantic Compositionality with Brain-based Componential Semantics. Proc. AAAI-2018 S. Wang et al. Exploiting Word Internal Structures for Generic Chinese Sentence Representation. Proc. EMNLP 2017, Copenhagen, Denmark, September 9-11, 2017, pp 宗成庆 : 自然语言处理 讲义, 第 10 章 122/125

123 本章小结 语义分析的基本任务及其面临的困难 语义计算研究概括及常见的语义理论 格语法 ( 定义 格框架约束分析 ) 语义网络 ( 概念 关系 语义网络表示 事件的语义关系 基于语义网络的推理分析 ) CD 理论 ( 三个层次 : 基本动作 剧本 计划 ) 词义消歧 ( 规则方法 统计方法 词典法 ) 语义角色标注的基本概念和方法 词向量表示 宗成庆 : 自然语言处理 讲义, 第 10 章 123/125

124 习题 阅读有关 HowNet 和 HNC 理论的文献, 了解相关工作及其 同义词词林 在自然语言处理中的应用 了解蒙塔格语法 (Montague Grammar) 阅读有关词义消歧的论文, 了解词义消歧的相关工作 阅读有关语义角色标注的论文, 了解相关工作 下载并调试运行和对比词向量学习工具 宗成庆 : 自然语言处理 讲义, 第 10 章 124/125

125 Thanks 谢谢! 宗成庆 : 自然语言处理 讲义, 第 10 章 125/125

, CAS-IA

, CAS-IA ( 10 ) cqzong@nlpr.ia.ac.cn http://www.nlpr.ia.ac.cn/english/cip/cqzong.htm No.95, Zhongguancun East Road Beijing 100080, China http://www.ia.ac.cn Tel. No.: +86-10-6255 4263 , CAS-IA 2004-5-13 2 10.1

More information

PowerPoint Presentation

PowerPoint Presentation 第 10 章语义分析 北京市海淀区中关村东路 95 号 邮编 :100190 电话 : +86-10-8254 4688 邮件 :cqzong@nlpr.ia.ac.cn 10.1 概述 宗成庆 : 自然语言理解 讲义, 第 10 章 2/97 10.1 概述 语义计算的任务 : 解释自然语言句子或篇章各部分 ( 词 词组 句子 段落 篇章 ) 的意义 面临的困难 : 自然语言句子中存在大量的歧义,

More information

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A83130A3A9D3EFD2E5BCC6CBE32E707074>

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A83130A3A9D3EFD2E5BCC6CBE32E707074> 第 10 章语义计算 No.95, Zhongguancun East Road Beijing 100080, China http://www.ia.ac.cn Tel. No.: +86-10-6255 4263 10.1 概述 10.1 概述 语义计算的任务 : 解释自然语言句子各个部分 ( 词 词组及句子 ) 的意义 面临的困难 : (1) 自然语言句子中存在大量的歧义, 涉及指代 同义

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 自然语言处理中的深度学习 从词语表示到句子表示 张家俊中国科学院自动化研究所 www.nlpr.ia.ac.cn/cip/jjzhang.htm jjzhang@nlpr.ia.ac.cn 自然语言处理 - 搜索引擎 2 自然语言处理 - 机器翻译 3 自然语言处理 - 自动摘要 4 自然语言处理 - 主题分析 5 自然语言处理 - 文本分类 6 自然语言处理 - 问答聊天 7 研究任务 - 词法分析

More information

+$ 6" 空格前是动词 " 因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此

+$ 6 空格前是动词  因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此 选词填空练习参考答案和解析 /$3 分析句子结构 空格处应填动词谓语 " 明显是一个定语从句 且时态是现在式 因此空格处应填的动词应是动词现在式 再从语义上分析 只有 反映 合适 *$ 空格前是一个形容词 后面是介词 因此只能填名词 而且应该是单数 $ 空格前是形容词 因此应填名词或代词 仔细分析句子 可以判断 "! 在句中作动词 从词义搭配上来看 只有 合适.$8 &"! 空格前是介词 #" 而后面则一个逗号

More information

PowerPoint Presentation

PowerPoint Presentation (Chinese FrameNet CFN) Web CFN , 80 MT IE WSD (1) PropbankPenn TreeBank 50 1999 Sinica Treebank (2) Schank(1975) Conceptual Dependency, CD (3) Fillmore Frame WordNet MindNet ILD FrameNet HowNet CCD 1

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

基于矩阵分解和矩阵变换的多义词向量研究

基于矩阵分解和矩阵变换的多义词向量研究 hyshi@pku.edu.cn 2018 6 9 Content 1 PCA VS. RPCA 2 2 3 [1] star s1 star s2 star s3 algorithm s1 algorithm s2 stars, movie, song, MVP stars, award, eagle, two-time supergiant, constellation, aurigae hash,

More information

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 Cet 4 大学英语四级翻译 Jesse Yang Lu Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 I am a student. 基本句式 I am a student. 基本句式 I am beautiful. I am a student. 主系表 基本句式

More information

Microsoft PowerPoint - 诓敧-8.19

Microsoft PowerPoint - 诓敧-8.19 考研英语二语法与长难句 王丽 关于词的那些事 1 学习目标 什么是词? 什么是语? 英语中的词性有哪些? 每种词性最重要的使用规则是什么? 什么是词? 什么是语? 单词 : persistence [pəˈsistəns] n. 坚持不懈 句子 : Persistence is the key to success. 坚持不懈是成功的关键 句法核心 :XX 词在句中作 XX 语 词 : 词性, 每个单词自然属性

More information

A B A B S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * X Y

A B A B S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * X Y * / 1. 1 + + + 1 NPL + V + + NP A 1 B 5 2 6 3 7 4 8 * 1 2009. 10 557 24 2010 4 1996 2001 2001 2005 2006 2006 A B A B 2003 64 S + V + Pt or Complement + Num-MP + O a b SVO c 2 9 * 10 * 11 12 1. 2 1 + +

More information

: 1, ( high2accessibil2 ity),,,,,, : (3),,,,!,,? :,!?? ( ) ( ),, :?? ( ),,,,, (3),,,,,,,, : (4) a., :,, b.,,:,,, (4aΠb),,,,,,, 2 + + N + V + + N + V,

: 1, ( high2accessibil2 ity),,,,,, : (3),,,,!,,? :,!?? ( ) ( ),, :?? ( ),,,,, (3),,,,,,,, : (4) a., :,, b.,,:,,, (4aΠb),,,,,,, 2 + + N + V + + N + V, 2002 1 ( 59 ) Ξ + + Np + V + + Np + V, + + Np + V+ Np, + + Np + V : 0 (1) a.,,, b.,,,, ( ) (2) a.???, b. (,1985) (1a) (1b) ; (2a) (2b),,,, (1a) (2a),, (1b) (2b),,,,,,,? Ξ,, 18 : 1, ( high2accessibil2 ity),,,,,,

More information

并非没有必要的一些宏观思考

并非没有必要的一些宏观思考 第 一 章 引 论 第 一 章 引 论 1.1 课 题 的 提 出 1 本 课 题 的 研 究 工 作 是 尝 试 在 句 法 和 语 义 两 个 层 级 上 归 纳 现 代 汉 语 短 语 结 构 的 组 合 规 则, 解 决 计 算 机 分 析 现 代 汉 语 短 语 时 碰 到 的 结 构 歧 义 问 题 有 别 于 以 往 主 要 是 面 向 人 的 语 法 研 究, 本 课 题 的 研 究

More information

22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research IF: Interchange Format [12] C-STAR IF 1. IF IF [14

22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research IF: Interchange Format [12] C-STAR IF 1. IF IF [14 Journal of Chinese Language and Computing, 14 (1) 21-34 21 100080 {caowj, cqzong, xubo}@nlpr.ia.ac.cn 1 22 Wenjie Cao, Chengqing Zong and Bo Xu C-STAR: Consortium for Speech Translation Advanced Research

More information

控儔湮悝笢恅炵蔡釱 2005爛3堎28

控儔湮悝笢恅炵蔡釱 2005爛3堎28 2005 3 28 讲 认础 统 论 学 1. 2. - - 语 语 语义 - - - - Pinker 1999: 298-299 - - the mind competence system - - performance systems Chomsky 2000: 28 competence as a generative procedure Chomksy I-Language (1993/1995,

More information

幻灯片 1

幻灯片 1 Custom makes all things easy! 本讲任务 一. 人称代词主格, 宾格 二. 形容词性物主代词与名词性物主代词 三. 反身代词 一. 人称代词 主格, 宾格 句子成分 I broke two windows. 句子成分 I broke two windows. 句子成分 I broke two windows. 主语 句子成分 I broke two windows. 主语

More information

54 48 6-7 word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra

54 48 6-7 word2vec 8-10 GloVe 11 Word2vec X king - X man X queen - X woman Recurrent Neural Network X shirt - X clothing X chair - X furniture 2 n-gra Journal of South China Normal University Natural Science Edition 2016 48 3 53-58 doi 106054 /jjscnun201605006 1 2* 2 3 2 1 510631 2 3 510225 Glove TP3911 A 1000-5463 2016 03-0053-06 Research on Academic

More information

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending]

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending] Ch. 7 形容词 [Adjectives]: 目标 有些教科书要求掌握形容词的屈折变化 我的课不要求 你需要掌握的内容 : 1. 基于形容词的字尾识别其性和数 2. 找出形容词的词典形 3. 识别形容词在上下文中的具体用法 ( 名词 [substantival], 谓语 [predicate], 或属性 [attributive]). 4. 根据不同的用法翻译形容词 7-1 Ch. 7 形容词 [Adjectives]:

More information

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L 一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE LOIS2016-85(2017-03) Technical Report INFORMATION AND

More information

数理逻辑 I Mathematical Logic I

数理逻辑 I  Mathematical Logic I 前情提要 前情提要 我们定义了两种 可定义 概念结构内的可定义性 : 给定结构关于该结构论域上的 k 元关系的性质由一个公式定义定义结构类 : 给定语言关于该语言的结构类的由一则闭语句定义 ( 初等类 ); 由一集闭语句定义 ( 广义初等类 ) 前情提要 我们定义了两种 可定义 概念结构内的可定义性 : 给定结构关于该结构论域上的 k 元关系的性质由一个公式定义定义结构类 : 给定语言关于该语言的结构类的由一则闭语句定义

More information

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作 * 夏传玲 : 本文简要回顾了国内外定性研究在最近 多年的发展概况, 总结 了定性研究的六个发展趋势和分析策略上的三种流派 在上述两种背景下, 本文探讨了计算机辅助的定性分析给定性研究带来的机遇和挑战, 特别是它和手工操作对比时的优势和劣势, 以及应用这种定性分析技术所可能面临的困难 : 定性研究定性分析 文化差异,, (, ),,,, ( - ) ( - ) ( - ) ( - ) ( - ) (

More information

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, : 24 3 2010 5 J OU RNAL OF CHIN ESE IN FORMA TION PROCESSIN G Vol. 24, No. 3 May, 2010 : 100320077 (2010) 0320117207 1, 1, 1, 2 (1.,100871 ; 2.,100084) :,,,,,,; : ( ) ( ) (,3 600 ),, ABC : ;; ; ; ;;; : TP391

More information

深教〔2013〕 号

深教〔2013〕   号 深 教 2015 120 号 深 圳 市 教 育 局 关 于 公 布 2014 年 中 小 学 优 质 课 例 视 频 资 源 建 设 获 奖 单 位 和 个 人 名 单 的 通 知 各 区 教 育 局 各 新 区 公 共 事 业 局, 市 局 直 属 各 学 校 : 我 局 2014 年 开 展 的 中 小 学 优 质 课 例 视 频 资 源 征 集 及 在 线 展 播 活 动 第 二 届 微 课

More information

穨想覺得認為以為.PDF

穨想覺得認為以為.PDF -- d898702@oz.nthu.edu.tw mliu@cc.nctu.edu.tw -- (MARVS) 1. ( 1982) 1997 1988 1991 1986 1996 1 ( ) ( ) 2 1 2 3 4 5 6 1 2 6,005 4,132 719 4,441 Huang et al (2000) (Module-Attribute Representation of Verbal

More information

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai ATR-SLT (Advanced Telcommunications Research Institute Internat

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai ATR-SLT (Advanced Telcommunications Research Institute Internat Journal of Chinese Language and Computing 12(1)63-77 63 语译 汉语语 写 + * * 2 * * * + 100080, 2728 cqzong@nlpr.ia.ac.cn * ATR 619-0288 {yujie.zhang, kazuhide.yamamoto, masashi.sakamoto, satoshi.shirai}@atr.co.jp

More information

致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也

致 谢 本 人 自 2008 年 6 月 从 上 海 外 国 语 大 学 毕 业 之 后, 于 2010 年 3 月 再 次 进 入 上 外, 非 常 有 幸 成 为 汉 语 国 际 教 育 专 业 的 研 究 生 回 顾 三 年 以 来 的 学 习 和 生 活, 顿 时 感 觉 这 段 时 间 也 精 英 汉 语 和 新 实 用 汉 语 课 本 的 对 比 研 究 The Comparative Study of Jing Ying Chinese and The New Practical Chinese Textbook 专 业 : 届 别 : 姓 名 : 导 师 : 汉 语 国 际 教 育 2013 届 王 泉 玲 杨 金 华 1 致 谢 本 人 自 2008 年 6 月 从 上 海 外

More information

MAXQ BA ( ) / 20

MAXQ BA ( ) / 20 MAXQ BA11011028 2016 6 7 () 2016 6 7 1 / 20 1 2 3 4 () 2016 6 7 2 / 20 RoboCup 2D 11 11 100ms/ 1: RoboCup 2D () 2016 6 7 3 / 20 2: () 2016 6 7 4 / 20 () 2016 6 7 5 / 20 Markov Decision Theory [Puterman,

More information

网络“超常”形式单位认知研究与规范

网络“超常”形式单位认知研究与规范 汉 语 复 合 词 超 常 组 合 的 认 知 研 究 尹 铂 淳 ( 湖 南 师 范 大 学 外 国 语 学 院, 湖 南 长 沙 410081) 内 容 摘 要 : 汉 语 复 合 词 超 常 组 合 是 相 对 于 常 规 组 合 而 言 的, 是 人 类 思 维 创 新 的 体 现 经 历 过 超 常 组 合 的 汉 语 复 合 词 拥 有 令 人 难 以 准 确 把 握 的 词 义, 欲

More information

1對外華語文詞彙教學的策略研究_第三次印).doc

1對外華語文詞彙教學的策略研究_第三次印).doc 37 92 1 16 1 2 3 4 5 6 7 8????? 9????????? 10???????????????????? 11? 12 13 14 15 16 The Strategy Research of Teaching Chinese as a Second Language Li-Na Fang Department of Chinese, National Kaohsiung

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 多策略的机器翻译 王海峰 2006 年 11 月 21 日 提纲 概述 东芝的机器翻译研究 概况 规则方法 实例方法 统计方法 其它 多种方法的融合 讨论与展望 Page 2 三种主流机器翻译方法 对语言规律良好的概括和描述能力 规则方法 机器翻译产品仍以规则系统为主 仍有不断提高的潜力 (Zhu. 2005) 实例方法 统计方法 对相似句子相当精确的翻译能力 依然活跃 (MT Journal, MT

More information

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An - 23 5 2009 9 J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G Vol. 23, No. 5 Sep., 2009 : 100320077 (2009) 0520009210, (,) :,, ;,,,, ;,, : ;; ;;; : TP391 : A A Semantic Construction Model bet ween Adjectives

More information

一种快速获取领域新词语的新方法

一种快速获取领域新词语的新方法 1 一 种 快 速 获 取 领 域 新 词 语 的 新 方 法 2 刘 华 ( 暨 南 大 学 华 文 学 院, 广 州,510610) 摘 要 : 针 对 新 词 语 识 别 问 题, 直 接 抽 取 分 类 网 页 上 人 工 标 引 的 关 键 词, 按 照 其 网 页 栏 目 所 属 类 目 存 储 进 各 分 类 词 表, 快 速 完 成 新 词 语 识 别 和 聚 类 任 务, 简 单

More information

Wuhan Textile University M. A. S Dissertation Emotional Design of Home Textile Based on the Chinese Traditional Culture Wedding Bedding for Example Ca

Wuhan Textile University M. A. S Dissertation Emotional Design of Home Textile Based on the Chinese Traditional Culture Wedding Bedding for Example Ca 分 类 号 J523 学 校 代 码 10495 UDC 746 密 级 硕 士 学 位 论 文 基 于 中 国 传 统 文 化 的 家 用 纺 织 品 情 感 化 研 究 以 婚 庆 床 上 用 品 为 例 作 者 姓 名 : 郭 晓 彤 学 号 : 1115013015 指 导 教 师 : 学 科 门 类 : 高 波 副 教 授 艺 术 学 专 业 : 设 计 艺 术 学 研 究 方 向 : 完

More information

器之 间 向一致时为正 相反时则为负 ③大量电荷的定向移动形成电 流 单个电荷的定向移动同样形成电流 3 电势与电势差 1 陈述概念 电场中某点处 电荷的电势能 E p 与电荷量 q Ep 的比值叫做该点处的电势 表达式为 V 电场中两点之间的 q 电势之差叫做电势差 表达式为 UAB V A VB 2 理解概念 电势差是电场中任意两点之间的电势之差 与参考点的选择无关 电势是反映电场能的性质的物理量

More information

Microsoft PowerPoint - 8.第喫竀主仔呥义咓诓敧仔呥

Microsoft PowerPoint - 8.第喫竀主仔呥义咓诓敧仔呥 考研英语二语法与长难句 王丽 学习目标 什么是名词性从句? 名词性从句分为几类? 名词性从句引导词的用法? 名词性从句的位置? 1 名词 名词 : 表示人或事物的名称的词 名词在句中充当什么成分? Tom majors in chemistry. My brother, Tom, is a teacher. The handsome man is Tom. She dislikes Tom. 名词性从句的分类

More information

南華大學數位論文

南華大學數位論文 I II Abstract This study aims at understanding and analysing the general situation and predicament of current educational development in Savigi tribe and probing the roles played by the school, the family

More information

TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) MCQ 20 10% MCQ 20 10% Language Use and (1) Grammar (2) Vocabulary (3) Vocabulary Cloze (8m) 28 (

TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) MCQ 20 10% MCQ 20 10% Language Use and (1) Grammar (2) Vocabulary (3) Vocabulary Cloze (8m) 28 ( Standard English Language TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) Writing (15m) (40m) Write a story of at least 150 words about a given topic. A set of 3 unrelated pictures are provided.

More information

112 V1 V2 (nativespeaker) V1 V2 : (1) 獉獉 ( ) (2) (2010 ) 獉獉 (3) 獉獉 ( ) 獉獉 V1 V2 V R V R V R ( ) V1 V2 ( ) Li(1990) (1993) (1995) ( ) (2001) (2

112 V1 V2 (nativespeaker) V1 V2 : (1) 獉獉 ( ) (2) (2010 ) 獉獉 (3) 獉獉 ( ) 獉獉 V1 V2 V R V R V R ( ) V1 V2 ( ) Li(1990) (1993) (1995) ( ) (2001) (2 * : ( ) ( V1V2) ( V R) V1 V2 : (1)V1 V2 ;(2)V1 V2 ;(3)V1 V2 : ; ; ; ; (a) (b) (c) (d) a b c d (2005) ( V1V2) ( V1 V2 V R 1 ) * ( : 111098) ( :12YJA740104) 1 V ( ) V R; V1 V2 112 V1 V2 (nativespeaker) V1

More information

Genius English Grammar Glossary

Genius English Grammar Glossary www.alo7.com INDEX abbreviation 缩略语... 3 action verb 行为动词... 3 active voice 主动语态... 3 adjective 形容词... 3 adjective, comparative 形容词比较级... 3 adjective, demonstrative 指示形容词... 3 adjective, superlative 形容词最高级...

More information

東 吳 大 學 歷 史 學 系 碩 士 班 論 文 指 導 教 授 : 林 慈 淑 老 師 高 中 生 歷 史 因 果 概 念 之 探 究 以 太 平 天 國 為 例 Investigating into High school s Students Conception of Historical Causality An example of Taiping Heavenly Kingdom 研

More information

第一章

第一章 6.1 1. N-gram 2. 3. 4. 60 6.2 4.114.13 4.124.14 Rong Jin[7] TF*IDF - SARS SARS SARS SARS 61 62 [1] Michele Banko, Vibhu O. Mittal, and Michael J. Witbrock. 2000. Headline Generation Based on Statistical

More information

11期(copy)

11期(copy) 中 国 农 学 通 报 2014,30(11):29-33 Chinese Agricultural Science Bulletin 海 洋 渔 业 上 市 企 业 内 在 价 值 评 估 探 讨 基 于 DDM 和 市 盈 率 模 型 王 颖, 周 露 ( 上 海 海 洋 大 学 经 济 管 理 学 院, 上 海 201306) 摘 要 : 近 期 国 务 院 发 布 关 于 促 进 海 洋 渔

More information

Dependency Grammar) 特征结构理论 (Feature Structure Theory), 选取汉语动补结构的十五种语义关系类型 ( 吕叔湘,1980) 进行了形式化的描述和语义分析, 与传统依存语法的方法进行对比, 得到了比较好的结果 2 汉语动补结构语义研究简介 2.1 语言学

Dependency Grammar) 特征结构理论 (Feature Structure Theory), 选取汉语动补结构的十五种语义关系类型 ( 吕叔湘,1980) 进行了形式化的描述和语义分析, 与传统依存语法的方法进行对比, 得到了比较好的结果 2 汉语动补结构语义研究简介 2.1 语言学 基于扩展依存语法模型的汉语动补结构语义标注研究 * 陈波 12, 吕晨 2, 姬东鸿 2 (1. 湖北文理学院文学院, 湖北襄阳 441053;2. 武汉大学计算机学院, 湖北武汉 430072) 摘要 : 汉语的动补结构中主 宾 动 补四个成分之间的语义关系错综复杂, 自然语言处理很难对动补结构的语义关系进行完整的形式化描述 本文提出了一个新颖的扩展依存语法模型, 运用特征结构的方法形式化地描述动补结构中的主

More information

2 形 式 方 法 刻 画 动 词 的 意 义 和 所 有 科 学 一 样, 作 者 认 为 人 们 理 解 语 言 是 有 一 些 不 需 要 解 释 的 语 义 初 始 点 的, 计 算 机 也 一 样 一 个 完 整 的 语 义 平 台 应 该 包 含 所 有 的 语 义 初 始 点 以 及

2 形 式 方 法 刻 画 动 词 的 意 义 和 所 有 科 学 一 样, 作 者 认 为 人 们 理 解 语 言 是 有 一 些 不 需 要 解 释 的 语 义 初 始 点 的, 计 算 机 也 一 样 一 个 完 整 的 语 义 平 台 应 该 包 含 所 有 的 语 义 初 始 点 以 及 从 事 件 语 义 学 角 度 分 析 动 词 的 形 式 化 方 法 张 文 彦 我 打 算 采 用 形 式 语 义 学 的 办 法 来 研 究 动 词, 而 动 词 语 义 结 构 又 和 事 件 语 义 学 的 研 究 密 切 相 关 所 以 这 次 报 告 我 们 主 要 来 看 一 下 事 件 语 义 学 的 内 容 以 及 相 关 学 者 们 对 事 件 语 义 学 中 的 一 些 理

More information

数理逻辑 I Mathematical Logic I

数理逻辑 I  Mathematical Logic I 前情提要 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理承自命题逻辑的元定理 : 演绎定理重言规则逆否命题反证法 前情提要 一阶逻辑公理系统的元定理一阶逻辑特色的元定理

More information

,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( ) (1

,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( ) (1 /,, ( ),, ; ; ;?,,,,,,,,, ( ) ( ), ; ; ;?,, :, ;, 147 23 2009 2,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( )

More information

! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $ %% " $ "--/

!  #   $ %   # #  $  #  #!  $ ! # # # #! &$! ( % !!! )$ %  (!!!! *$ ( %  (!!!! +$ %  #! $!, $ $ $ $ $ $ $, $ $ --. %/ % $ %%  $ --/ "##$ "% "##& " "##( )$ "##%! ) "##$ * "##( "##$ "##(!!!!!!!!! ! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $

More information

<4D6963726F736F667420576F7264202D2035B171AB73B6CBA8ECAB73A6D3A4A3B6CBA158B3AFA46CA9F9BB50B169A445C4D6AABAB750B94AB8D6B9EFA4F1ACE3A873>

<4D6963726F736F667420576F7264202D2035B171AB73B6CBA8ECAB73A6D3A4A3B6CBA158B3AFA46CA9F9BB50B169A445C4D6AABAB750B94AB8D6B9EFA4F1ACE3A873> 中 正 漢 學 研 究 2012 年 第 一 期 ( 總 第 十 九 期 ) 2012 年 6 月 頁 111~134 國 立 中 正 大 學 中 國 文 學 系 111 從 哀 傷 到 哀 而 不 傷 : 陳 子 昂 與 張 九 齡 的 感 遇 詩 對 比 研 究 * 丁 涵 摘 要 在 中 國 古 典 文 學 語 境 中, 一 個 主 題 的 奠 立 往 往 需 要 歷 時 彌 久, 而 這 本

More information

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table 38 2 2010 4 Journal of Fuzhou University Natural Science Vol 38 No 2 Apr 2010 1000-2243 2010 02-0213 - 06 MLP SVM 1 1 2 1 350108 2 350108 MIP SVM OA MLP - SVM TP391 72 A Research of dialectical classification

More information

山 东 大 学 博 士 学 位 论 文 晚 清 四 大 谴 责 小 说 词 汇 研 究 姓 名 : 张 威 申 请 学 位 级 别 : 博 士 专 业 : 汉 语 言 文 字 学 指 导 教 师 : 杨 端 志 20080415 山东大学博士学位论文

More information

全 国 英 语 考 级 参 考 材 料 全 国 英 语 考 级 参 考 材 料 一 考 试 目 的 () 粘 贴 考 场 相 关 标 识 ( 包 括 安 全 标 识 医 药 卫 生 箱 标 识 饮 水 标 识 考 生 座 位 号 等 ) (3) 黑 板 / 白 板 板 书 : 考 试 语 种 : 英

全 国 英 语 考 级 参 考 材 料 全 国 英 语 考 级 参 考 材 料 一 考 试 目 的 () 粘 贴 考 场 相 关 标 识 ( 包 括 安 全 标 识 医 药 卫 生 箱 标 识 饮 水 标 识 考 生 座 位 号 等 ) (3) 黑 板 / 白 板 板 书 : 考 试 语 种 : 英 目 录 (Table of Contents) 一 考 试 目 的 二 考 试 意 义 三 考 试 形 式 四 考 试 时 间 五 考 试 流 程 六 试 题 结 构 与 评 分 4 七 测 试 范 围 语 法 项 目 表 功 能 意 念 项 目 表 话 题 项 目 表 本 级 别 教 学 测 试 目 标 总 结 7 11 全 国 英 语 考 级 参 考 材 料 全 国 英 语 考 级 参 考 材

More information

2/80 2

2/80 2 2/80 2 3/80 3 DSP2400 is a high performance Digital Signal Processor (DSP) designed and developed by author s laboratory. It is designed for multimedia and wireless application. To develop application

More information

謝 辭 能 夠 完 成 這 本 論 文, 首 先 當 然 要 感 謝 的 是 我 的 指 導 教 授, 謝 林 德 老 師 這 段 時 間 老 師 不 厭 其 煩 的 幫 我 檢 視 論 文, 每 次 與 老 師 討 論 後 總 是 收 穫 很 多, 在 臺 灣 求 的 這 段 期 間 深 深 地

謝 辭 能 夠 完 成 這 本 論 文, 首 先 當 然 要 感 謝 的 是 我 的 指 導 教 授, 謝 林 德 老 師 這 段 時 間 老 師 不 厭 其 煩 的 幫 我 檢 視 論 文, 每 次 與 老 師 討 論 後 總 是 收 穫 很 多, 在 臺 灣 求 的 這 段 期 間 深 深 地 文 教 碩 博 士 位 程 碩 士 位 論 文 指 導 教 授 : 謝 林 德 博 士 Dr. Dennis Schilling 華 同 形 漢 字 詞 之 比 較 及 教 建 議 以 台 灣 八 千 詞 及 韓 漢 字 語 辭 典 分 析 為 例 Semantic and Pragmatic Features of Chinese and Korean Homographic Words with

More information

机器任务学习和协同

机器任务学习和协同 机 器 人 任 务 学 习 和 协 同 工 作 Guy Hoffman MIT Media Laboratory guy@media.mit.edu Andrea Lockerd MIT Media Laboratory alockred@media.mit.edu 概 要 2. 研 究 方 法 在 这 篇 论 文 中, 我 们 阐 述 了 我 们 对 人 造 机 器 人 协 同 性 学 习 以 及

More information

Microsoft Word - Final Exam Review Packet.docx

Microsoft Word - Final Exam Review Packet.docx Do you know these words?... 3.1 3.5 Can you do the following?... Ask for and say the date. Use the adverbial of time correctly. Use Use to ask a tag question. Form a yes/no question with the verb / not

More information

*王心齋說得好:「天理者,」

*王心齋說得好:「天理者,」 樂 是 樂 此 學 學 是 學 此 樂 - 梁 漱 溟 對 泰 州 學 派 的 現 代 繼 承 與 改 造 王 汝 華 摘 要 以 發 皇 新 孔 學 為 畢 生 志 業 的 民 初 大 儒 梁 漱 溟, 其 由 佛 歸 儒 的 主 要 思 想 進 路 即 是 泰 州 學 派 本 文 乃 扣 緊 梁 漱 溟 與 泰 州 學 派 的 關 係 而 發, 參 稽 梁 漱 溟 的 系 列 著 作 ; 檢 視

More information

北京大学

北京大学 北京大学 博士学位论文 面向中文信息处理的现代汉语短语结构规则研究 A Study of Constructing Rules of Phrases in Contemporary Chinese for Chinese Information Processing 姓 名 : 詹卫东 学 号 : 19620822 系 别 : 中国语言文学系 专 业 : 现代汉语 研究方向 : 计算语言学 导 师

More information

言语理解中的知觉表征与命题表征*

言语理解中的知觉表征与命题表征* * (,510631) 96 t 1 2 3 1 propositional symbol system [1] [2] [3-5] Barsalou perceptual symbol system [6-8] arbitrary linguistic-like analogue perceptual [7] 1 * 30270477 t-a-b-l-e [ 9, 10 ] [11] Barsalou

More information

1

1 Hong Kong Teachers Centre JournalVol. 8 Hong Kong Teachers Centre 2009! "#$%&'()*+=! A case study on students ability to express emotion in his Chinese composition Abstract This article is a longitudinal

More information

博士论文答辩报告.ppt

博士论文答辩报告.ppt 博士论文答辩报告 树到串统计翻译模型研究 答辩人 : 刘洋 指导教师 : 林守勋研究员 时间 :2007 年 6 月 16 日 提纲 引言 词语对齐的对数线性模型 树到串统计翻译模型 模型 1 模型 2 模型 3 实验 总结 MT Strategies (1954-2004) Knowledge Acquisition Strategy All manual Electronic dictionaries

More information

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w 2013 2 计算机工程与设计 Feb. 2013 34 2 COMPUTER ENGINEERING AND DESIGN Vol. 34 No. 2 夏 静, 柴玉梅, 昝红英 : ( 郑州大学信息工程学院, 河南郑州 450001) 词的兼类问题是汉语词性标注中的关键问题之一针对常用词的兼类识别进行研究, 综合考虑了影响兼类词识别 的不同特征, 分别使用条件随机场模型 最大熵模型和 k 最近邻等统计方法,

More information

Corpus Word Parser 183

Corpus Word Parser 183 95 182 2010 1946 5 15 1948 6 15 1949 3 15 8 1 2011 2012 11 8 2015 12 31 Corpus Word Parser 183 2017. 1 ROST Content Mining 2003 20 60 2003 184 2003 20 60 1999 2009 2003 Discourse Analysis 1952 Language

More information

優 秀 的 構 圖 設 計 可 以 引 起 眾 的 注 意, 書 籍 封 面 的 構 圖 影 響 消 費 者 的 購 買 意 願 海 報 設 計 的 構 圖 影 響 的 傳 達 效 益 照 片 的 構 圖 影 響 美 感 的 表 現 與 傳 遞 經 典 名 作 在 構 圖 上 皆 有 細 膩 的 安

優 秀 的 構 圖 設 計 可 以 引 起 眾 的 注 意, 書 籍 封 面 的 構 圖 影 響 消 費 者 的 購 買 意 願 海 報 設 計 的 構 圖 影 響 的 傳 達 效 益 照 片 的 構 圖 影 響 美 感 的 表 現 與 傳 遞 經 典 名 作 在 構 圖 上 皆 有 細 膩 的 安 攝 影 作 品 觀 看 順 序 的 變 因 探 討 An Analysis of Photography Viewing Paths 戴 孟 宗 Tai, Meng-Tsung Ph.D. 國 立 臺 灣 藝 術 學 圖 傳 播 藝 術 學 系 副 教 授 Department of Graphic Communication Arts. National Taiwan University of

More information

Technical Acoustics Vol.27, No.4 Aug., 2008,,, (, ) :,,,,,, : ; ; : TB535;U : A : (2008) Noise and vibr

Technical Acoustics Vol.27, No.4 Aug., 2008,,, (, ) :,,,,,, : ; ; : TB535;U : A : (2008) Noise and vibr 8 8 Technical Acoustics Vol., No. Aug., 8,,, (, 8) :,,,,,, : ; ; : TB;U.+ 9 : A : -(8)--- Noise and vibration tests for fuel cell vehicel and noise sources identification SHEN Xiu-min, ZUO Shu-guang, CAI

More information

2017 CCAFL Chinese in Context

2017 CCAFL Chinese in Context Student/Registration Number Centre Number 2017 PUBLIC EXAMINATION Chinese in Context Reading Time: 10 minutes Working Time: 2 hours and 30 minutes You have 10 minutes to read all the papers and to familiarise

More information

Microsoft Word - 建構企業訓練之課程發展模式.doc

Microsoft Word - 建構企業訓練之課程發展模式.doc 建 構 企 業 訓 練 之 課 程 發 展 模 式 張 瑞 村 朝 陽 科 技 大 學 師 資 培 育 中 心 副 教 授 摘 要 人 力 資 源 是 企 業 組 織 創 造 競 爭 優 勢 的 重 要 因 素, 企 業 組 織 基 於 本 身 的 經 營 策 略 與 發 展 需 要, 經 由 企 業 訓 練 培 育 所 需 的 人 力 資 源, 是 最 有 效 的 途 徑 企 業 訓 練 與 公

More information

穨e235.PDF

穨e235.PDF Chinese Journal of Science Education 2003,, 235-256 2003, 11(3), 235-256 1 2 1 2 90 12 26 91 6 3 92 4 11 () - () - (), 2000 = = = 48 = 2 24 48 2 = 24 2 48 24 48, 2001 236, 2002, 1995, 1995 1995 cooperative

More information

PowerPoint Presentation

PowerPoint Presentation 6/14 AI Marr ELIZA SHRDLU DENDRAL, MYIN, AM, Eurisko, yc Deep Blue, 2010 Alpha-o ASON AI AI 1 2 HAL 9000 2001 AI 3 AI AI AI AI AI spin-off AI 4 HMM (Hidden Markov Model) SVM 5 6 ... ASON (IBM) echnological

More information

Jul Journal of Chinese Women's Studies No. 4 Ser. No. 148 * CFPS 2010 C A Where does the Ti

Jul Journal of Chinese Women's Studies No. 4 Ser. No. 148 * CFPS 2010 C A Where does the Ti 2018 7 Jul. 2018 4 148 Journal of Chinese Women's Studies No. 4 Ser. No. 148 * 210023 CFPS 2010 C913. 68 A 1004-2563 2018 04-0019-14 Where does the Time Go Gender Differences in Time Use over the Life

More information

第五章 縮略詞語普及度調查及分析

第五章 縮略詞語普及度調查及分析 0. ( ) : 1. 1.1 (1996) 8000 (1998) 1 2 : : 07(11/11/98) : (5/17/95) ( ) ( ): (5.147) 07(11/11/98) (121) 1 14(09/11/98) (3/2/94) 16(10/30/96) (5/17/95) 03(07/03/97) (5.147) 14(06/12/98) (6/19/97) (08/14/94)

More information

人10 漢儒董仲舒的人性論試探.DOC

人10 漢儒董仲舒的人性論試探.DOC 330 330340 CHIA-NAN ANNUAL BULLETIN VOL. 30, PP. 330 340, 2004 331 (1) (2) (3) (4) (5) (6) (7) 1. (8) 332 2. (9) (15) 333 3. (10) 4. 334 (11) 335 (12) (13) 1. 336 2. (14) 3. 337 4. 5. 6. 338 1. 69 2. 321

More information

可 愛 的 動 物 小 五 雷 雅 理 第 一 次 小 六 甲 黃 駿 朗 今 年 暑 假 發 生 了 一 件 令 人 非 常 難 忘 的 事 情, 我 第 一 次 參 加 宿 營, 離 開 父 母, 自 己 照 顧 自 己, 出 發 前, 我 的 心 情 十 分 緊 張 當 到 達 目 的 地 後

可 愛 的 動 物 小 五 雷 雅 理 第 一 次 小 六 甲 黃 駿 朗 今 年 暑 假 發 生 了 一 件 令 人 非 常 難 忘 的 事 情, 我 第 一 次 參 加 宿 營, 離 開 父 母, 自 己 照 顧 自 己, 出 發 前, 我 的 心 情 十 分 緊 張 當 到 達 目 的 地 後 郭家朗 許鈞嵐 劉振迪 樊偉賢 林洛鋒 第 36 期 出版日期 28-3-2014 出版日期 28-3-2014 可 愛 的 動 物 小 五 雷 雅 理 第 一 次 小 六 甲 黃 駿 朗 今 年 暑 假 發 生 了 一 件 令 人 非 常 難 忘 的 事 情, 我 第 一 次 參 加 宿 營, 離 開 父 母, 自 己 照 顧 自 己, 出 發 前, 我 的 心 情 十 分 緊 張 當 到 達 目

More information

系統功能語言的理論及其在國小國語讀寫教學的應用

系統功能語言的理論及其在國小國語讀寫教學的應用 2013 年 南 臺 灣 教 育 學 術 研 討 會 系 統 功 能 語 言 的 理 論 及 其 在 國 國 語 讀 寫 教 學 的 應 用 - 以 三 年 級 為 例 研 究 者 : 台 南 市 太 康 國 吳 新 欽 台 南 市 太 康 國 陳 意 佳 台 南 市 太 康 國 林 佳 春 發 表 日 期 :102 年 7 月 19 日 1 系 統 功 能 語 言 的 理 論 及 其 在 國 國

More information

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC>

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC> 句子对齐算法介绍 Weigang I IRab, HIT 2002-11-6 对齐的算法的简单描述 给定双语语料, 在所有可能的对齐中找出概率最大的对齐如用公式表示, 就有 arg max P A / S, T α 其中 A 是对齐文本,S 和 T 分别是英语和汉语文本 一个对齐的例子 英语文本 Most of us, however, take life for granted. We know

More information

数学分析(I)短课程 [Part 2] 4mm 自然数、整数和有理数

数学分析(I)短课程 [Part 2]   4mm 自然数、整数和有理数 .. 数学分析 (I) 短课程 [Part 2] 自然数 整数和有理数 孙伟 华东师范大学数学系算子代数中心 Week 2 to 18. Fall 2014 孙伟 ( 数学系算子代数中心 ) 数学分析 (I) 短课程 Week 2 to 18. Fall 2014 1 / 78 3. 自然数理论初步 孙伟 ( 数学系算子代数中心 ) 数学分析 (I) 短课程 Week 2 to 18. Fall 2014

More information

Kernel-based Semantic Role Labeling 2008 12 TP391.2 681.324 2008 12 Domestic Classified Index: TP391.2 U.D.C.: 681.324 Dissertation for the Doctoral Degree in Engineering Kernel-based Semantic Role Labeling

More information

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5>

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5> 中文自然语言处理平台 FudanNLP: 从词法到句法, 再到语义 报告人 : 邱锡鹏 xpqiu@fudan.edu.cn http://jkx.fudan.edu.cn/~xpqiu/ 提纲 1 FudanNLP 系统介绍 2 算法原理 3 词法 句法 语义 FudanNLP 系统介绍 设计目标 为中文自然语言处理研发一个开源平台, 使用统一框架, 集成先进研究成果, 降低中文分析门槛, 促进中文自然语言处理的发展

More information

Microsoft PowerPoint - 10,.盹æ®−呥垉-åŁ¦çflŁç›‹æœ¬

Microsoft PowerPoint - 10,.盹æ®−呥垉-åŁ¦çflŁç›‹æœ¬ 考研英语二语法与长难句 王丽 学习目标 什么是强调句? 构建强调句的方法有哪些? 什么是倒装句? 倒装句的分类和使用规则有哪些? 什么是否定句? 包含否定词汇的句子如何理解? 1 强调句 定义 : 一种修辞手法, 突出句中的部分内容 三种构成手段 : 解密强调句 词汇手段 规则 1.1: 在谓语动词前使用助动词 do 表示强调 原形 :I appreciate your help. 强调 : 原形

More information

acl2017_linguistically-regularized-lstm-MinlieHuang

acl2017_linguistically-regularized-lstm-MinlieHuang ACL 2017 Linguistically Regularized LSTM for Sentiment Classification Qiao Qian, Minlie Huang, Jinhao Lei, Xiaoyan Zhu Dept. of Computer Science Tsinghua University 1 aihuang@tsinghua.edu.cn Outline Introduction

More information

第三章 语义解释

第三章 语义解释 谢炯坤 中国科学技术大学 多智能体系统实验室 语义解释 语义解释存在的问题 句法和语义的衔接 常见的语言现象 指代 论旨角色 (Thematic Role) 语义网络 (Semantic Network) 语义解释 语义解释存在的问题 句法和语义的衔接 常见的语言现象 指代 论旨角色 (Thematic Role) 语义网络 (Semantic Network) 句法和语义的衔接 上下文无关意义的表示称为逻辑形式

More information

課務組第三次行政會議資料:

課務組第三次行政會議資料: 1. Healthy Life Healthy y 2. Healthy Promotion Healthy y 92-2 1 92-2 2 92-2 3 92 2 115 1197 543 92-2 4 1. 2. 3. 4. 5. ( ) ( ) ( ) 6. ( ) 7. 8. 92-2 5 93 (. 2 2 Let's talk in Italian () ) (. 2 2 Let's talk

More information

Microsoft Word - 5-王慧兰.doc

Microsoft Word - 5-王慧兰.doc 北京大学学报 ( 自然科学版 ), 第 49 卷, 第 1 期, 2013 年 1 月 Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 49, No. 1 (Jan. 2013) 汉语句类依存树库的构建研究 王慧兰 解放军外国语学院二系, 洛阳 471003; E-mail: hlwang9@hotmail.com 摘要以机器翻译领域为应用目标,

More information

微博「吐槽」

微博「吐槽」 (1) 論 文 題 目 : 中 國 大 陸 網 路 吐 槽 研 究 (2) 姓 名 : 王 楠 (3) 就 讀 學 校 及 身 分 : 國 立 政 治 大 學 傳 播 學 院 博 士 班 二 年 級 (4) E-mail:101451505@nccu.edu.tw (5) 電 話 :0978-231081 (6) 通 訊 處 : 台 北 市 文 山 區 指 南 路 二 段 64 號 莊 敬 九 舍

More information

ru'he

ru'he 如何自动建构社会标签中的语义关系? 三人行语义沙龙, 上海,2017.8.19 董行 (Hang) ( 西交 ) 利物浦大学计算机系博士生 导师 : Wei Wang, Frans Coenen, Kaizhu Huang ( 之前是 Kevin Kung Fung Yuen) 鸣谢本报告中用到的各类网络与学术资源 1 从社交媒体数据中提取语义关系 语义网与社交网络数据,Social Semantic

More information

BIBLID 0254-4466(2000)18: pp. 231-260 18 89 12 ** 1992 1987 * ** 231 232 1991 1998 1958 1995 1998 1994 1989 233 1987 196 1989 82-83 234 1992 1994 1 2 1994 60 1 1. 2. 2 235 1989 37 3 4 1992 74 3 4 236 1-2

More information

标题

标题 第 19 卷 摇 第 4 期 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 模 式 识 别 与 人 工 智 能 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 Vol. 19 摇 No. 4 摇 006 年 8 月 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 PR & AI 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 Aug 摇 摇

More information

幼兒戲劇教學策略之個案研究

幼兒戲劇教學策略之個案研究 幼 兒 教 保 研 究 期 刊 2012 第 9 期 61 幼 兒 戲 劇 教 學 策 略 之 個 案 研 究 劉 倚 君 新 竹 市 高 峰 幼 兒 園 幼 教 教 師 劉 淑 英 國 立 新 竹 教 育 大 學 幼 兒 教 育 學 系 副 教 授 摘 要 本 研 究 旨 在 探 究 幼 兒 戲 劇 教 師 在 幼 稚 園 中 進 行 戲 劇 活 動 的 教 學 策 略, 以 質 性 研 究 方

More information

/2008 ± ± 148

/2008 ± ± 148 * / / + - + - 1992 58-59 1992 125 * 2009 7 147 24 2010 2 1952 1968 1980 1999 /2008 ± ± 148 Chomsky 1965 /1986 ± ± ± ± + + 1993 Wordnet 1999 2009 Pustejovesky 1995 3 3 3 9 3 3 2009 natural type water woman

More information

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是 还是 ) 动词 有

目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解 ( 根节点 ) 一般动词作谓语 动词 是 作谓语 ( 类似的 : 不是 就是 而是 全是 真是 还是 ) 动词 有 汉语依存句法树库构建标注规范 此规范还未正式发表 未经编者允许, 请不要转发或传播 参与编者 : 李正华郭丽娟龚晨张月 zhli13@suda.edu.cn 年 月 日版本自 年 月开始编制 苏州大学人类语言计算研究所 目 录 更新记录 规范中文字颜色使用的说明 前言 什么是依存句法树? 投影树 非投影树 文章 ( 篇章 ), 段落, 复句, 单句 标注的几个技巧 依存关系类型 总 依存关系类型 解

More information

投影片 1

投影片 1 () () I am delighted to hear that Methodist College is organising a Mentoring Programme to help the Form 4 to Form 6 students to have a more enriched experience in addition to their academic study. I

More information

论中日 囚徒困境 的存在及逃逸 马亚华 本文试图用博弈论方法分析中日关系发生困难的原因 并在此基础上提出一点解决问题的思路 目前中日关系已在重复博弈中陷入了 囚徒困境 状态 囚徒困境 不仅为第三方势力提供了渔利的空间 直接损害了两国战略利益 而且其 溢出效应 还损害了全体东亚人民的利益 只有透过中国和平发展的参照系考察中日关系的过去 现在和未来 才能把握当前中日关系困难的本质并找到解决问题的办法 当前中日两国的综合国力基本处于同一层次

More information

标注体系以及标注特点, 树库包含的标注信息决定 了树库已开发的以及潜在的应用领域 从句法标注层面来看, PennCTB 以乔姆斯基的 短语结构语法为理论基础, 标注了句子的层次关 系 短语的结构类型 功能类型以及词语的词类 [2] 采用的词类标注集共包含 33 种词类标记符, 将动 词 形容词作为一

标注体系以及标注特点, 树库包含的标注信息决定 了树库已开发的以及潜在的应用领域 从句法标注层面来看, PennCTB 以乔姆斯基的 短语结构语法为理论基础, 标注了句子的层次关 系 短语的结构类型 功能类型以及词语的词类 [2] 采用的词类标注集共包含 33 种词类标记符, 将动 词 形容词作为一 Acta Scientiarum Naturalium Universitatis Pekinensis 汉语句类依存树库的构建研究 王慧兰 解放军外国语学院二系, 洛阳 471003; E-mail: hlwang9@hotmail.com 摘要以机器翻译领域为应用目标, 以概念层次网络理论的语义网络和句类分析方法为理论基础, 探讨句类依存树库构建的理论和标注实践等问题, 详细描述了构建树库所需的概念类别标注集和句类关系标注集,

More information

中三級 英國語文科

中三級 英國語文科 中 三 級 英 國 語 文 科 (2014-2015) ( 一 ) 本 科 的 目 標 1. 學 生 能 有 足 夠 的 英 語 能 力 以 輔 助 他 們 繼 續 學 習 或 就 業 2. 學 生 能 了 解 及 有 足 夠 的 練 習 來 掌 握 各 級 應 有 的 語 言 水 準 3. 學 生 對 學 習 英 語 有 興 趣 及 動 力 4. 學 生 能 主 動 參 與 課 堂 內 外 的 英

More information

Microsoft Word - ccl2014jia0728pic.doc

Microsoft Word - ccl2014jia0728pic.doc 文章编号 :1003-0077(2011)00-0000-00 汉语语义选择限制知识自动获取研究 贾玉祥 1, 王浩石 1, 昝红英 1, 俞士汶 2, 王治敏 (1. 郑州大学信息工程学院, 河南省郑州市 450001; 2. 北京大学计算语言学教育部重点实验室, 北京市 100871; 3. 北京语言大学汉语学院, 北京市 100083) 摘要 : 语义选择限制刻画谓语对论元的语义选择倾向, 是一种重要的词汇语义知识,

More information

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W http://kns.cnki.net/kcms/detail/11.2442.n.20180822.1814.010.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2018.055 基于词模式嵌入的词语上下位关系分类 孙佳伟 李正华 陈文亮张民

More information

Microsoft Word - chnInfoPaper6

Microsoft Word - chnInfoPaper6 文 章 编 号 :3-77(2)-- 文 章 编 号 :92 基 于 中 文 拼 音 输 入 法 数 据 的 汉 语 方 言 词 汇 自 动 识 别 张 燕, 张 扬 2, 孙 茂 松 (. 清 华 大 学 计 算 机 系, 北 京 市 84;2. 搜 狗 科 技 公 司, 北 京 市 84) 摘 要 : 方 言 研 究 领 域 中 的 语 音 研 究 词 汇 研 究 及 语 法 研 究 是 方 言

More information

級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師

級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師 李 志 達 紀 念 學 校 15-16 年 度 二 年 級 家 會 級 任 介 紹 班 主 任 其 他 級 任 2A 羅 彩 岫 主 任 吳 毅 蕙 老 師 2B 徐 玲 老 師 陳 詠 詩 老 師 2C 梁 麗 興 老 師 尹 南 老 師 2D 曾 康 老 師 李 樂 雯 老 師 2E 黃 蕙 明 老 師 校 致 辭 讓 學 生 成 為 有 用 的 人 成 才 的 孩 子, 他 們 都 做 過 同

More information

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of 中 国 科 学 技 术 大 学 硕 士 学 位 论 文 新 媒 体 环 境 下 公 务 员 在 线 培 训 模 式 研 究 作 者 姓 名 : 学 科 专 业 : 导 师 姓 名 : 完 成 时 间 : 潘 琳 数 字 媒 体 周 荣 庭 教 授 二 一 二 年 五 月 University of Science and Technology of China A dissertation for

More information

pg19_BackCover

pg19_BackCover SUMMER WORKSHOPS 2014 : 關於我們 ABOUT US WRI E WRI ABOUT US 關於我們 ABOUT US 關於我們 In CRITICAL THINKING 3 16 YEARS 批 判 思 考 3 至 16 歲 CRITICAL THINKING Critical Thinking 3 16 years Promotes lateral thinking and

More information

基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 ) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干,

基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 ) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干, 基于形态分析的现代维吾尔语名词词干识别研究 艾孜尔古丽 1, 阿力木 木拉提 1, 玉素甫 艾白都拉 1 (1. 新疆师范大学计算机科学与技术学院, 新疆维吾尔自治区乌鲁木齐市 830054) 摘要 : 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究, 主要目的是从句子中提取名词 词干, 提高名词识别效率 首先陈述形态分析概念和通过这些形态特征可以准确地识别其词性的意义 其 次讨论维吾尔语的词类划分标准

More information