Microsoft Word doc

Similar documents
Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学

Microsoft PowerPoint - 诓敧-8.19

+$ 6" 空格前是动词 " 因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系

实验方法



第 期 王雪丽等 重建最佳关联的翻译

上帝之光和对死亡的崇尚

(deictic), ;, Comrie,, ; 1.2 英语和汉语完成体的可比性, +ed,,,, (1)Atseveno clockyesterday, Johnpromisedtogivemetenpounds. (2)Hereignedfortenyears. (3)Iwilh

Microsoft Word 聂雪梅.doc


第三讲非谓语动词之动词不定式 1. to arrive 解析 :to arrive 作 one 的定语 2. to love and to be loved 3. to be working 解析 :pretend to be doing sth. 假装正在做某事 4.to finish 解析 :i

Microsoft PowerPoint - 8.第喫竀主仔呥义咓诓敧仔呥


孙 蓝等 基于目标导向的研究生英语学习模式创新

社科网-论文在线

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending]


1 引 言 大 陆 与 台 湾 两 地 之 间 的 交 流 与 日 剧 增, 大 量 与 台 湾 有 关 的 信 息 进 入 了 大 陆 居 民 的 生 活 随 着 交 流 的 不 断 深 入, 我 们 发 现 台 湾 国 语 和 我 们 所 使 用 的 普 通 话 存 在 一 定 的 差 别 台


續論

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用


Microsoft Word doc


外国文学研究 年第 期 º


170 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2012 年 第 18 卷 第 4 期 周 末 九 鼎 沦, 必 以 亡. 者 为 神, 三 山 九 鼎 有 知 也? 或 时 吏 知 怨 家 之 谋, 窃 举 持 亡, 惧 怨 家 怨 己, 云 自 去 凡 人 能 亡., 足 能 步 行


《中文信息学报》投稿模版

Worksheet 2: The Complete Subject To identify complete subjects. To discover that a subject is the part of a sentence that tells whom or what the sent

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

92

5 551 [3-].. [5]. [6]. [7].. API API. 1 [8-9]. [1]. W = W 1) y). x [11-12] D 2 2πR = 2z E + 2R arcsin D δ R z E = πr 1 + πr ) 2 arcsin

猫腻的做法 无用的伎俩 中国异教徒尤其擅长 如下文将讨论到的 阿辛 西岩

Microsoft PowerPoint - 10,.盹æ®−呥垉-åŁ¦çflŁç›‹æœ¬

Microsoft Word - A _ doc

课题调查对象:

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

TMC TMC 159


Dependency Grammar) 特征结构理论 (Feature Structure Theory), 选取汉语动补结构的十五种语义关系类型 ( 吕叔湘,1980) 进行了形式化的描述和语义分析, 与传统依存语法的方法进行对比, 得到了比较好的结果 2 汉语动补结构语义研究简介 2.1 语言学

; 4,, 1, :,,? (3) : ( ) ; (4) GBK 18000,, ( ) : (2) 2 ; 1 (1) (1987:p ) 2 (1944:p119)

Microsoft Word 任 辉_new_.doc


业 务 与 运 营 社 交 网 络 行 为 将 对 网 络 流 量 造 成 较 大 影 响 3) 即 时 通 信 类 业 务 包 括 微 信 QQ 等, 该 类 业 务 属 于 典 型 的 小 数 据 包 业 务, 有 可 能 带 来 较 大 的 信 令 开 呼 叫 建 立 的 时 延 销 即 时

N A J A



Shanghai International Studies University THE STUDY AND PRACTICE OF SITUATIONAL LANGUAGE TEACHING OF ADVERB AT BEGINNING AND INTERMEDIATE LEVEL A Thes

~ ~ ~ ~

: 1, ( high2accessibil2 ity),,,,,, : (3),,,,!,,? :,!?? ( ) ( ),, :?? ( ),,,,, (3),,,,,,,, : (4) a., :,, b.,,:,,, (4aΠb),,,,,,, N + V + + N + V,

Microsoft Word doc

叶 洪 生 : 论 还 珠 楼 主 李 寿 民 的 是 非 功 过 2012 年 第 4 期 剑 仙 神 话 志 怪 冒 险 传 奇 种 种 题 材 内 容 的 超 长 篇 武 侠 巨 构 并 未 全 部 完 成 当 故 事 进 行 到 蜀 山 剑 侠 后 传 ( 以 下 简 称 后 传 ) 第 五

,,,, ( ) (. ) : (, ), : ( ),,,?,??,,,????,,????,,,,,,,,,, (, ), ( ) (, ),,,,,, : ( ),

1933~ ~ ~ ~ ~ ~ khams khams

引言

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

旅游科学

桂医大研〔2015〕10号

, CAS-IA

<4D F736F F D2033BAABCAC0D3A8A3ACB9F9CAE7B7D2>


中国人民大学公共管理大专业考研必读信息(公共管理学院部分)

三、育明考博总结中共中央党校考博复习策略(育明教育考博课程中心)

.,,,, ( ),,,,?,,,,,,,,,,,,,,,,,,,,,,, (, ) (, ), (.. ) (, ),,.,,,,,,,,,, (, ),,,,,,,,,, (, ),,,, ( ', )(, ) ( -

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

Microsoft Word doc

经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 国际贸易学 非在职 经济管理学院 国

词 1 多冠词 I caught a sigh of my English in the crowd sight 是不可数名词, 且 cath sight of 是固定搭配, 意为 看见 故应去掉 a 2 多介词 We practice for three times every week 此例中是

在 培 养 职 前 卓 越 化 学 教 师 的 院 校, 会 编 一 本 过 去 称 作 化 学 教 学 论 实 验, 现 在 拟 为 卓 越 化 学 教 师 教 育 实 验 教 学 研 究 的 教 材 各 院 校 对 这 门 课 程 所 给 的 学 时 不 太 一 样, 但 都 是 围 绕 实 验

标题


(Microsoft Word \256\325\260\310\267|\304\263\260O\277\375_\252k\250\356_.doc)

Microsoft Word - 桂电教[2008]8号.doc

教育心理学教学案例分析

nb.PDF



Microsoft Word - 18-p0402-c3.doc

,, (, ),,,, (, ),,, :, :,, :,, ( ),,, ( ) ( &, ), :(),, ( ),, (, ;., ), ()( ),,, ( ) ( ) ()(, ),,,,, ;,, ;, ( ),,,,,,, ( -, ), ( &, ),, ( ),,,


考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 )

Microsoft Word - chnInfoPaper6

ISBN: 书名 : 作者 : 杨进军 著 出版社 : 立信会计出版社 中图法分类号 :F.1290 出版日期 :

( ),,,,,,,, ` ', :,,,,??? :,, ( : ~, ) : ( ) :,, ( ),,,,, ~ :, :,,,,, ( ),,,,,,, :, :, ( )? :, ( ) :, :



Girton Roper (1977),,,,,, ( ),,,,,,, ( Exchange Market Pressure) 30 EMP, EMP EMP,Girton Roper (1977), ,,, Kim(1985) ,,, T

北京大学

33-57

Microsoft Word doc

由社會發展趨勢探討國人睡眠品質

北京菲德美商业连锁有限公司预计前期将在北京开始 2-3 家旗舰店 随即在山东济南等地纷 纷开设分店 逐步发展辐射至全国等地 北京中高投资有限公司总经办 王明 中高亚顿幼儿教育前期筹备顺利进行 近日 中高 亚顿国际幼儿教育项目总负责人王枭雅带领营销总监 市场总监等人赶赴山东省 济南市对正在施工的中高亚

第16卷 第2期 邯郸学院学报 年6月


/2008 ± ± 148

1 63 Дальнейшие Задачи

國立臺灣藝術大學

新英语语法教程 Tim said that he would come. 1.2 词的种类 词可以根据它们的词汇意义 语法功能和形式特征分为下列十类 : 1. 名词 (noun), 即表示人和事物等的名称或指称行为 状态 品质等抽象概念的词 例如 : John, teacher, class, ki

Transcription:

2005 年第 1 期 俄语语言文学研究 2005, 1 总第 7 期 Russian Language and Literature Studies Serial 7 俄语基本名词性构句块模式研究 叶其松 ( 黑龙江大学, 黑龙江哈尔滨 150080) 摘要 : 构句块的自动化分析起着承接俄语自动形态分析和句法 - 语义分析的作用, 是俄语自然语言处理的重要模块 本文从基本名词性构句块的内部结构和功能属性入手, 结合俄语作为屈折语的特点, 探索短语一级语言单位模式化及模式多层级 形式化描写的途径, 旨在为最终实现名词性构句块的自动化分析和识别奠定基础, 并为俄语自动句法 - 语义分析提供语言学保障 关键词 : 自然语言处理 ; 基本名词性构句块 ; 模式化中图分类号 :H085 文献标识码 :A 1 引言 众所周知, 语句是最小的交际单位, 对其结构的理解, 语言学家的观点大相径庭 汉语语法从句子成分出发, 区分出主语 谓语 宾语 状语等成分 其中, 主语 谓语和宾语是主要的句子成分, 一个句子的结构可以用主语 + 谓语 + 宾语表示 乔姆斯基的转换生成语法认为, 名词短语 (noun phrase,np) 和动词短语 (verb phrase,vp) 是构成句子的两大基本部件, 任何一个句子 (sentence,s) 都可以表示为 S NP+VP 格语法的创立者 美国语言学家 Fillmore 把句子分成情态 (modality) 和命题 (proposition) 两部分, 可以用公式 S M+P 表示 ( 杨成凯 1986:37) Г. А. Золотова 则认为句法素 (синтаксема) 是句子的直接构筑单位 她将 句法素 视为俄语中 最小的 不可分割的语义 - 句法单位 范畴语义特征 形态特征和句法功能被认为是区分句法素的重要特征 在俄语句子中, 句法素体现以下 3 种基本句法功能 :1) 作为独立的单位使用 ;2) 作为句子的组成部分使用 ;3) 作为词组 ( 或词的组合 ) 的组成部分使用 根据句法素在句子中所起的句法功能数量的多寡将其分为自由型句法素 (свободная синтаксема) 限制型句法素(обусловленная синтаксема) 和连接型句法素 (связанная синтаксема) 在限制型句法素和连接型句法素中又可以区分出各种具体的 位 (позиция) 不仅是句子, 像超句子统一体, 乃至语篇等更大的语言单位都由句法素组合而成 (Г. А. Золотова 1988:4 5) 俄语事格语法是从自然语言处理角度提出的可操作性强 高度形式化的俄语定性化描写体系 事格语法认为, 客观世界由事件组成, 事件映射到语言中, 体现为一个个句子, 句子的抽象模式可以表示为 V(x,y,z) <a>, 动词 V 是事件中的 代表, x,y,z 和 a 则是事件的参与者 在交际过程中, 根据各项参数取值的不同, 可以生成变化无穷的句子 ( 傅兴尚 1999:45) 我们认为, 句子是由有限的构句块 (синтаксический блок) 组成的 构句块是指句子中某一片段 (отрезок), 常以该段的第一个词和最后一个词为分割边界 每个构句块都包含主导词, 由主导词继承整个构句块的语法属性 句子中的基本构句块包括动词性构句块 名词性构句块 副动词构句块和形动词构句块 ( 傅兴尚 2004:41) 本文拟研究俄语名词性构 67

句块 ( 以下简称 NP 构句块 ) 先看下例 :В последние 50 лет в лингвистике возрос интерес к содержательной стороне языка 该句包含 3 个独立的 NP 构句块 :последние 50 лет, лингвистике,интерес к содержательной стороне языка, 主导词分别是 лет,лингвистике, интерес 但是 3 个构句块内部结构是不相同的 : 在构句块 последние 50 лет 中,последние 和 50 是 лет 的修饰语 ;лингвистике 中主导词本身就构成一个构句块,интерес к содержательной стороне языка 的结构比较复杂 :интерес 是整个构句块的主导词, 其中 嵌套 另外一个 NP 构句块 содержательная сторона языка 用树形图表示构句块 интерес к содержательной стороне языка 的结构如下 : 2 基本 NP 构句块的模式化及其次范畴化 上图表明,NP 构句块具有层级性 句子中最 底层 的 合乎句法规则的 以名词为主导词的构句单位称之为基本 NP 构句块 虽然句子中的 NP 构句块千变万化, 但是基本 NP 构句块的模式是有限的 借助相应的规则对基本 NP 构句块加以组配, 可以生成各种类型的 NP 构句块 根据俄语名词的组配性能, 可区别以下 8 类基本 NP 构句块模式 :1)Adj N 1 形容词 + 名词一格 ( 如 утренний час,стальная воля,отличный студент);2)adv N 1 副词 + 名词一格 ( 如 прогулка ночью,поворот налево,совсем дурак);3)pron N 1 代词 + 名词一格 ( 如 весь народ,мой словарь);4)num N f 数词 + 名词 ( 如 два стола);5)n 1 V 名词一格 + 动词不定式 ( 如 возможность учиться,приказ наступать,мастер плавать);6)n 1 P N f 名词一格 + 前置词 + 名词 (лобовь к народу,робость перед народами,наблюдение за морем);7)n 1 N f 名词一格 + 名词 ( 如 ожидание автобуса,владение языком);8)однор СУЩ 同质名词短语 ( 如 кофе или чай,сын и дочь) 我们知道, 计算机通常按照条件执行相关指令, 算法设计要求对语言单位进行定性化描写 上述 8 类基本 NP 构句块模式是高度抽象化的 概括性很强的构句单位 为了便于操作, 必须实现模式的次范畴化 次范畴化指的是根据某些鉴别特征 ( 形态特征 语法意义等 ) 将语言单位细化 ( 实现语法或语义层面具体化 ) 的过程 在基于规则的自然语言处理系统中, 把握次范畴化的适宜度至关重要 标准过于宽泛, 容易导致语言单位承载的各项信息不足, 给设计算法带来困难或引起歧义 ; 划分过细便于对语言规则的操作, 但这会占用很大的内存, 影响运算速度 因此, 次范畴化应该以面向操作任务为原则, 以实现语言单位的可计算性为目标 具体涉及到 NP 构句块模式的次范畴化, 可选取以下鉴别特征 :1)N f 或 P 的形态特 68

征 ;2) 修饰语的词汇 - 语法类别 ;3) 修饰语与主导词间的语义关系 ;4) 联系用语的不同 基本 NP 构句块模式的次范畴化, 需要强调以下两点 :1) 某一类基本 NP 构句块模式的次范畴化, 往往只选取部分鉴别特征 构句块模式 Adj N 1 的次范畴化, 我们选取的鉴别特征包括修饰语的词汇 - 语法类别和修饰语与主导词间的语义关系两项, 最终区分出 Adj N 1 ( 属性,красный стол) Adj N 1 ( 材料,каменный домик) Adj N 1 ( 事物所有者,отцовская шляпа) 等 17 类带有语义标注的 NP 构句块模式 其中, 表示数量意义的构句块模式中的修饰语一般为 сотый,тысячный,некоторый( 如 сотные строители) 等具有数量意义的形容词 联系用语的不同只用于模式 ОДНОР СУЩ 的次范畴化 2) 次范畴化具有层级性 各层级次范畴化所选取的鉴别特征也不尽相同 如模式 N 1 P N f 的次范畴化由 3 个层级组成 : 第一层级的次范畴化围绕 N f 的形态特征展开, 可以得到 N 1 P N 2,N 1 P N 3 等模式 选取 P 的形态特征进行第二层级的次范畴化后, 可以得到 N 1 от N 2, N 1 к N 3, N 1 перед N 5 等比较具体的模式 第三层级次范畴化选取的鉴别特征是构句块内部的语义关系, 最终我们得到诸如 N 1 от N 2 ( 客体,освобождение от пустяков),n 1 от N 2 ( 空间,тропика от леса),n 1 от N 2 ( 时间,письмо от двацатого мая) 等带有语义标注及相关语言信息的基本 NP 构句块模式 次范畴化后基本 NP 构句块模式表现为一个层级系统 位于顶部的是诸如 Adj N 1 等基本构句块模式, 数量少, 概括性强 ; 基本模式下面是第一级次范畴化后形成的模式, 随后是第二级次范畴后形成的模式, 越底层的模式数量越多, 越具体 3 基本 NP 构句块模式的信息标注 信息标注重在为次范畴化后的基本 NP 构句块模式提供必要信息 在基于规则的处理系统中, 信息标注具有重要意义 基本 NP 构句块模式的信息标注, 在理论上为 NP 的研究提供了新的内容, 拓宽了研究者的视野 ; 在操作中可为建造语言知识库和实现 NP 构句块的自动处理提供信息源 确定一个合理 统一 开放的信息标注集是实现信息标注的必要前提 从实现 NP 构句块自动处理的角度出发, 我们确定一个包括构句块的形式化表达 语义关系 主导词 例词 汉化语序等 5 项内容组成的信息标注集, 无法归入标注集, 但对于 NP 构句块的自动处理具有重要价值的信息, 可体现在备注中 构句块的形式化表达是用形式化语言表征基本 NP 构句块模式化的结果 在数学中, 用公式 a 2 +b 2 =c 2 表示直角三角形两个直角边与第三条边之间的长度关系 在自然语言处理中, 借用元语言表达手段表示语言单位的内部结构, 便于对其理解和计算 语义问题是目前机器翻译中的重点和难点 实现语言单位的 句法 - 语义一体化描写 是自然语言处理中不可避免的趋势, 句法分析侧重对语言单位结构的理解, 语义分析着重阐释语言单位的意义 在基本 NP 构句块模式化过程中, 本文力求明确模式内部的语义关系 构句块的语法属性集中体现在主导词上 Adj N 1,Adv N 1,Pron N 1 等模式中只有一个 N 1,N 1 即为构句块的主导词 N 1 P N f 和 N 1 N f 模式中的主导词一般为 N 1,ОДНОР СУЩ 模式中存在两个 ( 或两个以上 ) 的主导词 确定模式的主导词, 便于实现构句块的规约 ( 即 NP N) 并减少 NP 构句块中的 节 点 基于规则建模的主要依据是研究者的语言知识 基于规则建造的模式分析效率较高, 但是主观性较大, 往往需要经过真实文本的验证 本文为每个基本 NP 构句块模式配备相应例词, 供读者检验 汉化语序是模式相应的汉语对等翻译形式 本文根据不同上下文为 NP 构句块提供不同汉化语序的方案, 增强了译文的合理性和准确性 备注中的内容主要体现为 :1) 基本 NP 构句块模式对其组成要素的要求 构句块并不是主导词与修饰语的任意组合, 对各组成要素的形态特征 语义类别进行规定是 NP 构句块 69

自动处理的重要辅助模块 ;2)NP 构句块模式的变体形式 在自然语言处理中, 不同的变体形式往往包含在一个模式中, 一方面可以节省模式占用的内存空间, 另一方面有利于模式的查询, 提高运算速度 实现对 8 类基本 NP 构句块模式的次范畴化和信息标注后, 所有的模式按顺序排列 现在我们从中选出部分模式, 来展示 NP 构句块模式化的过程 N 1 P N f : 以 N f 的形态特征进行第一层级的次范畴化 N 1 P N 2 : 选取 P 的形态特征进行第二层级的次范畴化 N 1 от N 2 : 根据模式内部的语义关系可进行第三层级的次范畴化 至此, 模式的次范畴化已经完成, 可以对第三层级次范畴化后得到的基本 NP 构句块模式进行信息标注 模式表达式 : N 1 от N 2 ; 模式内部的语义关系 : 行为 - 客体意义 ; 模式主导词 :N 1 ; 例词 :отличие от нас 等 ; 模式汉化语序 : 对 N 2 的 N 1 / N 1 N 2 ; 备注 : 该模式中的 N 1 可以为 : 1)защита,охрана,освобождение,гарантия 等表示摆脱威胁 困境等意义的动名词 例如,защита от непогод,освобождение от пустяков 等 ;2)отказ,отличие,отречение, отвлечение,отнятие 等部分带有前缀 от- 的动名词, 如 отречение от трона,отказ от просьбы 等 模式表达式 :N 1 от N 2 ; 模式内部的语义关系 : 事物 - 空间意义 ; 模式主导词 :N 1 ; 例词 :тропинка от леса 等 ; 模式汉化语序 :N 2 旁的 N 1 模式表达式 :N 1 от N 2 ; 模式内部的语义关系 : 事物 - 时间意义 ; 模式主导词 :N 1 ; 例词 :телеграмма от пятницы,письмо от двацатого мая 等 ; 模式汉化语序 :N 2 的 N 1 N 1 против N 2 N 1 P N 3 4 基本 NP 构句块模式的操作原理 自然语言处理是一个包含词法分析 句法分析 语义分析等若干处理模块的复杂过程 各处理模块是相对独立的, 即完成相应的操作任务, 又紧密相连, 集中体现为前一个处理模块的结果对后一个模块的分析产生直接影响 构句块的分析作为句法分析 ( 或句法 - 语义分析 ) 的预处理模块, 该处理模块应建立在成熟的词法分析技术基础上, 词法分析的出口即为构句块分析的入口 以 Я читаю книгу 为例, 经过词法分析, 对句中的词形进行形态还原并赋予相应的词法信息, 结果如下 : я( 代词, 单数, 第一格,я) читаю( 动词, 单数, 第一人称, 主动态, 未完成体, 行为,читать) книгу( 名词, 单数, 第四格, 语言作品,книга) 进入构句块分析阶段, 首先考虑各种类别基本 NP 构句块的组配顺序, 同时完成对构句块的规约 (NP N), 直至实现整个 NP 构句块的分析 这里列举几条组配规则, 以展示其分析步骤 规则 1:8 类基本 NP 构句块模式的组配顺序为 :A(Adv N 1,Adj N 1,Pron N 1,Num N f ) B(N 1 P N f,n 1 N f,n 1 V) C(ОДНОР СУЩ) 用此规则分析 красная шапка сестры и джинсы братаnp 构句块, 规约结果可表示为 { (красная шапка) сестры и (джинсы 70

брата)} 规则 2: 当修饰语本身带有接格关系时, 优先进行规约 对于 NP 构句块 знакомый мне человек 的规约顺序为 (знакомый мне) человек 规则 3: 对于上面 A 组内的模式, 经常出现一个主导词前存在多个修饰语的情况, 这时优先规约距离主导词近的修饰语 例如 NP 构句块 пять красных шапок 的组配顺序为 пять (красных шапок) 当修饰语前出现若干同质修饰语时, 优先规约同质修饰语 对 красивая францзуская машинаnp 构句块进行规约, 结果如下 : (красивая францзуская)машина 规则 4: 当一个构句块中 嵌套 另一个构句块时, 优先规约被嵌套的结构 构句块 интерес к содержательной стороне языка 的规约顺序如下 :{интерес к (содержательной стороне)языка } 对俄语句子中的 NP 构句块进行自动化处理时, 除引入组配规则外, 还需解决 NP 构句块边界测定 后置定语的分析和识别 歧义消除等一系列技术问题, 限于篇幅, 不再赘述 5 结束语 句法 - 语义分析的一个热点是注重句子的局部分析, 内容涉及基本名词短语 (Base NP) 的确定 短语边界的划定 语块 ( 或组块 ) 分析等 ( 赵铁军等 2000:157-175) 虽然上述研究的出发点和方法各不相同, 但宗旨大体一致, 即为后来的句法 - 语义分析作准备, 提高句法分析的质量 就某种意义而言, 构句块分析也属于一种局部分析的方法 由此可见, 构句块分析具有广阔的研究价值和应用前景 本文以 NP 构句块的内部结构为基础, 以构句块的模式化和形式化为表达手段, 力求对俄语基本 NP 构句块进行定性化描写, 为实现 NP 构句块的自动分析和识别提供信息源, 为短语分析以及其他构句块的分析积累经验 参考文献 [1]Золотова Г. А. 1988 Синтаксический словарь[z],м. [2] 傅兴尚 1999 现代俄语事格语法 [M], 北京 : 军事谊文出版社 [3] 傅兴尚 2001 基于事格文法的俄语词汇知识库 [M], 哈尔滨 : 黑龙江人民出版社 [4] 傅兴尚 2004 俄语句法结构的模式化描述及操作原理 [A]// 语言计算与基于内容的文本处理 (2004 年第七届计算语言学联合学术会议 )[C], 北京 : 清华大学出版社 [5] 傅兴尚 2004 俄语句法信息的自动化处理 ( 基本构句块及其识别算法 )[J], 解放军外国语学院学报, 第 1 期 [6] 杨成凯 1986 Fillmore 的格语法理论 ( 上 )[J], 国外语言学, 第 1 期 [7] 赵铁军等 2000 机器翻译原理 [M], 哈尔滨 : 哈尔滨工业大学出版社 Research on Modeling BaseNP of Russian YE Qi-song (Heilongjiang University, Harbin 150080, China) Abstract: Automated analysis of BaseNP is regarded as an important module, connecting the automated 71

morphological analysis with the syntax-semantic analysis of Russian. Based on structural and functional attributes of BaseNP, this paper investigates the modeling phrases in a sentence and their multi-stage formalized description of Russian as a typical inflectional language. We hope that this paper can ultimately lay a foundation for automated analysis and recognition of BaseNP as well as provide a linguistic model for the syntax-semantic analysis of Russian. Key words: NLP; BaseNP; Modeling 收稿日期 :2004-10-30 作者简介 : 叶其松 (1980-), 男, 安徽霍山人, 黑龙江大学俄语学院教师 主要研究方向 : 计算语言学 [ 责任编辑 : 孙淑芳 ] 72