《中文信息学报》投稿模版

Similar documents
(5) 少不了吃 [ 的 ]( 动 的 ) 第二, 语法结构上, 的 字结构由 (*NP+VP)+ 的 构成, 即由 主谓结构 + 的 构 [1] 成, 其中主谓结构可以是单个 ( 例 (1)), 也可以是多个 ( 例 (2)) 而其中的 NP 或 主语往往可以省略 ( 例 (3)) 第三, 语法功

1 63 Дальнейшие Задачи


实验方法

Microsoft Word 聂雪梅.doc

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

Пишем вам по поводу... We are writing to you rega 正式, 代表整个公司 Мы пишем в связи с... We are writing in connecti 正式, 代表整个公司 Ввиду... 正式, 以所联系的公司的某些事宜作为开头

Landscape Theory & Study 17

2

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

208 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2013 年 第 19 卷 第 6 期 节 目 录 上 卷 一 所 载 篇 名, 乃 总 目 录 中 篇 名 之 误, 正 文 卷 一 收 录 篇 名 为 月 支 使 者 玄 觉 杜 凝 妻 灌 国 婴 女 独 狐 及 吕 卿 均 五 篇

48 Computer Education 课 程 体 系 设 置 2.1 科 学 设 置 培 养 方 案 课 程 模 块, 确 定 培 养 方 向 首 先, 我 们 通 过 对 人 才 市 场 需 求 分 析, 确 定 了 专 业 培 养 目 标 然 后, 根 据 教 育 部 高 等

标题

2001 年 1 月 8 日 乌 克 兰 常 驻 联 合 国 代 表 团 临 时 代 办 给 秘 书 长 的 信 的 附 件 2000 年 12 月 15 日 乌 克 兰 总 统 列 奥 尼 德 库 奇 马 先 生 阁 下 在 关 闭 切 尔 诺 贝 利 核 电 厂 时 的 讲 话 我 要 就 一

Ctpu

170 中 南 大 学 学 报 ( 社 会 科 学 版 ) 2012 年 第 18 卷 第 4 期 周 末 九 鼎 沦, 必 以 亡. 者 为 神, 三 山 九 鼎 有 知 也? 或 时 吏 知 怨 家 之 谋, 窃 举 持 亡, 惧 怨 家 怨 己, 云 自 去 凡 人 能 亡., 足 能 步 行

10期( )


(deictic), ;, Comrie,, ; 1.2 英语和汉语完成体的可比性, +ed,,,, (1)Atseveno clockyesterday, Johnpromisedtogivemetenpounds. (2)Hereignedfortenyears. (3)Iwilh

2018  国际生数据

Corpus Word Parser 183

年 月

44 深 圳 信 息 职 业 技 术 学 院 学 报 第 10 卷 业 实 际 进 出 口 单 证 样 本 的 演 示 与 讲 解, 导 致 学 生 在 学 校 看 到 的 都 是 过 时 的 单 据 演 练 的 陈 旧 的 工 作 流 程, 走 上 工 作 岗 位 后, 一 旦 遇 到 实 际 问

国家重点实验室建设与运行管理办法

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

Microsoft Word - A doc

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学

新英语语法教程 Tim said that he would come. 1.2 词的种类 词可以根据它们的词汇意义 语法功能和形式特征分为下列十类 : 1. 名词 (noun), 即表示人和事物等的名称或指称行为 状态 品质等抽象概念的词 例如 : John, teacher, class, ki

AUCWA0501p00A.indd

《中文信息学报》投稿模版

2014 : 11 : ( 一 ) 再 和 又 词 汇 意 义 之 同 1. : (1)(a) (b) (2)(a), (b), (1) (2) ( ),, /, (1998),,,,,, [3] (1) (2), (a), (b), (a), (b), 2. : (3) (4), (5), (6)

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位


Microsoft Word - A _ doc

Иван IV Васильевич Иван IV Васильевич Грозный ( 1530 г г.) великий князь (с 1533

标题


Ctpu

Microsoft Word doc

孙 蓝等 基于目标导向的研究生英语学习模式创新

98

网络“超常”形式单位认知研究与规范

TERM 1 TERM 2 TERM 3 CA1 (10%) SA1 (20%) Prelim (70%) MCQ 20 10% MCQ 20 10% Language Use and (1) Grammar (2) Vocabulary (3) Vocabulary Cloze (8m) 28 (

中国的知识分子与民间(社会)



第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系

现代汉语语料库基本加工规格说明书

Ctpu

中 俄 人 文 交 流 专 项 奖 学 金 简 介 Краткое описание специальной китайско-российской стипендиальной программы в сфере культурного обмена 为 进 一 步 深 化 中 俄 战 略 协 作

S9 2 S S S S S S

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析

Microsoft Word c.doc

: : ( ) ( ) 1978 ( ) ( ) : ( 2008; 2009) ( 2009; 2009; 2010; 2009) ( ) ( 2005) ( ) (2003) ; (2001) CEPA (2005) : CEPA CEPA 50

C. 买一瓶橘子水 D. 晚上告诉你 6. A. 我姐姐的信 B. 有什么难的 C. 还没开始 D. 介绍历史的 Задания 7-12 Вы услышите шесть диалогов. Каждый диалог будет звучать дважды. После каждого ди

1 第一章词 短语 句子 语法 (grammar) 是语言的组织规律 学习语法主要是学习句子的结构, 学习如何组词造句 为了学习方便, 我们把英语的结构形式分为三种 : 句子 短语和词 句子由短语和词构成, 较大的句子可以包含较小的句子 ( 分句或从句 ), 较大的短语可以包含较小的短语甚至从句 1

Microsoft Word 定版

的有效的双语对齐样本 如果翻译单位选择过大, 跨越了小句的连接处, 那么比起小句内部, 数据样本既要有多倍的长度还要有多倍数量才能反映对译语言之间的词语联系 目前, 长句的翻译质量差就是这个问题的反映 王经益 2009 年从 新概念英语 中抽取了 40 句带有关系从句的句子, 调查了华建和 Goog

McGraw-Hill School Education Group Physics : Principles and Problems G S 24

Microsoft Word - chnInfoPaper6

7 a x b (y) 2007a 7 b x b x y x b 2006a a 8 a. b. x. y. xb 8 a b x a x b y b x b x xb y a b 9 y b b x 11 a. b. x. y. xb Chao

: 1868 [1](P. 174) ( ) : ( Революционер - человек обреченный) : : 3 ( 162 )??

1對外華語文詞彙教學的策略研究_第三次印).doc

,,,,,,,,,, ; (),,,,,,,, 1862,1864 8,,() () () () () () (), :,,,,,,,,,,,,,,,, 95 %,, 1.,,, 20 (1838 ) (1873 ), ( )

Microsoft Word - construct_smts.doc

+$ 6" 空格前是动词 " 因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此

35期

标题

1 引言


<4D F736F F D20B169B74FC5EF2020A8E2A9A4B0EABB79B1D0ACECAED1A56AA8E5B8D6BA71BFEFBFFDA4A7ACE3A8732E646F63>

Microsoft Word doc

Public Projects A Thesis Submitted to Department of Construction Engineering National Kaohsiung First University of Science and Technology In Partial

C doc

Microsoft Word 年第三期09

Microsoft Word - 2惠秀梅

; 4,, 1, :,,? (3) : ( ) ; (4) GBK 18000,, ( ) : (2) 2 ; 1 (1) (1987:p ) 2 (1944:p119)

Microsoft Word doc

,,,, (1983) (1984), (1) (6), : (1) a. ( ) b. ( ) (2) a. ( ) b. ( ) (3) a. ( ) b. ( ) (4) a. ( ) b. ( ) (5) a. ( ) b. ( ) (6) a. ( ) b. ( ) (1

填 表 说 明 1. 本 表 用 钢 笔 填 写, 也 可 直 接 打 印, 不 要 以 剪 贴 代 填 字 迹 要 求 清 楚 工 整 2. 本 表 所 填 内 容 必 须 真 实 可 靠, 如 发 现 虚 假 信 息, 将 取 消 所 在 学 院 参 评 资 格 3. 本 表 涉 及 的 项 目

博士论文答辩报告.ppt

382 作 为 高 校 选 拔 的 基 本 形 式 的 ЕГЭ 和 中 国 高 考, 为 国 家 提 供 了 大 量 的 优 秀 人 才, 促 进 了 国 家 综 合 实 力 的 提 高 ЕГЭ 和 中 国 高 考 的 作 用 是 极 其 重 要 的, 社 会 各 方 面 对 他 们 的 关 注 和

英语中的分割并不是随意地乱分乱隔, 一般遵循头轻尾重的原则 头轻尾重的原则, 是指为了使句子结构平衡, 以避免主语部分太长和谓语部分太短, 常常把长而复杂的成分放在句末 对于分割现象, 要予以充分重视, 从结构和语义两个方面结合来判断, 以避免误解 翻译时, 要将被分割部分整合在一起, 翻译成一个整

<4D F736F F D20B9DCC0EDD6C6B6C8BBE3B1E0B5DAB6FEB8E5>

Rawski Nolanand Ash Caiand Li 2002 Stiglitz , 2 [1]

北京大学学报 ( 自然科学版 ) 响力高的大规模语料库的缺乏 本文使用的语料库是自建的汉语语料库 Chinese Discourse Treebank, CNDB 篇章关系识别作为篇章结构分析的重要内容之一, 可以分为显式关系识别和隐式关系识别 显式关系识别是指在给定连接词 ( 如例 1, 下划线标

нация nation государство, state нация nation этнос, ethnic нация(государство) - ethnic nationality русская нация татарская нация русская этнона

言语理解中的知觉表征与命题表征*


32期


Microsoft Word doc

a a a 1. 4 Izumi et al Izumi & Bigelow b

Integration of English-Chinese Word Segmentation and Word Alignment

Theoretical Discussion / 理 论 研 讨 / 并 为 其 选 择 适 当 的 工 种 和 岗 位 省 自 治 区 直 辖 市 人 民 政 府 可 以 根 据 实 际 情 况 规 定 具 体 比 例 2008 年 4 月 24 日, 第 十 一 届 全 国 人 民 代 表 大

2013国际营销科学与信息技术大会(MSIT2013)

( 70 ) B,,,, B,,,, : (5) ( ),, A, : (6) ( ) (7), ( ) (8),, ( ) (9), ( ) (6), (7), (8), (9) B,,,, : (10),, ( ) (11)! ( ) 1. 2 A A,, : (12), ( )

第 期 王雪丽等 重建最佳关联的翻译


A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

Transcription:

汉语小句的俄语对应单位研究 杨毅 1, 冯文贺 (1. 乌拉尔联邦大学计算机词典编纂问题实验室, 俄罗斯叶卡捷琳堡 620000;2. 广东外语外贸大学语 2 言工程与计算实验室, 广东广州 510006) 摘要 : 标注汉俄平行文本中汉语小句的俄语对应单位, 并统计分析 首先, 根据汉语小句切分对齐切分俄 语, 得到俄语对应单位 其次, 对俄语对应单位进行语法标注 最后, 基于标注语料, 分析发现, 俄语对 应单位 :1) 句子组成部分多 (74.85%), 句子少 (25.15%);2) 单一述谓核心多 (69.04%), 无述谓核 心其次 (27.63%), 多述谓核心少 (3.33%);3) 单一述谓核心以简单谓语最多 (31.84%), 无述谓核心 以动词短语最多 (51.26%), 多述谓核心以主从复合句最多 (47.92%) 关键词 : 小句对齐 ; 篇章翻译 ; 汉语小句俄语对应单位 中图分类号 :TP391 文献标识码 :A Study on the Russian Syntactic Analogues of Chinese Clauses YANG Yi 1, FENG Wenhe 2 (1. Laboratory of Computer Lexicography, Ural Federal University, Ekaterinburg 620000, Russia; 2. Laboratory of Language engineering and computing, Guangdong University of Foreign Studies, Guangzhou, Guangdong 510006, China) Abstract: This paper is devoted to annotate and analyze the Russian syntactic analogues of Chinese clauses based on the Chinese-Russian parallel official documents. Firstly, segment the original text (Chinese) into clauses, and segment target text (Russian) into corresponding Russian syntactic analogues based on the segmentation of Chinese clauses. Then, we set the general principles and annotation system to annotate these Russian syntactic analogues. Finally, we examine the following results: 1) the components of sentences (74.85%) are more than the sentences (25.15%). 2) Single predicative center accounted for the largest proportion (69.04%), which are more than non-predicative center (27.63%) and multi-predicative center (3.33%). 3) The simple predicate accounted for the vast majority of the single predicative center (31.84%), the verb phrases accounted for the vast majority of the non-predicative center (51.26%), and the subordinate sentences accounted for the vast majority of the multi-predicative center (47.92%). Key words: clause alignment ; discourse translation; Russian syntactic analogue of Chinese clause 1 引言小句 (clause, клауза) 是篇章翻译的基本单位 研究表明, 在机器翻译系统中, 基于小 句的翻译比基于大句 (Sentence) 的翻译, 翻译结果的可接受率高出 45% [1] 由此, 基于小 句的翻译模型也成为篇章机器翻译研究的重要课题 [2] 统计翻译的根基在于有充分的双语对 齐样本和双语语法知识, 相应地, 基于小句的双语对齐语料库与语法标注库的研制与分析就 成为面向篇章机器翻译的基础性重要课题 汉俄翻译中, 汉语小句的俄语对应单位复杂多样, 选择何种对应单位是汉语小句俄译的 关键问题 如例 (1) 中, 汉语小句 C1-C5 的俄语对应单位分别为 R1-R5 其中 R1 为副动 词短语,R2 和 R4 是简单句组成部分 R3 是前置词短语,R5 是主从复合句 收稿日期 : 定稿日期 : 基金项目 : 中国国家留学基金 (201508090048);Программы повышения конкурентоспособности Уральского федерального университета(02.а03.21.0006); 教育部人文社科项目 (13YJC740022 15YJC740021 16YJC740053); 河南高校哲社基础研究重大项目 (2015-JCZD-022); 国家自然科学基金 (61273320); 中国博士后基金 (2013M540594); 广东外语外贸大学语言工程与计算机实验室拓标课题 (LEC2016ZBK T001) 作者简介 : 杨毅 (1989 ), 女, 博士在读, 理论语言学, 语料库语言学 ; 冯文贺 (1976 ), 通讯作者, 男, 博士, 主要研究理论语言学 计算语言学

(1) C1 保持经济中高速增长, C2 推动产业迈向中高端水平 C3 实现全面建成小康社会目标, C4 到 2020 年国内生产总值和城乡居民人均收入比 2010 年翻一番, C5 " 十三五 " 时期经济年均 增长保持在 6.5% 以上 R1 Поддерживая умеренно высокие темпы экономического роста, R2 стимулировать выход всех отраслей экономики на средний и высокий уровень развития. R3 Для достижения намеченных целей полного построения среднезажиточного общества R4 нужно удвоить к 2020 году ВВП и среднедушевые доходы городского и сельского населения по сравнению с 2010 годом. R5 Это значит, что среднегодовой прирост китайской экономики в период 13-й пятилетки должен быть не ниже 6,5%. 如例 (1) 所示, 如能提供汉俄小句对齐样本, 并进一步给出对应小句的语法知识, 将 为双语小句转换提供非常有效的知识指导, 也将为机器翻译等研究奠定基础 至今, 汉俄平 行语料库已有很多 [3-5], 但这些平行语料库一般基于操作性强的句子 ( 一般以句号等为标志 ) 甚至段落对齐, 而基于小句对齐的平行语料库仅开始初步实践 [6-7], 汉俄小句语法知识的标 注资源几乎没有 本文标注汉语小句与其俄语对应单位, 并进行统计分析 基本步骤如下 : 首先, 在汉俄 平行文本上, 以一定标准切分出汉语小句, 以汉语小句切分为依据, 对齐切分出俄语对应单 位, 形成汉俄小句对齐语料库 ( 第 2 部分 ); 其次, 制定俄语对应单位的语法分析原则及体 系, 实现汉俄小句语法标注语料库 ( 第 3 部分 ); 最后, 基于标注语料库分析俄语对应单位 的统计分布 ( 第 4 部分 ) 2 汉俄小句对齐切分 [8] 本文汉俄小句对齐切分主要采用冯文贺等在创建汉英小句对齐语料库中提出的方法 及原则, 即 : 首先, 依据一定标准切分汉语小句 ; 其次, 以汉语小句切分为依据, 按照语义 对应原则对齐切分俄语, 得到汉语小句的俄语对应单位 汉语研究对小句 (clause, клауза) 至今没有统一的定义与切分标准 本文采用李艳翠等 [9] 对汉语 子句 有如下定义 : 子句是篇章分析的基本单位, 含传统单句和复句中的分句 结构上, 子句至少包含一个谓语部分, 至少表达一个命题 ; 功能上, 子句对外不作为其他子 句结构的语法成分, 子句和子句间发生命题关系 ; 形式上, 子句间一定有标点分割, 通常是 逗号 分号和句号等 实际语料中, 一些与典型子句在结构 功能 形式上类似的传统所谓 [10] 短语在特定条件下也作为子句处理 该标准已被应用于建立汉语篇章结构语料库和汉英 [11] 篇章结构语料库及自动分析研究, 并取得较好效果 以汉语小句切分为依据, 在俄语翻译文本中得到语义上与汉语小句对应的俄语篇章单 位 例如在 (2) 中, 汉语切分为 C1-C5 共五个小句, 语义上对应的俄语对应单位切分为 R1-R5 在语法上,R1 R2 R3 R5 是典型小句,R4 则是句组 如按照俄语本身性质, R4 可以进一步分为两个小句 ( стремились к тому, чтобы 和 проводились ) 由此可见, 汉语小句的俄语对应单位切分并非是按照俄语小句标准切分而来, 而是以汉语小 句为标准的切分 (2) C1 我们实施积极的财政政策和稳健的货币政策,// C2 坚持正确处理保持经济平稳 较快发展 调整经济结构和管理通胀预期的关系,/ C3 更加注重把握好政策实施的重点 力度和节奏,// C4 努力做到调控审慎灵活 适时适度,/ C5 不断提高政策的针对性 灵活性和 前瞻性 R1 Мы проводили активную финансовую и уравновешенную монетарную политику, // R2 продолжали правильно разрешать отношения между поддержанием ровного и относительно быстрого развития экономики, урегулированием экономической структуры и управлением ожидаемой инфляцией. / R3 Придавали большее значение правильному

определению главных участков реализации политики, степени ее воздействия и ритмичности осуществления, // R4 стремились к тому, чтобы регулирование и контроль были взвешенными и гибкими, проводились в подходящий момент и в разумной мере. / R5 Непрерывно повышали целенаправленность политики, ее гибкость и опережаемость. 基于以上切分原则, 选取 2016 年中国政府工作报告的汉俄双语文本, 进行汉俄小句切 分 以下对俄语对应单位进行句法标注 3 俄语对应单位的语法分析根据一定分析原则和语法体系对俄语对应单位进行语法分析与标注, 形成俄语对应单位 的语法标注库 3.1 分析原则 实践表明, 按照汉语小句切分的俄语对应单位并不全都是典型句法单位, 对此, 俄语对 应单位语法单位性质的认定需要重新制定分析原则 第一, 认定对象主体以整体为主, 局部为辅, 整体优先局部为原则 与汉语小句对应的 俄语对应单位结构复杂, 包含多种句法结构 如例 (3) 中, 结构上,R1 是简单句,R2 是 副动词短语,R3 为主从复合句 ; 整体上,R1-R3 为并列复合句 该部分的判定以其所在整 体的句法性质而定 所以,R1 R2 和 R3 被认定为并列复合句组成部分 (3) C1 新修订的环境保护法必须严格执行,// C2 对超排偷排者必须严厉打击,/ C3 对姑 息纵容者必须严肃追究 R1 Необходимо строго соблюдать пересмотренный Закон об охране окружающей среды,// R2 сурово карая согласно закону за превышение нормативов предельно допустимых выбросов и нелегальные выбросы, / R3 а также строго спрашивая по закону с тех, кто попустительствует этим правонарушениям. 第二, 以汉语小句为依据切分的俄语对应单位中有时会出现省略现象而影响到该语法性 质的判断, 对其性质认定以将省略部分补充完整后的整体为对象分析 如例 (2) 中,R2 省 略了主语 (мы), 分析中应补出, 并认定 R2 为双部句 第三, 带有同等谓语的句子在俄语语法研究中一直存有争议, 其争议的焦点是这类句子 应当视为简单句还是复合句 [12] 同等谓语分为名词性合成谓语和动词性合成谓语 在标注 过程中, 我们把动词性合成谓语中的同等谓语部分标注为动词短语, 如例 (4) 中,R1 R2 R3 R4 为主从复合句组成部分,R1 为无人称句,R2 R3 为作为 R1 同等谓语的动词短语 (4) C1 必须毫不动摇坚持以经济建设为中心,/ C2 推动科学发展,/ C3 妥善应对挑战, // C4 使中国经济这艘巨轮破浪远航 R1 Нам необходимо без малейших колебаний отводить экономическому строительству центральное место, // R2 стимулировать научное развитие, // R3 должным образом реагировать на риски и вызовы с тем, / R4 чтобы обеспечивать китайской экономике, подобной гигантскому кораблю, дальнее плавание вперед навстречу волнам. 对名词性合成谓语的认定则将省略部分补充完整后分析, 这是由于名词性合成谓语虽无 时态的变化, 却有数和人称的变化, 见例 (5) (5) C1 取消和下放 311 项行政审批事项, C2 取消 123 项职业资格许可和认定事项, C3 彻底终结了非行政许可审批 R1 Были отменены либо делегированы вниз полномочия по 311 пунктам административного утверждения, сертификации профессиональных квалификаций, неадминистративное утверждение. 3.2 语法分析体系 R2 аннулированы 123 пункта лицензирования и R3 окончательно отменено

基于俄语传统句法理论对俄语对应单位进行分析, 结合语料分析实践, 形成俄语对应单 位的语法性质体系 首先, 根据句法完整性, 把俄语对应单位分为 : 句子 ( 简单句, 并列复合句, 主从复合 句, 无连接词句, 句组 ) 和句子组成部分 ( 简单句组成部分, 并列复合句组成部分, 主从复 合句组成部分, 无连接词句组成部分 ) 其次, 根据是否包含述谓核心, 把俄语对应单位分为 : 无述谓核心 单一述谓核心和多 述谓核心 无述谓核心包括名词短语, 动词短语, 前置词短语, 副词短语, 副动词短语和形 动词短语 ; 单一述谓核心包括单部句 ( 无人称句 不定式句 确定人称句 ) 和双部句 ( 简单 谓语 动词合成谓语 名词合成谓语 ) 传统俄语句法理论对句子类型的分析通常建立在述谓理论 (предикативность) 基础上 述谓核心 (предикативное ядро) 由主语和谓语构成, 也叫述谓结构 根据述谓核心的多少 区分简单句和复合句, 只有一个述谓核心的是简单句, 有两个或以上的述谓核心的是复合句 基于以上分析原则和分析体系, 对俄语对应单位进行语法标注, 形成俄语对应单位的语 法标注库, 目前包括 1292 个俄语对应单位的标注 4 俄语对应单位的语法分类与统计 4.1 句子和句子组成部分 汉语小句的俄语对应单位可能是句子, 也可能是句子的组成部分 句子具有独立的表述 功能, 以句号等句末点号为收尾标点, 又含独句 ( 例 (6)) 和句组 ( 例 (7)) 两类 句子 的组成部分不具独立表述功能, 需联合其他组成部分共同构成完整的句子, 以逗号等句间点 号为收尾标点, 又含并列复合句组成部分, 无连接词句组成部分和各种主句 从句等 (6) C1 人民群众关心的医疗 教育 养老 食品药品安全 收入分配 城市管理等方 面问题较多, C2 严重雾霾天气在一些地区时有发生 R1 Осталось немало беспокоящих народные массы проблем в области медобслуживания, образования, обеспечения достойной старости, безопасности пищевых продуктов и медикаментов, распределения доходов, городского управления и т.д. R2 По-прежнему острой остается ситуация с загрязнением окружающей среды, некоторые районы время от времени окутывал густой смог. (7) 促进大数据 云计算 物联网广泛应用 Последовательно продвигать вперед массовую предпринимательскую и инновационную деятельность. Стимулировать широкое распространение технологий больших данных, облачных вычислений и Интернета вещей. 图 1 为俄语对应单位的句子 / 句子组成部分统计分布, 分析可知 : 汉语小句的俄语对应 单位以句子组成部分多 (967,74.85%), 句子少 (325,25.15%), 前者约为后者的 3 倍 说明汉俄翻译中, 汉语小句多译为俄语句子组成部分 4.2 无述谓核心 无述谓核心的俄语对应单位主要存在于句子组成部分中, 包括名词短语 (8), 动词短 语 (9), 前置词短语 (10), 副词短语 (11), 副动词短语 (12) 和形动词短语 (13) (8) C1 积极的财政政策注重加力增效,/ C2 扩大结构性减税范围,// C3 实行普遍性降费, // C4 盘活财政存量资金 R1 Активная финансовая политика с акцентом на наращивании интенсивности и повышении эффективности / R2 позволила расширить сферы структурного сокращения налогообложения, // R3 перейти к тотальному снижению денежных сборов // R4 и оживить неиспользованные госбюджетные резервы. ( 名词短语 ) (9) C1 加快推进产业结构优化升级,/ C2 实施一批技术水平高 带动能力强的重大工程

R1 В связи с этим нужно ускорять оптимизацию и модернизацию структуры производств, / R2 реализовывать серию важных программ, имеющих высокий технический уровень и играющих мощную стимулирующую роль.( 动词短语 ) (10) C1 为应对持续加大的经济下行压力,/ C2 我们在区间调控基础上, 实施定向调控 和相机调控 R1 В противовес прессингу со стороны нисходящего тренда в экономике / R2 на основе определения разумных пределов нам удалось осуществить целенаправленное и своевременное регулирование.( 前置词短语 ) (11) C1 部分企业生产经营困难, C2 地区和行业走势分化, C3 财政收支矛盾突出, C4 金 融等领域存在风险隐患 R1 Часть предприятий сталкивалась с трудностями в своей производственной и хозяйственной деятельности, / R2 сильно расходились тренды развития разных регионов и отраслей, / R3 налицо острые противоречия между госбюджетными доходами и расходами, // R4 базовые институты рынка капитала далеки от совершенства, наблюдались потенциальные риски в финансовой и других сферах. ( 副词短语 ) (12) С1 保持经济中高速增长, С2 推动产业迈向中高端水平 R1 Поддерживая умеренно высокие темпы экономического роста, R2 стимулировать выход всех отраслей экономики на средний и высокий уровень развития. ( 副动词短语 ) (13) C1 今年要实现大病保险全覆盖,/ C2 政府加大投入,// C3 让更多大病患者减轻负 担 R1 В текущем году предстоит полностью охватить все сельское и неработающее городское население страхованием на случай серьезных заболеваний, / R2 соответственно увеличатся правительственные расходы, // R3 направленные на облегчение бремени еще большего числа пациентов с серьезными заболеваниями. ( 形动词短语 ) 图 2 为无述谓核心的俄语对应单位的统计分布, 无述谓核心的俄语对应单位共计 357 个, 占汉语小句俄语对应单位总数的 27.63% 分析可知 : 在无述谓核心的俄语对应单位中, 以动词 (183,51.26%) 居多, 副动词短语 (68,19.05%) 前置词短语 (62,17%) 和名 词短语 (36,10.08%) 居中, 形动词短语 (7,1.96%) 和副词短语 (1,0.28%) 较少 由 此可见, 俄语中动词 副动词和前置词短语通常能够表达汉语小句的意义, 翻译中应把握它 们之间的转化关系 4.3 单一述谓核心 单一述谓核心是指句中只包含一组主谓结构 单一述谓核心的俄语对应单位包括简单句 和各种句子的组成部分 根据主谓表达手段的不同, 单一述谓核心句法单位可以是单部句 : 无人称句 (14) 不定式句 (15) 确定人称句 (16), 也可以是双部句 : 简单谓语 (17) 动词合成谓语 (18) 名词合成谓语 (19) (14) C1 深化中外人文交流,/ C2 加强国际传播能力建设 R1 Наряду с углублением гуманитарных обменов Китая с другими странами / R2 нужно наращивать коммуникационные возможности в международных масштабах. ( 无人称句 ) (15) C1 促进两岸文教 科技等领域交流,/ C2 加强两岸基层和青年交流 R1 Активизировать межбереговые обмены в таких областях, как культура и образование, наука и техника и др. / R2 Расширять низовые и молодежные обмены между двумя берегами. ( 不定式句 ) (16) C1 让我们更加紧密地团结在以习近平同志为总书记的党中央周围,/ C2 凝心聚力, // C3 奋发进取,

R1 Давайте еще теснее сплотимся вокруг ЦК партии во главе с его генеральным секретарем товарищем Си Цзиньпином, / R2 сосредоточим все наши силы // R3 и со всей энергией устремимся вперед, ( 确定人称句 ) (17) 过去一年, 我国发展面临多重困难和严峻挑战 В прошлом году развитие Китая пережило немало трудностей и суровых вызовов. ( 简 单谓语 ) (18) 我们要持之以恒, 建设天蓝 地绿 水清的美丽中国 Мы должны прилагать неустанные усилия к построению прекрасного Китая под голубыми небесами, с зелеными лугами и лесами и чистыми водами.( 动词合成谓语 ) (19) C1 取消存款利率浮动上限,/ C2 推出存款保险制度,/ C3 建立人民币跨境支付系统 R1 Был снят верхний предел колебания процентных ставок по депозитам, / R2 введена система депозитного страхования, / R3 создана система трансграничных платежей в китайских юанях.( 名词合成谓语 ) 图 3 是汉语小句对应的俄语单一述谓核心单位类型统计分布, 单一述谓核心的俄语对应 单位共计 892 个, 占汉语小句俄语对应单位总数的 69.04% 分析可知 : 单一述谓核心的俄 语对应单位中, 以简单谓语 (284,31.84%) 最多, 无人称句 (185,20.74%) 名词合成 谓语 (214,23.99%) 和不定式句 (143,16.03%) 其次, 动词合成谓语 (63,7.06%) 和确 定人称句 (3,0.3%) 最少 这说明, 汉语小句翻译成俄语简单句或其他句子组成成分时, 除一般动词外, 多借助无人称系词, 名词合成谓语和不定式动词 4.4 多述谓核心 汉语小句对应的俄语句法单位可能含有多个述谓核心 : 并列复合句 (20) 主从复合句 (21) 无连接词复合句 (22) 和句组 (23) (20) C1 完成铁路投资 8000 亿元以上 公路投资 1.65 万亿元,/ C2 再开工 20 项重大水 利工程,// C3 建设水电核电 特高压输电 智能电网 油气管网 城市轨道交通等重大项目 R1 Капиталовложения в железные дороги превысят 800 млрд. юаней, а инвестиции в автодорожное строительство составят 1,65 трлн. Юаней. / R2 Начато строительство 20 новых крупных гидросооружений, // R3 будут реализованы крупные проекты в сфере гидроэнергетики и ядерной энергетики, электропередачи сверхвысокого напряжения, интеллектуальных электросетей, строительства сетей нефте- и газопроводов, городского рельсового транспорта и т. д. ( 并列复合句 ) (21) C1 把适合作为地方收入的税种下划给地方,/ C2 在税政管理权限方面给地方适当 放权 R1 Некоторые виды налогов, доходы по которым целесообразно должны были бы поступать в местные бюджеты, будут зачислены в категории местных налогов. / R2 Кроме того, нужно в разумной мере увеличивать полномочия местных правительств в области налогового администрирования. ( 主从复合句 ) (22) 合理确定增值税中央和地方分享比例 В частности, продвигать реформу по разграничению полномочий и расходных обязательств Центра и регионов, установить для них разумные пропорции распределения поступлений от НДС.( 无连接词复合句 ) (23) 对行政事业性收费 政府定价或指导价经营服务性收费 政府性基金 国家职业 资格, 实行目录清单管理 Предстоит установить перечень административных сборов, перечень платежей за эксплуатационные услуги, тарифы которых назначаются или предлагаются правительством,

перечень правительственных фондов, а также список национальных профессиональных квалификационных уровней. Ускоренно формировать единую, открытую, конкурентную и упорядоченную рыночную систему в интересах преодоления регионального протекционизма.( 句组 ) 此外, 研究发现在复合句中还存在一些嵌套现象, 如 (24) 中, 整体上,R1 与 R2 标 注为并列复合句组成部分 ; 述谓核心上,R1 为表目的的主从复合句 (24) С1 我们既要让人民的物质生活更殷实, С2 又要让人民的精神生活更丰富 R1 Словом, нужно сделать так, чтобы материальная жизнь народа стала более зажиточной, R2 а духовная более богатой и насыщенной. 图 4 为汉语小句对应的俄语多述谓核心类型的统计分布 由图可知 : 多述谓核心类型的 俄语对应单位既可存在于句子中, 也可存在于句子组成部分 其中, 主从复合句 (23,47.92%) 居多, 并列复合句 (8,16.67%) 其次, 句组 (6,12.5%) 和无连接词复合句 (6,12.5%) 为少 这说明, 当汉语小句需要译为多述谓核心结构的俄语对应单位时, 主要译为主从复合 句 图 1 句子 / 句子组成部分的统计分布 图 2 无述谓核心类型的统计分布 图 3 单一述谓核心单位类型统计分布图 4 多述谓核心类型的统计分布 4.5 俄语对应单位的综合统计俄语对应单位在语法类型上呈现为 9 大类, 在述谓核心上呈现为 10 大类, 其分布情况见表 1 分析可知:1) 汉语小句译为只包含有一个述谓核心的简单句或句子组成部分时, 多数译为双部句 (561,43.42%), 少数译为单部句 (331,25.62%); 其中, 只有在汉语

小句译为简单句组成部分时, 单部句 (114,8.82%) 多于双部句 (79,6.11%); 2) 汉语小句多译为单一述谓核心的俄语对应单位 (892,69.04%), 很大程度上多于无述谓核心 (357,27.63%) 和多述谓核心 (43,3.33%) 可以看出, 由汉语小句切分的俄语对应单位多呈现为单一述谓核心的简单句 这说明, 简单句是汉俄翻译的重点 3) 汉语小句译为简单句组成部分时, 多以无述谓中心的短语 (279,21.59%) 表示 其中, 动词短语最多 (144,11.15%), 副动词短语 (51,3.95%) 和前置词短语 (50,3.87%) 其次, 形动词短语最少 (5,0.39%) 可以看出, 除在句中作同等谓语的动词短语外, 通常是借助副动词 前置词 形动词等手段构成的单位 由此, 用副动词 前置词 形动词等来表达汉语谓语概念, 是汉俄政府文本翻译的特点 4) 汉语小句可译为包含多个述谓核心的俄语复合句 (37,2.86%) 或句组 (6,0.47%), 其中 : 主从复合句多 (12,0.93%), 并列复合句 (6,0.47%) 和无连接词复合句 (6,0.47%) 其次, 句组 (5,0.39%) 少 ; 这说明, 总体上汉语小句在译为俄语时, 通常会含有一个或多个述谓核心 表 1. 汉语小句对应俄语单位的述谓特征与句法类型分布表 句法类型 无述谓核心 (357,27.63%) 单一述谓核心多述谓核心 (892,69.04%) (43,3.33%) 总计 述谓核心 句 (325, 25.15 %) 并列复合句子主从复合句 名词短语 动词短语 前置词副词副动词形动词单部句 双部句复合句句组数量百分比 简单句 0 0 0 0 0 0 104 192 0 0 296 22.91% 无连接词复合句 并列复句子组合句组成部分成部分 (697, 主从复 74.85 合句组 %) 成部分 总计 0 0 0 0 0 0 0 0 6 0 6 0.46% 0 0 0 0 0 0 0 0 12 0 12 0.93% 0 0 0 0 0 0 0 0 6 0 6 0.46% 句组 0 0 0 0 0 0 0 0 0 5 5 0.39% 简单句组成部分 无连接词复合句组成部分 29 144 50 0 51 5 114 79 5 0 477 36.92% 3 7 5 0 8 1 21 81 5 0 131 10.14% 2 29 5 0 6 0 53 67 1 0 163 12.62% 2 3 2 1 3 1 39 142 2 1 196 15.17% 36 183 62 1 68 7 331 561 37 6 1292 2.78% 14.16% 4.80% 0.08% 5.26% 0.55% 25.62% 43.42% 2.86% 0.47% 100% 5 说明与总结 [8] (1) 汉俄小句对齐标注语料库是汉英小句对齐标注语料库研究的延伸与发展 一方 面, 随着汉俄机器翻译的发展, 目前在句子或段落层面对齐的平行语料库无法提供足够的对 齐信息, 所以需要基于汉俄平行语料进行进一步的对齐与分析 ; 另一方面, 未来在汉语小句

切分的基础上, 试图直接建立俄英对应句法单位的对齐 (2) 本文的分析体系仅适用于汉 - 俄单方向文本的研究, 即汉语为源语, 俄语为目的 语 这是由于 : 汉俄小句的结构与形态有重要差异, 汉译俄与俄译汉的小句转换并不相同, 因此, 有必要区分翻译方向, 建立俄 - 汉小句对齐语料库, 具体为 : 在俄汉平行语料上, 切 分出俄语小句, 以俄语小句为标准切分汉语对应单位, 形成俄汉小句对齐语料库, 从而构建 小句层面的双向对齐 小句 (клауза) 不是传统俄语句法研究单位, 为此, 需要提出具有操 作性的俄语小句定义 (3) 本文中对俄语对应单位的语法性质的标注限于结构层面的讨论, 主要是在传统俄 语句法分析框架内, 对句法单位的分析和讨论主要是基于结构和意义层面 下一步工作中, 需要对各个句法单位在篇章功能上进行分析 (4) 本文仅标注汉俄小句对齐语料库中俄语对应单位的语法性质, 这对于指导汉语小 句选择何种形式的俄语小句进行转换有一定的意义, 不过, 无法确定汉语小句在何种形式下 转换为何种俄语对应单位 为此, 在之后的工作中, 将对汉俄小句对齐语料中的汉语小句也 进行语法性质标注, 以建立句法标注的对应关系 此研究除了应用在以小句为翻译单位的研 究外, 还将指导在整句范围内构建翻译模型 [6-7] (5) 创建汉俄小句对齐标注语料库是创建汉俄篇章结构语料库的基础, 是篇章结构 视野下的篇章 - 句法联合标注 小句对齐与其语法标注与篇章结构对齐将共同服务于汉俄篇 章机器翻译 语言对比研究及第二语言教学 参考文献 [1] 王经益. 面向计算机的英语关系从句汉译研究 [D]. 北京 : 北京语言大学, 2009. [2] 宋柔, 葛诗利. 面向篇章机器翻译的英汉翻译单位和翻译模型研究 [J]. 中文信息学报,2013,29(5):125-135 [3] 陶源. 人文社科学术文本俄汉平行语料库的创建与研究 [J]. 语料库语言学.2014(01):78-93 [4] 崔卫, 张岚. 俄汉翻译平行语料库及其应用研究 [J]. 解放军外国语学院学报,2014,(01):81-87 [5] 朴哲浩, 林立娟, 严文颖. 基于双语新闻平行语料库的汉语新词语俄译规律研究 [J]. 燕山大学学报 ( 哲学社会科学版 ),2016,(01):138-144 [6] YANG Y. Theoretical aspects of building a Chinese-Russian Parallel Corpus with discourse-structure annotation[a].new Russia: Traditions and Innovations language an science of language[c]. Ekaterinburg; Moscow: The Cabinet Scientist, 2016:651-660 [7] MUKHIN M.Yu., YANG Y. Building a Chinese-Russian Parallel Discourse Structure Corpus of Official Texts[J]. Bulletin of the South Ural State University. Ser. Linguistics. 2016:23-31 [8] FENG W., YANG Y., LI Y., REN H. Study on the English Corresponding Unit of Chinese Clause [A]. Springer: NLPCC-ICCPOL, 2016:129-140 [9] 李艳翠, 冯文贺, 周国栋等. 基于逗号的汉语子句识别研究 [J]. 北京大学学报 : 自然科学版,2013(1):7-14. [10]LI Y., FENG W., SUN J., KONG F., ZHOU G. 2014.Building Chinese discourse corpus with connective-driven dependency tree structure[a]. In Proceedings of EMNLP, 2014 [11] 冯文贺. 汉英篇章结构平行语料库的对齐标注研究 [J]. 中文信息学报, 2013:158-165 [12] 王磊. 试论俄语 共戴句 [J]. 中国俄语教学, 1995:21-24 杨毅 Russia, Ekaterinburg, Ural Federal University, ul. Lenin 51, 620000 xwyang@mail.ru 冯文贺广东省广州市广东外语外贸大学语言工程与计算实验室 510006 wenhefeng@gmail.com