<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA>

Size: px
Start display at page:

Download "<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA>"

Transcription

1 中科院计算所多语言处理和机器翻译 研究进展 姜文斌 中国科学院计算技术研究所自然语言处理研究组 第九届全国自然语言处理青年学者研讨会深圳,2012 年 8 月

2 大纲 研究背景 问题与挑战 研究进展 翻译评测 2

3 中国的多语言环境 少数民族语言众多 维吾尔语 哈萨克语 柯尔克孜语 蒙古语 藏语 朝鲜语 周边语言环境复杂 语言种类多 : 英语 日语 韩语 泰语 越南语 俄语 很多语言与国内少数民族语言相通 3

4 多语言处理与翻译国际局势 美国 美国军方对此投入大量资金, 相关的大型项目包括 : TIPSTER,TIDES,GALE 日本 对机器翻译投入极其巨大 在泰国等东南亚国家设立自然语言处理研究机构 欧盟 多个研究框架计划都有对多语言信息处理持续的大规模项目资助 4

5 多语言处理与翻译国内现状 汉语处理和汉英翻译研究较多 少数民族语言信息处理研究起步 数据资源初步成型 算法研究开始起步 编码转换 : 对一些语言仍然相当严重 词法分析 : 已有初步可用的词法分析工具 句法分析 : 已有一些初探性研究 语义分析 : 几乎没有 机器翻译 : 已有初步可用的翻译系统 ( 蒙 藏 维 汉 ) 周边国家语言信息处理研究薄弱 5

6 大纲 研究背景 问题与挑战 研究进展 翻译评测 6

7 多语言处理中的科学问题 编码 / 书写系统识别与转换 拼写检查 句子 / 词语切分 黏着语形态分析 / 生成 命名实体识别 句法分析 黏着语统计机器翻译建模 资源贫乏的应对方法 7

8 编码 / 书写系统识别与转换 一些民族语言拥有多种编码 / 书写系统 编码系统 Unicode 语言特定编码 如藏语班智达编码 书写系统 传统书写系统 拉丁书写系统 蒙古语, 维吾尔语 现存语料通常多用多种编码 / 书写系统 必须实现不同编码 / 书写系统的识别和转换 8

9 拼写校对 拼写错误问题对一些民族语言较为严重 有意的灵活拼写和无意的错误拼写 如拉丁维文, 西里尔蒙文 很多拼写错误并不影响人类理解 计算机基于字符匹配识别词语, 导致无法识别或错误识别 有必要为这些语言实现自动拼写校对功能 9

10 词语切分 一些语言的文本没有显示的词语边界标识 如藏语, 泰语 汉语分词的算法和模型可供借鉴 但对这些语言, 情况往往更为复杂 藏文的基本字丁和音节 泰文基于字母而不是字 需要与语言特性适应的词语切分模型 字丁 / 音节 / 字母 / 字标注? 规则 + 统计? 10

11 黏着语形态分析 黏着语词语形态丰富, 构词复杂灵活 词干可缀接多个不同词缀以构成新词 如维吾尔语, 蒙古语, 哈萨克语, 柯尔克孜语 11

12 黏着语形态分析 黏着语词语形态丰富, 构词复杂灵活 词干可缀接多个不同词缀以构成新词 如维吾尔语, 蒙古语, 哈萨克语, 柯尔克孜语 很多语言没有可用的高性能形态分析器 规则方法较为费力 词干表, 词缀表, 构词规则, 排歧规则 需要构建通用的高性能的形态分析模型 适合黏着语的词语表示形式 适合黏着语的建模方法 12

13 句法分析 句法分析有助于结构差异较大的语言对的机器翻译 翻译规则选择, 译文片段调序, 规则泛化能力 对多数民族语言, 句法分析研究刚刚起步 很少有大规模树库 句法分析算法研究较少 针对黏着语, 传统分析模型未必适用 定义黏着语句法树, 基于词或词干 / 词缀? 如何有效利用丰富的词干和词缀信息 13

14 黏着语统计机器翻译建模 当前的机器翻译模型以词为基本单位 前后处理, 词语对齐, 规则抽取, 翻译解码 无法有效利用黏着语丰富的构词信息 适合黏着语的机器翻译模型和算法 考虑黏着语构词的词语对齐和规则抽取 适合黏着语的翻译建模 14

15 资源贫乏的应对方法 规则和统计技术相结合 互联网数据挖掘 单语 双语句对 利用生语料 无监督, 半监督 借助第三方语言 双语间知识投射, 桥接翻译 15

16 大纲 研究背景 问题与挑战 研究进展 翻译评测 16

17 研究范围 涉及语种 民族语言 : 蒙古语, 维吾尔语, 藏语 东北亚 : 韩语, 日语, 俄语 东南亚 : 泰语, 越南语 17

18 研究范围 开展任务 编码识别 / 转换 拼写校对 句子切分 词语切分 形态分析 句法分析 命名实体识别 / 翻译 机器翻译 18

19 研究范围 语种 - 任务表 编码识别 拼写校对 句子切分 词语切分 形态分析 句法分析 实体识别 翻译建模 蒙古语 藏语 维吾尔语 韩语 越南语 泰语 注 : 红色表示已完成或已开始的工作 19

20 语言资源建设 双语语料库资源 维汉双语语料库 蒙汉双语语料库 藏汉双语语料库 词典资源 维汉词典 蒙汉词典 藏汉词典 句子 词语自动对齐工具 语言无关 即时更新后续对齐 20

21 编码识别与转换 基于多粒度语言模型的联合语种与编码识别 将语种识别和编码识别建模为统一的分类问题 基于字节 字符和词的三种粒度的语言模型进行分类 支持 6 个语种 : 藏语 维语 蒙语 阿拉伯语 汉语及英语 支持 13 种编码或书写系统 : 藏语 UTF-8 藏语班智达 藏语同元 藏语华光 藏语方正 拉丁维语 UTF-8 老维语 UTF-8 阿拉伯语 UTF-8 中文 UTF-8 中文 GB2312, 英文 UTF-8 老蒙语和新蒙语 语种识别和编码识别的准确率达 99.95% 21

22 编码识别与转换 维吾尔语 传统维文和拉丁维文编码转换 蒙古语 老蒙文与拉丁蒙文的转换 新蒙文与老蒙文之间的转换 ( 进行中 ) 藏语 班智达码与 UTF-8 编码相互转换 其他编码 ( 桑布扎码 方正码 华光码 同元码 ) 到 UTF-8 的转换 22

23 句子切分 融合规则和判别式分类的藏语句子切分 利用藏语边界词表识别歧义的句子边界 采用最大熵模型识别规则无法识别的歧义句子边界 实验测试 F 值为 97.8% 23

24 词语切分 融合规则和判别式分类的藏语分词 以音节为单位的感知机序列标注模型 感知机模型生成切分词图 引入词典特征在词图中进行重排序 实验测试 F 值为 96.3% 输入藏文最小切分及序列标注分词结果 24

25 形态分析 基于有向图的黏着语形态分析模型 将语句分析结构建模为词干词缀组成的有向图 判别式方法为每个词语枚举词干词缀组合形态 判别式方法对有向图参数空间进行建模 ( 进行中 ) 适用于蒙古语 维吾尔语和其他形态丰富语言 25

26 传统词语表示形式 词语表示形式 W 1 W 2 W 1 S 1 A 11 A 12..A 1m S 1 A 11 A 12 A 1m S 2 A 21 A 22..A 2n W 2 S 2 A 21 A 22 A 2n 基于有向图的词语表示形式 W 1 S 1 W 2 S 2 A 11 A 21 A 12 A 22 A 1m A 2n 26

27 模型参数空间 联合形态分析与词性标注的参数图模型 词干词缀相应标注树 t(t) 词干词缀树结构 T P(G) P(T) P(t(T)) P(T, t(t)) 27

28 判别式词干词缀切分 将词语的词干词缀切分建模为序列标注 以字母为分类的基本单位 使用局部窗口内的字符 N 元组特征 使用最大熵分类算法进行训练 以 Cube Pruning 方式快速枚举出 N-best 候选 优点 与全枚举方式相比, 更小的候选形态分析集 处理未知词干和词缀情形的泛化能力词缀情形的 28

29 实验 实现蒙古语和维吾尔语形态分析 联合切分标注的准确率分别是蒙古语 :95.0%, 维吾尔语 :92.6% 29

30 句法分析 融合双语映射和无监督优化的依存句法分析 通过对齐关系将源语言句法结构投射到目标语言 以双语映射结果为基础进行无监督优化 在蒙古语依存分析上正确率为 44.7% 30

31 黏着语翻译建模 基于词缀信息的翻译规则选择模型 词干作为基本翻译单元进行翻译 词缀分布作为规则上下文以指导翻译规则选择 已应用在维吾尔语 哈萨克语和柯尔克孜语到汉语的翻译上 31

32 词缀分布估计 抽取规则时, 保留词缀信息 源端相同的规则构成一个集合, 使用 TF-IDF 表示规则相关的词缀权重 32

33 词缀分布估计 同一集合内, 对于目标端也相同的规则使用基于质心的分类算法计算词缀分布 词缀分布之间的相似度使用夹角余弦计算 33

34 解码 对于待翻译的词语序列, 通过形态分析得到其词干序列和词缀分布 对于匹配上的规则, 计算两者之间词缀分布的相似度 相似度得分作为一个特征加入解码器 34

35 实验 尝试采用无监督和有监督形态分析工具 在维 汉 哈 汉和柯 汉上实验 维吾尔 汉哈萨克 汉柯尔克孜 汉 Baseline 无监督分析 有监督分析

36 更多工作 基于字符序列标注的泰语词语切分 F 值约为 92% 基于规则的藏文数词识别和翻译识别 98.9%, 翻译 98.7% 规则和统计相结合的维文命名实体识别与翻译 ( 进行中 ) 36

37 大纲 研究背景 问题与挑战 研究进展 翻译评测 37

38 机器翻译研讨会及评测 全国机器翻译研讨会 (CWMT) 统计机器翻译研讨会 ( ) 中科院自动化所 计算所 软件所 哈工大 厦门大学 全国机器翻译研讨会 ( ) CWMT 2012 将于 9 月在西安举行 机器翻译评测 2007 年开始, 中科院计算所组织 评测组织方提供训练和测试数据 参评单位在给定时间内返回翻译结果并提交技术报告 评测网站 : 38

39 CWMT2011 机器翻译评测 项目设置 ( 首次引入民族语言翻译项目 ) 序号评测项目名称语种领域 1 汉英新闻领域机器翻译汉语 英语新闻领域 2 英汉新闻领域机器翻译英语 汉语新闻领域 3 蒙汉日常用语机器翻译蒙古语 汉语日常用语 4 藏汉政府文献机器翻译藏语 汉语政府文献 5 维汉新闻领域机器翻译维吾尔语 汉语新闻领域 6 哈汉新闻领域机器翻译哈萨克语 汉语新闻领域 7 柯汉新闻领域机器翻译柯尔克孜语 汉语新闻领域 感谢新疆大学, 内蒙古大学, 青海师范大学, 西北民族大学和厦门大学等单位提供评测语料! 39

40 CWMT2013 机器翻译评测 项目设置计划 序号评测项目名称语种领域 1 汉英新闻领域机器翻译汉语 英语新闻领域 2 英汉新闻领域机器翻译英语 汉语新闻领域 3 蒙汉日常用语机器翻译蒙古语 汉语日常用语 4 藏汉政府文献机器翻译藏语 汉语政府文献 5 维汉新闻领域机器翻译维吾尔语 汉语新闻领域 * 除提供训练语料外, 还提供开源的 baseline 系统 * 增加以众包形式进行的手工评测 * 参评系统需提交更多的中间结果, 以便分析交流 40

41 CWMT2013 机器翻译评测 项目设置计划 序号评测项目名称语种领域 1 汉英新闻领域机器翻译汉语 英语新闻领域欢迎大家对该评测的内容提出意见和建议! 2 英汉新闻领域机器翻译英语 汉语新闻领域 欢迎更多的单位参加 CWMT 机器翻译评测或者为 3 蒙汉日常用语机器翻译蒙古语 汉语日常用语机器翻译评测提供资源和工具! 4 藏汉政府文献机器翻译藏语 汉语政府文献 5 维汉新闻领域机器翻译维吾尔语 汉语新闻领域 * 除提供训练语料外, 还提供开源的 baseline 系统 * 增加以众包形式进行的手工评测 * 参评系统需提交更多的中间结果, 以便分析交流 41

42 小结 与民族院校紧密合作, 取得阶段性成果 较大规模的维汉 蒙汉 藏汉双语资源 维 蒙 藏编码识别 词法分析和实体识别工具 初步可用的维汉 蒙汉 藏汉统计机器翻译系统 民族语言机器翻译评测 未来工作 扩大双语资源规模 形态丰富语言和资源缺乏语言的统计翻译模型和方法 42

43 谢谢大家! 43

44 44

PowerPoint Presentation

PowerPoint Presentation CWMT 机器翻译评测 回顾与展望 吕雅娟 中国科学院计算技术研究所 自然语言处理研究组 2012-09-16 第八届全国机器翻译研讨会 (CWMT 2012) 西安 主要内容 CWMT 机器翻译评测回顾 2013 年机器翻译评测设想与规划 2013 年机器翻译评测讨论 2012-09-16 第八届全国机器翻译研讨会 (CWMT 2012) 西安 2 全国机器翻译研讨会 统计机器翻译研讨会 (SSMT,2005

More information

少数民族语言信息化推进民族地区农牧业发展研究

少数民族语言信息化推进民族地区农牧业发展研究 少数民族语言机器翻译资源与技术瓶颈 李淼 中国科学院合肥物质科学研究院智能机械研究所 2012-09-20 西安 报告提纲 一 少数民族语言机器翻译现状 二 资源瓶颈 三 技术瓶颈 四 实验室工作简介 五 总结 : 一些可借鉴的工作 一 少数民族语言机器翻译现状 研究主要集中于藏 蒙 维等少数几种语言 藏 1995 年, 陈玉忠 李延福等实现了汉藏科技机器翻译系统的原型系传统农业统 ; 2000 年,

More information

<4D F736F F D D BBFAC6F7B7ADD2EBC6C0B2E2B1A8B8E6A3A8D6D5B0E6A3A92E646F63>

<4D F736F F D D BBFAC6F7B7ADD2EBC6C0B2E2B1A8B8E6A3A8D6D5B0E6A3A92E646F63> 第七届全国机器翻译研讨会 (CWMT2011) 评测报告 赵红梅吕雅娟贲国生黄云刘群中国科学院计算技术研究所智能信息处理重点实验室自然语言处理研究组北京 100190 E-mail:{zhaohongmei, lvyajuan, benguosheng, huangyun, liuqun}@ict.ac.cn 1 概述 为了全面了解国内外机器翻译技术的现状, 促进机器翻译技术的研究, 按照惯例, 第七届

More information

Y2O3:Eu3+纳米棒的微乳液-微波法制备、表征与发光性能

Y2O3:Eu3+纳米棒的微乳液-微波法制备、表征与发光性能 一种通用的少数民族语言语种和编码识别方法 张海波 1, 吕雅娟 1, 刘凯 1, 华却才让 2, 刘群 1 (1 中国科学院计算技术研究所自然语言处理实验组, 北京,100190 2 青海师范大学藏文信息研究中心, 青海西宁,810008) 摘要 : 语种和编码识别是自然语言处理的基础环节 我国的一些少数民族语言有多种编码方式, 增大了语种和编码识别的复杂性 本文提出了一种通用的基于统计的语种和编码识别方法,

More information

博士论文答辩报告.ppt

博士论文答辩报告.ppt 博士论文答辩报告 树到串统计翻译模型研究 答辩人 : 刘洋 指导教师 : 林守勋研究员 时间 :2007 年 6 月 16 日 提纲 引言 词语对齐的对数线性模型 树到串统计翻译模型 模型 1 模型 2 模型 3 实验 总结 MT Strategies (1954-2004) Knowledge Acquisition Strategy All manual Electronic dictionaries

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20 Three papers in NLP fields: Chinese word segmentation (ACL2012), dependency parsing (EMNLP 2012) and SMT (ACL2012) Reporter:Fandong Meng 2012/12/26 Three papers Ø Fast Online Training with Frequency-Adaptive

More information

Instructions for ACL-2013 Proceedings

Instructions for ACL-2013 Proceedings 第九届全国机器翻译研讨会 (CWMT 2013) 评测报告 赵红梅谢军吕雅娟于惠张昊亮刘群 中国科学院计算技术研究所, 北京,100190 摘要 : 本文介绍了 CWMT 2013 机器翻译评测的总体情况, 描述了 CWMT 2013 评测的几个特点 :1) 采用了 灰箱评测 方式 ;2) 提供了各评测项目的基线系统 ;3) 在部分评测项目上进行了人工评测 ;4) 新增了 METEOR 和 TER

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 多策略的机器翻译 王海峰 2006 年 11 月 21 日 提纲 概述 东芝的机器翻译研究 概况 规则方法 实例方法 统计方法 其它 多种方法的融合 讨论与展望 Page 2 三种主流机器翻译方法 对语言规律良好的概括和描述能力 规则方法 机器翻译产品仍以规则系统为主 仍有不断提高的潜力 (Zhu. 2005) 实例方法 统计方法 对相似句子相当精确的翻译能力 依然活跃 (MT Journal, MT

More information

年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技

年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技 第 卷 第 期 年 月!"# $ %&'& 文章编号 维吾尔语形态切分语料库 哈里旦木 阿布都克里木 孙茂松 刘洋 阿布都克力木 阿布力孜 清华大学计算机科学与技术系智能技术与系统国家重点实验室 清华信息科学与技术国家实验室 筹 北京 ( 清华大学人文学院计算语言学实验室 北京 ( 摘 要 ")!&*+,"-./0,1/.*-.))0,1*!&*+,&'&0) 0/.&/&*+1- 是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库

More information

Access9

Access9 面试考生分批表 ( 共 901 人 ) 第 1 批 ( 请考生于面试开始前 30 分钟到外交学院二层礼堂候考, 严禁迟到 ) 2 月 2 日 ( 周一 ) 上午 8:30 开始 英语一 共 110 人 共 22 人 1 1010001 102111441306 面试一 2 1010002 102111421406 面试一 3 1010003 102143181201 面试一 4 1010004 102142154530

More information

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5>

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5> 中文自然语言处理平台 FudanNLP: 从词法到句法, 再到语义 报告人 : 邱锡鹏 xpqiu@fudan.edu.cn http://jkx.fudan.edu.cn/~xpqiu/ 提纲 1 FudanNLP 系统介绍 2 算法原理 3 词法 句法 语义 FudanNLP 系统介绍 设计目标 为中文自然语言处理研发一个开源平台, 使用统一框架, 集成先进研究成果, 降低中文分析门槛, 促进中文自然语言处理的发展

More information

内容提要 研究 应用 国内外现状分析 进步与不足 机器翻译研究范式的变化 应用范围的延伸互联网翻译计算机辅助翻译口语翻译 急待解决的核心问题 深层次语言知识的运用复杂形态语言翻译建模资源缺乏语言机器翻译机器翻译的自动评价 翻译质量还不够高翻译结果还不够可信系统使用还不够方便语种和领域的支持还不够多

内容提要 研究 应用 国内外现状分析 进步与不足 机器翻译研究范式的变化 应用范围的延伸互联网翻译计算机辅助翻译口语翻译 急待解决的核心问题 深层次语言知识的运用复杂形态语言翻译建模资源缺乏语言机器翻译机器翻译的自动评价 翻译质量还不够高翻译结果还不够可信系统使用还不够方便语种和领域的支持还不够多 中文信息学会成立三十周年学术会议 机器翻译技术的进展与展望 刘群 王海峰 王惠临 宗成庆 赵铁军史晓东 朱靖波 陈家俊 张民 2011-12 内容提要 研究 应用 国内外现状分析 进步与不足 机器翻译研究范式的变化 应用范围的延伸互联网翻译计算机辅助翻译口语翻译 急待解决的核心问题 深层次语言知识的运用复杂形态语言翻译建模资源缺乏语言机器翻译机器翻译的自动评价 翻译质量还不够高翻译结果还不够可信系统使用还不够方便语种和领域的支持还不够多

More information

PowerPoint Presentation

PowerPoint Presentation 中科院计算所自然语言处理研究组 Natural Language Processing Group in CAS-ICT 刘群 LIU Qun 2010-08-03 水木社区 NLP 版聚 大纲 Outline 概况 Overview 组织结构 Organization 研究历史 Research History 人员 People 研究领域 Research Areas 学术活动 Academic

More information

摘要 二十世纪末以来, 藏族以其悠久的历史和博大精深的的文化吸引众多研究者 的关注, 但语言上的障碍严重阻碍了人们间的交流, 于是对于藏文的信息化处理 的研究便成为计算机信息处理技术领域的一个热门 由于藏文自身的繁杂性及使 用范围相对较小的特点, 加之当前藏文信息处理技术还在起步阶段, 如藏语语料 库建设, 自动分词标注等与机器翻译相关的基础研究尚处在前期开发阶段 因此, 研究藏文的句法和藏汉机器翻译,

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 NiuTrans 开源统计机器翻译系统技术分析 李强, 孙坤杰, 刘卓, 肖桐, 朱靖波 ( 东北大学自然语言处理实验室, 辽宁沈阳 110819) 摘要 : 本文主要介绍了最新版 NiuTrans 开源统计机器翻译系统的技术特点 在最新版的 NiuTrans 中, 包含当前主流的统计机器翻译模型, 即 : 基于短语的翻译模型, 基于层次短语的翻译模型, 基于句法 ( 树到串 / 串到树 / 树到树

More information

基于“松弛尺度”的短语翻译对抽取方法

基于“松弛尺度”的短语翻译对抽取方法 中科院自动化所 CWMT2009 评测技术报告 张家俊, 李茂西, 周玉, 陈钰枫, 宗成庆中国科学院自动化研究所模式识别国家重点实验室北京 100190 E-mail: {jjzhang, mxli, yzhou, chenfy, cqzong}@nlpr.ia.ac.cn 摘要 : 本文主要介绍了中科院自动化所参加 CWMT2009 研讨会的技术报告, 我们一共参加了四个项目的评测任务, 包括汉英新闻单一系统评测任务

More information

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批 厦门大学 2007 年本科招生录取分数一览表 省份 批次 文科 重点线出档线最高分最低分平均分 录取人数 重点线出档线最高分最低分平均分 录取人数 备注 北京 本一批 528 562 621 572 591.6 23 531 613 655 613 631.9 52 本一批 574 580 638 584 612 23 545 559 643 594 615 67 非西藏生 广西 源定向西 625

More information

基于SVM的机器翻译自动评价方法的研究

基于SVM的机器翻译自动评价方法的研究 机器翻译自动评价十年 杨沐昀 赵铁军 朱俊国哈尔滨工业大学计算机科学与技术学院 机器智能与翻译研究室 2012 年 9 月, 西安 前言 自动评价已成为机器翻译中的关键因素 自动评价为导向的 MT 建模 研究中采用多种自动评价指标验证成果 评测中使用多种自动评价指标考量性能 每年不断出现新的角度构建自动评价策略 某些情况下自动评价仍无法正确区分翻译质量 系统融合案例 提纲 机器翻译自动评价研究概况

More information

从 他的老师当得好 谈起 黄正德 哈佛大学语言学系 波士顿 黄正德 美国麻省理工学院语言学博士 美国哈佛大学语言学系教授 先后执教于美国夏威夷大学 台湾清华大学 台湾师范大学 美国康乃尔大学 美国加州大学 在法国 日本 西班牙 澳大利亚等国家担任客座教授 学术研究专治语 法理论 着重于句法学 句法语义接口 语言参数理论以及汉语语法研究方面 出版学术专书与期刊论文数十部

More information

面向短语统计机器翻译的汉日联合分词研究 吴培昊 1, 徐金安 1, 张玉洁 (1. 北京交通大学计算机与信息技术学院, 北京 ) 摘要 : 未登录词与分词粒度是汉日日汉机器翻译研究的两个主要问题 与英语等西方语言不同, 汉语与日语词 语间不存在空格, 分词为汉日双语处理的重要工作 由于词

面向短语统计机器翻译的汉日联合分词研究 吴培昊 1, 徐金安 1, 张玉洁 (1. 北京交通大学计算机与信息技术学院, 北京 ) 摘要 : 未登录词与分词粒度是汉日日汉机器翻译研究的两个主要问题 与英语等西方语言不同, 汉语与日语词 语间不存在空格, 分词为汉日双语处理的重要工作 由于词 面向短语统计机器翻译的汉日联合分词研究 吴培昊 1, 徐金安 1, 张玉洁 (1. 北京交通大学计算机与信息技术学院, 北京 100044) 摘要 : 未登录词与分词粒度是汉日日汉机器翻译研究的两个主要问题 与英语等西方语言不同, 汉语与日语词 语间不存在空格, 分词为汉日双语处理的重要工作 由于词性标注体系 文法及语义表现上的差异, 分词结果 的粒度需要进一步调整, 以改善统计机器翻译系统的性能

More information

未命名

未命名 一个汉英机器翻译系统的计算模型与语言模型 * 刘群 + 詹卫东 ++ 常宝宝 ++ 刘颖 + ( + 中国科学院计算技术研究所二室北京 100080) ( ++ 北京大学计算语言学研究所北京 100871) 摘要 : 本文介绍我们所设计并实现的一个汉英机器翻译系统 在概要介绍本系统的主要目标和设计原则的基础上, 着重说明系统的计算模型和语言模型, 最后给出实验结果和进一步的打算 关键词 : 自然语言处理机器翻译中文信息处理一

More information

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理 厦门大学 2006 年普高招生分省分专业录取分数统计表 省份 科类 本一线 出档线 人数 最高分 最低分 平均分 文 573 600 25 638 601 612.7 安徽 理 566 615 74 653 615 630.1 理 ( 国防生 ) 566 596 12 621 596 607.2 北京 文 516 574 24 605 574 586.3 理 528 593 59 646 596 610.7

More information

Microsoft Word - construct_smts.doc

Microsoft Word - construct_smts.doc 利用现有软件构建统计机器翻译系统 刘洋 中国科学院计算技术研究所数字化技术研究室 yliu@ict.ac.cn 1 介绍 本文的主旨是介绍如何利用现有软件在很短的时间内构建一个统计机器翻译 (Statistical Machine Translation) 系统 重点将放在具体的操作上, 而不是相关的理论 2 准备工作 为了构建统计机器翻译系统, 必须准备一下资源 : [1] Linux 操作系统

More information

Microsoft Word - 第三章第一節第二節.doc

Microsoft Word - 第三章第一節第二節.doc 原 臺 中 刑 務 所 典 獄 長 官 舍 第 三 章 臺 中 刑 務 所 典 獄 官 建 築 研 究 與 調 查 第 一 節 建 築 特 色 及 考 證 一 日 治 時 期 臺 灣 官 舍 建 築 特 色 分 析 - 以 臺 中 市 西 區 為 例 96 ( 一 ) 臺 灣 總 督 府 官 舍 制 度 日 治 初 期 臺 灣 總 督 府 為 從 日 本 內 地 招 募 各 種 官 吏 來 到 臺

More information

untitled

untitled TT...1 TT...6 TT...13 TT...21 TT...22 TT...23 TT...25 TT...25 TT...32 TT...33 TT...33 TT...34 TT...38 T...40T TT...44 TT...46 TT...47 TT...49 TT...51 TT...53 TT...53 TT...54 TT...54 TT...54 TT...55 ,,,,,,,,

More information

标题

标题 ISSN1000G0054 CN11G2223/N 清华大学学报 ( 自然科学版 ) 2017 年第 57 卷第 8 期 JTsinghuaUniv(Sci& Technol), 2017,Vol.57, No.8 17/19 878G883 神经机器翻译系统在维吾尔语汉语翻译中的性能对比 哈里旦木 阿布都克里木, 刘 洋, 孙茂松 ( 清华大学计算机科学与技术系, 智能技术与系统国家重点实验室,

More information

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工 厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 573 624 631 624 627.9 理工 562 634 655 634 640.7 北京 文史 524 567 620 567 592.5 理工 494 583 648 587 609.3 福建 文史 557 594 622 594 603.5 理工 539 602 650 602

More information

untitled

untitled 18 2006 J 1982 N CD-ROM "fl N J "fl J [ ])( N "fl N N ( ) - 5 - J *1 N [ ] http://www.sinica.edu.tw/ftms-bin/ftmsw3 http://www.sinica.edu.tw/ftms-bin/kiwi1/pkiwi.sh UTF-8 3.0 Big5+ [ ] http://www.lingshidao.com/gushi/index.htm

More information

公開徵求廠商提供「採購專業人員訓練計畫企劃書」公告

公開徵求廠商提供「採購專業人員訓練計畫企劃書」公告 1 2 95 4 13 09500131390 96 4 11 09600141370 ( )92 1 29 09200043870 93 11 17 09300431800 11 3 ( ) ( ) ( ) ( 1 ) 2 ( ) ( ) ( 1 ) ( ) 15 15 16 ( ) ( ) ( ) ( ) 80 50 ( ) ( ) ( ) ( ) ( ) 1 [ ] 1/10 ( ) ( )

More information

说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky, Kevin Knight, Chris Callison-Burch,

说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky, Kevin Knight, Chris Callison-Burch, MINDS Workshops Machine Translation Working Group Final Report 报告人 : 刘群 2011-8-20 于 CNCCL2011 说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky,

More information

PowerPoint Presentation

PowerPoint Presentation 机器翻译原理与方法 第四讲基于规则和基于实例的机器翻译方法 刘群中国科学院计算技术研究所 liuqun@ict.ac.cn 中国科学院计算技术研究所 2011 年秋季课程 内容提要 基于规则的方法 基于实例的方法 2 例子 考虑设计一个中译英系统和一个英译中系统, 能够实现以下两个句子的互译 : 小王在联想工作了三年 Xiao Wang has worked in Lenovo for three

More information

Chinese-English Spoken Language Machine Translation in Limited Domain

Chinese-English Spoken Language Machine Translation in Limited Domain 对语音翻译现状的认知以及展望 徐波 中科院自动化所 报告提纲 口语翻译发展概况 紫冬 口译系统基本情况 口语统计翻译存在的问题 口语翻译改进的途径以及展望 讨论 语音翻译 --- 巨大的挑战 Good text translation was hard enough to pull off, Speech-to-speech MT was beyond going to the Moon --- It

More information

北京大学学报 ( 自然科学版 ) 图 1 使用短语对完成解码过程 ( 虚线框中是未生成的短语 对 ) Fig. 1 Decoding with using phrase pairs (phrase pair in dashed rectangle is not generated) 进行拼装, 完成

北京大学学报 ( 自然科学版 ) 图 1 使用短语对完成解码过程 ( 虚线框中是未生成的短语 对 ) Fig. 1 Decoding with using phrase pairs (phrase pair in dashed rectangle is not generated) 进行拼装, 完成 http://www.cnki.net/kcms/detail/11.2442.n.20150929.1436.010.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2016.007 李强 1, 李沐 2 张冬冬 2 朱靖波 1 1. 东北大学自然语言处理实验室,

More information

例子 1 展示了一个越南语句子及其对应的汉语句子, 以及该对句子中汉字与越南语音节之间的对应关系 例子 1:Tôi làlưu học sinh Việt Nam, tôi yêu xử lýngôn ngữ tự nhiên. 我是越南留学生, 我爱自然语言处理 正如上文所述, 越南语中的空格只作

例子 1 展示了一个越南语句子及其对应的汉语句子, 以及该对句子中汉字与越南语音节之间的对应关系 例子 1:Tôi làlưu học sinh Việt Nam, tôi yêu xử lýngôn ngữ tự nhiên. 我是越南留学生, 我爱自然语言处理 正如上文所述, 越南语中的空格只作 越汉双语句子自动对齐研究初步 陈坚忠, 李鹏, 孙茂松智能技术与系统国家重点实验室清华信息科学与技术国家实验室 ( 筹 ) 清华大学计算机系北京 100084 E-mail: tktrungna@gmail.com, pengli09@gmail.com, sms@mail.tsinghua.edu.cn 摘要 : 句子级对齐双语语料是自然语言处理的重要资源之一, 对于机器翻译 跨语言检索 双语词典编纂等研究有很大应用价值

More information

中国科学院大学

中国科学院大学 密级 : 硕士学位论文 维吾尔语命名实体识别和翻译研究 作者姓名 : 李佳正 指导教师 : 吕雅娟副研究员 中国科学院计算技术研究所 学位类别 : 学科专业 : 研究所 : 工学硕士 计算机应用技术 中国科学院计算技术研究所 2013 年 05 月 Research On Named Entity Recognition and Translation in Uyghur By Jiazheng

More information

第 ** 卷第 * 期 中文信息学报 Vol. **,No. * 201* 年 * 月 JOURNAL OF CHINESE INFORMATION PROCESSING ***.,201* 文章编号 :1003-0077(2017)00-0000-00 * THUUyMorph: 维吾尔语形态分析语料库 * 收稿日期 : 定稿日期 : 基金项目 : 国家自然科学基金重点项目 (61331013);

More information

研究阶段的两种主流方法 由于当时这些方法相对粗糙, 无法实现令人信服的自动翻译应用, 因此, 在 1966 年美国国家科学院发布的 ALPAC 报告的影响下, 美国政府和军方对机器翻 译研究所投入的资助几乎都终止了, 机器翻译研究在世界范围内陷入了低谷 但是, 并不是所有的机器翻译研究人员都放弃了希

研究阶段的两种主流方法 由于当时这些方法相对粗糙, 无法实现令人信服的自动翻译应用, 因此, 在 1966 年美国国家科学院发布的 ALPAC 报告的影响下, 美国政府和军方对机器翻 译研究所投入的资助几乎都终止了, 机器翻译研究在世界范围内陷入了低谷 但是, 并不是所有的机器翻译研究人员都放弃了希 机器翻译研究进展与趋势 CCF 中文信息技术专委会 摘要机器翻译实现自然语言之间的自动互译, 是自然语言处理和人工智能领域的经典难题之一 近年来, 机器翻译受到越来越多的关注 一方面, 机器翻译技术拥有迫切的社会需求, 并不完美的机器翻译技术在产业界的应用越来越广泛, 实时语音翻译系统和在线翻译服务已进入日常生活 ; 另一方面, 机器翻译一直是学术界研究的一个热点, 关于机器翻译技术的研究论文在数量上长期占据计算语言学

More information

0503 汉语言文字学 01 现代汉语 02 古代汉语 03 汉外语言对比研究 3627 现代汉语与语言学概论 4827 古代汉语 0505 中国古代文学 古代文学分体研究 02 古代文学传播和接受研究 03 海外中国文学研究 3626 中国古代文学史 4826 古代汉语与历史文化 0

0503 汉语言文字学 01 现代汉语 02 古代汉语 03 汉外语言对比研究 3627 现代汉语与语言学概论 4827 古代汉语 0505 中国古代文学 古代文学分体研究 02 古代文学传播和接受研究 03 海外中国文学研究 3626 中国古代文学史 4826 古代汉语与历史文化 0 四川外国语大学 16 年硕士研究生入学考试专业目录 院系 专业代码 名称 及研究方向 拟招 生数 拟招 推免 生数 考试科目备注 001 研究生院 ( 联系人 : 张老师 023-65385296) 0501 英语语言文学 01 英语语言理论与应用 02 英语文学 03 文化研究 04 美国研究 05 英语教学理论与应用 050211 外国语言学及应用语言学 01 理论语言学 02 认知语言学 03

More information

密级 :

密级 : 密级 : 硕士学位论文 黏着语形态分析模型和方法研究 作者姓名 : 张海波 指导教师 : 刘群研究员 中国科学院计算技术研究所 学位类别 : 学科专业 : 研究所 : 工学硕士 计算机应用技术 中国科学院计算技术研究所 2014 年 5 月 The Research of Morphological Analysis Models and Methods of Agglutinative Languages

More information

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管 海南热带海洋学院 2018 年普通高考招生计划录取数 专业省份 录取数 计划数 本科 4093 4093 安徽 132 132 普通本科 102 102 财务管理 3 3 电子商务 3 3 电子信息科学与技术 3 3 海事管理 3 3 海洋技术 3 3 海洋渔业科学与技术 3 3 海洋资源与环境 2 2 汉语言文学 3 3 化学 2 2 环境工程 4 4 会展经济与管理 3 3 计算机科学与技术 3

More information

COP中文范本

COP中文范本 四 川 宏 达 ( 集 团 ) 有 限 公 司 全 球 契 约 年 度 进 展 报 告 2010 年 5 月 13 日 目 录 高 管 致 辞... 1 公 司 简 介... 2 一 经 济 绩 效... 3 1. 体 系 与 政 策... 3 2. 工 作 与 成 果... 3 3. 反 馈 与 评 价... 3 二 环 境 绩 效... 3 1. 体 系 与 政 策... 4 2. 工 作 与

More information

冶金企业安全生产监督管理规定

冶金企业安全生产监督管理规定 冶 金 企 业 安 全 生 产 监 督 管 理 规 定 国 家 安 全 生 产 监 督 管 理 总 局 国 家 安 全 生 产 监 督 管 理 总 局 令 第 26 号 冶 金 企 业 安 全 生 产 监 督 管 理 规 定 已 经 2009 年 8 月 24 日 国 家 安 全 生 产 监 督 管 理 总 局 局 长 办 公 会 议 审 议 通 过, 现 予 公 布, 自 2009 年 11 月

More information

<4D6963726F736F667420576F7264202D20BAECB1A6C0F6A3BAB7C7B9ABBFAAB7A2D0D0B9C9C6B1C4BCBCAFD7CABDF0CAB9D3C3B5C4BFC9D0D0D0D4B1A8B8E62E646F63>

<4D6963726F736F667420576F7264202D20BAECB1A6C0F6A3BAB7C7B9ABBFAAB7A2D0D0B9C9C6B1C4BCBCAFD7CABDF0CAB9D3C3B5C4BFC9D0D0D0D4B1A8B8E62E646F63> 证 券 代 码 :002165 证 券 简 称 : 红 宝 丽 公 告 编 号 :2010-022 南 京 红 宝 丽 股 份 有 限 公 司 非 公 开 发 行 股 票 募 集 资 金 使 用 的 可 行 性 报 告 二 〇 一 〇 年 十 月 1 目 录 第 一 节 募 集 资 金 使 用 计 划 3 第 二 节 本 次 募 集 资 金 投 资 项 目 可 行 性 分 析 3 第 三 节 本 次

More information

调 查 概 述, 调 查 主 要 发 现 为 此 绿 色 和 平 主 张 01 调 查 背 景 02 环 境 信 息 公 开 的 法 理 基 础 及 实 践 03 中 国 的 环 境 信 息 公 开 办 法 ( 试 行 ) 调 查 对 象 04 05 调 查 方 法 06 07 免 责 声 明 : 08 09 调 查 主 要 结 果 及 分 析 10 11 12 超 越 第 二 十 一 条 企 业

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 张 工 培 训 注 册 消 防 工 程 师 考 试 免 费 宣 讲 课 土 木 建 筑 培 训 领 导 者 1 关 于 资 格 考 试 科 目 及 报 考 条 件 1 什 么 时 候 考 试? 一 级 和 二 级 是 同 一 时 间 考 试 吗? 根 据 公 安 部 消 防 局 官 方 答 疑,2015 年 一 级 注 册 消 防 工 程 师 资 格 考 试 时 间 和 报 名 方 式 计 划 由

More information

单击此处输入中文题吊(上超过20个汉字)

单击此处输入中文题吊(上超过20个汉字) 英汉人名音译方法研究 邹波, 赵军 ( 中国科学院自动化研究所模式识别国家重点实验室, 北京 100080) 摘要 : 本文详细比较了两种机器学习方法和两种统计翻译模型在英汉人名音译上的应用效果 本文首先提出了将英汉人名翻译问题看作序列标注问题的处理思路, 并且将两种机器学习方法 : 最大熵模型和条件随机场模型应用于人名翻译 在使用机器学习算法进行音译时, 本文比较了不同特征集对人名音译的影响, 实验表明字母串特征和标注之间转移特征对提高音译性能有很大帮助

More information

by 1 2 3 4 5 6 7 x 1,,x n n n X Y Z t T t T Y Y (X) X Z Z (X) X f (Y ) f : Y R g(z) g : Z R Y Ŷ Z Ẑ d( ) δ M N 1 1.1 X X Y Y Z Z t t T Y f : Y R Y Z g : Z R Z X X Ŷ = arg max f (Y ) Y (X) (X) X

More information

安徽 专业 科类 最高分 最低分 专业 科类 最高分 最低分 社会学 理 哲学 文 网络与新媒体 理 社会学 文 公共事业管理 理 翻译 文 经济学 理 网络与新媒体 文

安徽 专业 科类 最高分 最低分 专业 科类 最高分 最低分 社会学 理 哲学 文 网络与新媒体 理 社会学 文 公共事业管理 理 翻译 文 经济学 理 网络与新媒体 文 安徽 社会学 理 636 636 哲学 文 635 635 网络与新媒体 理 638 638 社会学 文 634 634 公共事业管理 理 636 636 翻译 文 636 636 经济学 理 638 638 网络与新媒体 文 634 634 国际商务 理 637 635 工商管理 文 636 636 行政管理 理 635 635 国际商务 文 635 635 信息管理与信息系统 ( 法治信息管理方向

More information

孙 蓝等 基于目标导向的研究生英语学习模式创新

孙 蓝等 基于目标导向的研究生英语学习模式创新 第 期 总第 期 年 月 研究生教育研究 以中国科技大学研究生英语学习公共服务平台建设为例 孙 蓝 陈纪梁 邢鸿飞 刘海清 万洪英 中国科学技术大学外语系 安徽合肥 中国科学技术大学研究生院 安徽合肥 研究生英语教学的使命是培养学生在当今多元社会中进行有效沟通的能力 英语语言教育者的任务不是去寻求更好的教学法 而是要探索一套能够满足学生需求且与学生学习体验相一致的教与学的策略 为此 有必要构建研究生英语学习公共服务平台

More information

books to read to improve english grammar

books to read to improve english grammar Books To Read To Improve English Grammar ->>->>->> http://bit.ly/2xq4jy3 1 / 5 2 / 5 Test...and...seven...books...in...the...popular...Caught'ya!...ENGLISH...MET... How...to...improve....English...grammar...without...reading...grammar...book?:^)?...33...repliesForums......General....English...Grammar...&...Vocabulary,...Listening...&...Speaking......General...

More information

Microsoft Word doc

Microsoft Word doc 蒙古语语料库综述 雪艳 1, 文化 2, 那顺乌日图 ( 内蒙古大学蒙古学学院, 内蒙古呼和浩特 010021) 3 摘要 : 内蒙古大学蒙古语文研究所, 自 1983 年以来先后建立了各种语料库 10 余个, 这些语料库是蒙古语研究的重要资源, 尤其是经过浅加工的 100 万词级现代蒙古语语料库自建成到现在一直都是现代蒙古语研究和蒙古文信息处理研究的重要数据来源 直至今天, 蒙古语语料库的建设和研究工作整整经历了

More information

大侠素材铺

大侠素材铺 编译原理与技术 词法分析 Ⅱ 计算机科学与技术学院李诚 13/09/2018 主要内容 记号 (token) 源程序 词法分析器 getnexttoken 语法分析器 符号表 词法分析器的自动生成 正则表达式 NFA DFA 化简的 DFA 词法分析器的生成器 Lex: flex jflex Fst lexicl nlyzer genertor 2/51 Regulr Expr to NFA 正则表达式

More information

神经机器翻译综述

神经机器翻译综述 2017 年在线发布 CHINESE JOURNAL OF COMPUTERS 2017Online 神经机器翻译综述 李亚超 1),2) 熊德意 1) 张民 1) 1) ( 苏州大学计算机科学与技术学院江苏苏州 215006) 2) ( 西北民族大学甘肃省民族语言智能处理重点实验室兰州 730030) 摘要机器翻译研究将源语言所表达的语义自动转换为目标语言的相同语义, 是人工智能和自然语言处理的重要研究内容

More information

[Smadja et al.,1996;melamed,2000], 其中典型的对齐软件就是 GIZA++ [Och,2000;Och et al.,2003] GIZA++ 实现了 IBM 公司提出的 5 个模型 [Brown et al.,1993] 和隐马尔科夫模型 (HMM)[Och et

[Smadja et al.,1996;melamed,2000], 其中典型的对齐软件就是 GIZA++ [Och,2000;Och et al.,2003] GIZA++ 实现了 IBM 公司提出的 5 个模型 [Brown et al.,1993] 和隐马尔科夫模型 (HMM)[Och et 面向短语的词语对齐方法 田亮黄辉 周沁 澳门大学自然语言处理与中葡机器翻译实验室澳门 E-mail:{ma96572, derekfw, lidiasc}@umac.mo 摘要 : 自动词语对齐技术在统计机器翻译领域中起了很大的作用 然而,GIZA++ 训练得出的对齐结果并不是很令人满意 本文提出了一种基于最大匹配法 (MMM) 和 GIZA++ 的词语对齐方法 首先, 我们使用了最大匹配法分别把平行的英文和中文句子划分成单词和短语,

More information

学院、学科、研究方向

学院、学科、研究方向 指学院 学科 研导究方向教师 001 英语语言文化学院英语语言文学 (0501) 01 英美小说 02 英美诗歌 03 英美戏剧 招生人数 考试科目 复试科目 备注 110 30 2 240 俄语 或 241 法语 或 242 德语 1 951 专业笔试和综合素质面试 3 年或 243 日语 2 949 英美概况 ( 同等学力加试 ) 制或 244 西班牙语 3 950 英美文学 ( 同等学力加试

More information

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A831312D31A3A9BBFAC6F7B7ADD2EBB8C5C2DB2E707074>

<4D F736F F F696E74202D20D7D4C8BBD3EFD1D4C0EDBDE2A3A831312D31A3A9BBFAC6F7B7ADD2EBB8C5C2DB2E707074> 第 11 章机器翻译 (1/3) 内容提要 NLPR 11.1 机器翻译概论 11.2 统计机器翻译 11.3 语音翻译 NLPR 11.1 机器翻译概论 NLPR 11.1.1 引言 有关专家已经指出, 语言障碍是 21 世纪国际社会全球化面临的主要困难之一 ; 机器翻译涉及语言学 计算语言学 认知科学和数学等多种学科, 具有重要的科学意义 ; 具有巨大的社会需求, 以欧洲为例, 有 380 多种语言,2004

More information

厦门大学2003年陕西省本一批录取情况统计表

厦门大学2003年陕西省本一批录取情况统计表 厦门大学 2003 年各省分专业招生录取分数统计表 北京天津河北山西内蒙古辽宁吉林黑龙江 上海 江苏 浙江 安徽 江西 山东河南 湖北 湖南 陕西 甘肃 青海 宁夏 新疆广西 海南 重庆 四川 贵州 云南 厦门大学 2003 年北京市本一批录取情况统计表 科类专业录取人数最低分最高分平均分 文史 经济学 3 519 557 536.8 国际经济与贸易 2 528 532 530 ( 共 21 人 )

More information

Microsoft Word - dissertation.doc

Microsoft Word - dissertation.doc 工学博士学位论文 基于统计方法的汉语依存句法分析研究 Research on Chinese Dependency Parsing Based on Statistical Methods 马金山 哈尔滨工业大学 2007 年 12 月 国内图书分类号 :TP391.2 国际图书分类号 :681.37 工学博士学位论文 基于统计方法的汉语依存句法 分析研究 博士研究生 : 马金山 导 师 : 李 生

More information

第 6A 期王志娟, 等 : 跨语言命名实体翻译对抽取的研究综述 15 2 基于翻译的跨语言命名实体翻译对抽取 命名实体直接翻译是早期获取跨语言命名实体翻译对的 主要方法, 由于跨语言命名实体对的翻译通常基于音译 ( 人 名 简单地名 ) 和音译 / 意译组合 ( 组织机构名和复杂地名 ), 因 此

第 6A 期王志娟, 等 : 跨语言命名实体翻译对抽取的研究综述 15 2 基于翻译的跨语言命名实体翻译对抽取 命名实体直接翻译是早期获取跨语言命名实体翻译对的 主要方法, 由于跨语言命名实体对的翻译通常基于音译 ( 人 名 简单地名 ) 和音译 / 意译组合 ( 组织机构名和复杂地名 ), 因 此 第 44 卷第 6A 期 2017 年 6 月 计算机科学 CO 岛 1PUTER SCIENCE Vol. 44 No. 6A une 2017 跨语言命名实体翻译对抽取的研究综述 王志娟 1, 2 李福现 3 ( 中央民族大学信息工程学院北京 10008 1) 1 ( 国家语言资源监测与研究中心少数民族语言分中心北京 10008 1) 2 ( 合一网络技术有限公司数据智能部北京 100080)3

More information

201413

201413 Computer Engineering and Applications 计算机工程与应用 214,5(13) 153 构建和剖析中英三元组可比语料库 胡小鹏, 袁琦, 耿鑫辉, 朱姝 HU Xiaopeng, YUAN Qi, GENG Xinhui, ZHU Shu 中国电子信息产业发展研究院, 北京 144 China Center for Information Industry Development(CCID),

More information

王莎等 : 基于多特征融合的统计机器翻译译文错误检测 泛应用 [4 7] 之后, 一些研究人员开始尝试利用其他知识源作为特征, 并与 WPP 置信特征相结合来进行错误检测, 如深层次句法或深层次语义特征等 [8 9] 然而, 由于多数外部特征的复杂性 与具体语言相关等原因, 有效的并且通用的特征并不

王莎等 : 基于多特征融合的统计机器翻译译文错误检测 泛应用 [4 7] 之后, 一些研究人员开始尝试利用其他知识源作为特征, 并与 WPP 置信特征相结合来进行错误检测, 如深层次句法或深层次语义特征等 [8 9] 然而, 由于多数外部特征的复杂性 与具体语言相关等原因, 有效的并且通用的特征并不 32 西安理工大学学报 JournalofXi anuniversityoftechnology(2013)vol.29no.1 文章编号 :1006 4710(2013)01 0032 06 基于多特征融合的统计机器翻译译文错误检测 王莎, 杜金华, 刘丁 ( 西安理工大学自动化与信息工程学院, 陕西西安 710048) 摘要 : 抽取了 3 种典型的单词后验概率特征 ( 基于固定位置的词后验概率

More information

629 计算机学报 2017 年 Finaly,weobservesignificantimprovementsfrom0.8to2.8BLEUpointswhentranslating Bengali,Tamil,Uzbek,andHungarianonthetestdatasetscompare

629 计算机学报 2017 年 Finaly,weobservesignificantimprovementsfrom0.8to2.8BLEUpointswhentranslating Bengali,Tamil,Uzbek,andHungarianonthetestdatasetscompare 第 40 卷第 4 期 2017 年 4 月 计算机学报 CHINESEJOURNALOFCOMPUTERS Vol.40No.4 Apr.2017 稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究李强王强肖桐朱靖波 ( 东北大学自然语言处理实验室沈阳 10819) 摘要该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究. 文中将基于中间语言的机器翻译方法分为系统级

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

03 语文教学与研究 3623 现代汉语 4823 语言学概论与古代汉语 汉语言文字学 01 文献语言研究 02 语言文字规范研究 03 语言文字对比研究 3627 现代汉语与语言学概论 4827 古代汉语 中国古代文学 4 01 古代文学分体研究 02 古代文学传播和接

03 语文教学与研究 3623 现代汉语 4823 语言学概论与古代汉语 汉语言文字学 01 文献语言研究 02 语言文字规范研究 03 语言文字对比研究 3627 现代汉语与语言学概论 4827 古代汉语 中国古代文学 4 01 古代文学分体研究 02 古代文学传播和接 四川外国语大学 2018 年招收攻读硕士学位研究生入学考试专业目录 院系 专业代码 名称 及研究方向 拟招生数考试科目备注 001 研究生院 ( 网址 :http://graduate.sisu.edu.cn/ 联系人 : 张老师 023-65385296) 050201 英语语言文学 01 英语语言理论与应用 02 英语文学 03 英语国家社会文化研究 04 英语教学理论与应用 050211 外国语言学及应用语言学

More information

<4D F736F F D20D3EFC1CFBFE2D1D0BEBFD3EBD3A6D3C32E68746D>

<4D F736F F D20D3EFC1CFBFE2D1D0BEBFD3EBD3A6D3C32E68746D> 语料库研究与应用综述 目录一概述二中国语料库建设的基本情况三语料库的加工 管理和规范四语料库在语言研究中的的应用五参考文献 语料库研究与应用综述 (1998-2003) 傅爱平 一概述 语料库通常指为语言研究收集的 用电子形式保存的语言材料, 由自然出现的书面语或口语的样本汇集而成, 用来代表特定的语言或语言变体 经过科学选材和标注 具有适当规模的语料库能够反映和记录语言的实际使用情况 人们通过语料库观察和把握语言事实,

More information

考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 )

考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 ) 考生编号 科目代码 科目名称 成绩 复核结果 110659850003734 211 翻译硕士英语 66 无误 110659850004303 211 翻译硕士英语 65 无误 110659850007372 211 翻译硕士英语 58 无误 110659850009803 245 日语 ( 外 ) 65 无误 110659850005177 308 护理综合 170 无误 110659850006267

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 深度学习与机器翻译 统计机器翻译中的 深度学习 张家俊中国科学院自动化研究所 www.nlpr.ia.ac.cn/cip/jjzhang.htm jjzhang@nlpr.ia.ac.cn 2 机器翻译 今天烟台天气不错 The weather is fine in Yantai today 源语言句子段落篇章源语言句子 机器翻译 机器翻译 目标语言句子段落篇章目标语言句子 一个序列 模型? 另一个序列

More information

汉英对应语料库的句对检索*

汉英对应语料库的句对检索* * 汉英对应语料库翻译句对检索问题 王克非, 熊文新 ( 北京外国语大学中国外语教育研究中心, 北京 10089) 提要 : 英汉双语对应语料在经过对齐标注校对入库之后, 便转化为可管理的数据库系统 为使这一宝贵的语言资源能够更好地服务于翻译教学与翻译教学, 我们制作了一个前端用户访问后台数据库的服务接口, 通过较好的人机交互界面, 提供一个对双语语言事实进行更多复合条件查询的检索系统 本文简要介绍这一系统的设计开发思想及其应用

More information

走进图书馆

走进图书馆 刘伟光 Lwg_my@126.com 少数民族语言文字背景 -- 基本 ( 特殊 ) 情况 53 个民族有本民族语言, 使用人口 6000 多万 少数民族语言文字基本情况 22 个民族, 使用 29 种文字, 使用人口 3000 多万 蒙 / 藏 / 维 / 哈 / 鲜 / 等 33 个跨境民族, 基本可以互通语言 蒙 / 藏 / 维 / 哈 / 柯 / 鲜 / 彝 / 傣等在政府公文 / 教学中使用

More information

Microsoft Word - 101-1性平月手冊.doc

Microsoft Word - 101-1性平月手冊.doc 慈 明 高 中 一 百 零 一 學 年 度 第 一 學 期 性 別 平 等 教 育 宣 導 月 實 施 計 畫 一 依 據 : 教 育 部 推 動 性 別 平 等 教 育 實 施 計 畫 辦 理 二 目 標 1. 透 過 宣 導 互 動 與 分 享, 提 昇 學 生 正 確 認 識 性 別 平 等 與 兩 性 關 係 的 重 要 性, 並 試 圖 探 索 刻 板 印 象 造 成 性 別 不 平 等

More information

公共事业管理 理 政治学与行政学 文 国际政治 理 法学 ( 涉外法律人才培养模式实验班 ) 文 法学 ( 涉外法律人才培养模式实验班 ) 理 社会工作 文 德语 理 英语 文 628 6

公共事业管理 理 政治学与行政学 文 国际政治 理 法学 ( 涉外法律人才培养模式实验班 ) 文 法学 ( 涉外法律人才培养模式实验班 ) 理 社会工作 文 德语 理 英语 文 628 6 安徽 社会学 理 606 606 哲学 文 610 610 网络与新媒体 理 607 607 社会学 文 610 610 公共事业管理 理 606 606 翻译 文 611 611 经济学 理 611 611 网络与新媒体 文 611 611 国际商务 理 609 606 工商管理 文 612 612 行政管理 理 609 609 国际商务 文 611 611 信息管理与信息系统 ( 法治信息管理方向

More information

Microsoft Word - Overview_CL_ doc

Microsoft Word - Overview_CL_ doc 计算语言学与中文信息处理研究近年来的发展综述 (2004 2008) 詹卫东北京大学中文系北京大学计算语言学教育部重点实验室 1 引言 一般来说, 年鉴的内容中不少属于 记账式 的, 即把近些年本领域出版的有影响的文献, 发生过的重要事件等分类罗列 这种方式对于比较传统的 相对成熟的学科, 不失为一种稳妥的做法 但对于新兴的交叉边缘学科, 以这种方式完成的年鉴可能有一定的局限 因为多数读者往往是从自己所在的学科背景出发来了解交叉学科中的研究状况,

More information

¹ º» ¹ ¹ ¹ ª ¹ ¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ º»

¹ º» ¹ ¹ ¹ ª ¹ ¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ º» 周建新 范宏贵 文章论述并分析了老挝民族识别与划分的理论和实践 通过对中老两国不同的民族识别和划分标准进行对比 认为中老跨国民族或族群若按中国的划分标准为 个 若按老挝的标准为 个 根据作者的识别和划分 文章进一步论述了中老跨国民族的历史和现实族群关系 最后 作者还就中老跨国民族及其族群关系的相关理论和实践问题进行了论述 关键词 中国 老挝 跨国民族 族群关系作者周建新 年生 兰州大学历史系博士生

More information

小牛翻译开放平台 2.0 版 今日正式发布 相比于 1.0 版, 此次升级采用全新的页面风格, 产品分类更加清晰, 在语种支持 翻译品质 解码效率 翻译功能和服务模式上都进行了较大改变, 目的是为机器翻译应用软硬件开发者提供更全面的机器翻译服务能力 ( 注 : 新版本不影响老客户的使用 ) 本次升级

小牛翻译开放平台 2.0 版 今日正式发布 相比于 1.0 版, 此次升级采用全新的页面风格, 产品分类更加清晰, 在语种支持 翻译品质 解码效率 翻译功能和服务模式上都进行了较大改变, 目的是为机器翻译应用软硬件开发者提供更全面的机器翻译服务能力 ( 注 : 新版本不影响老客户的使用 ) 本次升级 小牛翻译开放平台 2.0 版 - 使用教程 ( 中文版 ) 李洋 2018.9.13 讯飞雅译 ( 北京 ) 科技有限公司 小牛翻译开放平台 2.0 版 今日正式发布 相比于 1.0 版, 此次升级采用全新的页面风格, 产品分类更加清晰, 在语种支持 翻译品质 解码效率 翻译功能和服务模式上都进行了较大改变, 目的是为机器翻译应用软硬件开发者提供更全面的机器翻译服务能力 ( 注 : 新版本不影响老客户的使用

More information

2005年度863机器翻译评测研究方法与实施*

2005年度863机器翻译评测研究方法与实施* * 2005 年度 863 机器翻译评测方法研究与实施,3,4 侯宏旭 刘群 2 张玉洁 2 井佐原均 中国科学院计算技术研究所, 北京,00080, 2 日本情报通信研究机构, 日本京都,84-8795, 3 内蒙古大学, 内蒙古自治区,0002 4 中国科学院研究生院, 北京,00080 hxhou@ict.ac.cn 摘要 :2005 年度 863 计划机器翻译评测于 2005 年 9 月举行

More information

将民族文化认同置于一个多民族交往和对话 互相激荡影响的场域中予以考察 包括对少数民 族网络的官方话语 少数民族知识分子话语 商业诉求 个人表达四类话语形态的分析 在民族文化认知 情感表达等方面 网络都为少数民族文化认同提供了场域 在网络的场域下 少数民族文化认同 地域认同 国家意识形态相互浸润 形成了多层次的民族和国家认同 文化认同 少数民族 电子网络媒介 陈静静 云南大学新闻系讲师 庄晓东 哲学博士

More information

山 东 大 学 博 士 学 位 论 文 晚 清 四 大 谴 责 小 说 词 汇 研 究 姓 名 : 张 威 申 请 学 位 级 别 : 博 士 专 业 : 汉 语 言 文 字 学 指 导 教 师 : 杨 端 志 20080415 山东大学博士学位论文

More information

» ¼ ½ ¾ À Á» ¼ ½ ¾ À Á ½ À À À À À À À

» ¼ ½ ¾ À Á» ¼ ½ ¾ À Á ½ À À À À À À À 徐国栋 最早的宪法用语是基于希腊人的经验确立的 它代表了一种 主体际关系 的宪法观 往后的宪法用语一直循着希腊思想的线索演变 西塞罗把拉丁化 同时把相应的宪法观念客观化为对公共事务的处理规则 西塞罗还基于当时的修辞学和医学的成就打造了 和 两个表示宪法的词汇 并把它们的配词设定为可以互换 托马斯 阿奎那用 诠释了亚里士多德的宪法观念 把 主体际关系 的含义缩减为阶级关系的含义 进入民族国家时代后 产生了基本法

More information

唐后期五代宋初敦煌寺院财产管理研究

唐后期五代宋初敦煌寺院财产管理研究 南京师范大学博士学位论文唐后期五代宋初敦煌寺院财产管理研究姓名 : 明成满申请学位级别 : 博士专业 : 专门史指导教师 : 刘进宝 20080509 唐后期五代宋初敦煌寺院财产管理研究

More information

省市 科目类别 本一线 初次出档线 最高分 最低分 平均分 录取人数 四川 文史 理工 天津 文史 理工

省市 科目类别 本一线 初次出档线 最高分 最低分 平均分 录取人数 四川 文史 理工 天津 文史 理工 厦门大学 2016 年本科招生分省录取情况统计表请点击各省份名称查阅各专业录取情况 注 : 青海省实行非平行志愿填报, 按照原始成绩统计 省市 科目类别 本一线 初次出档线 最高分 最低分 平均分 录取人数 安徽 文史 521 610 621 610 613.62 21 理工 518 636 655 636 640.01 83 北京 文史 583 596 658 596 636.27 15 理工 548

More information

第一章 引言(绪论)

第一章 引言(绪论) 分类号 : 单位代码 : 10033 密级 : 学号 :63110050102008 博士学位论文 汉维平行语料库构建研究 Study on the Construction of Chinese-Uyghur Parallel Corpus 申请人姓名 : 指导教师 : 专业名称 : 研究方向 : 所在学院 : 塞麦提 麦麦提敏侯敏教授语言学及应用语言学计算语言学文学院 论文提交日期 2009 年

More information

Microsoft Word - Toshiba_cips25.doc

Microsoft Word - Toshiba_cips25.doc 多策略的机器翻译 王海峰 东芝 ( 中国 ) 研究开发中心北京 100738 wanghaifeng@rdc.toshiba.com.cn 摘要 : 统计机器翻译方法由于其良好的数学模型 无指导的学习能力 良好的鲁棒性等优点而备受重视 基于规则的机器翻译方法对语言规律良好的概括和描述能力以及基于实例的机器翻译方法对相似句子相当精确的翻译也颇有价值 多种方法相融合的机器翻译策略正在成为机器翻译发展的重要方向

More information

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55 厦门大学 2008 年本科招生录取分数一览表 省份 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 北京 本一批 515 534 610 548 573.3 22 502 525 649 508 593.1 54 广东 本一批 570 603 639 603 617.3 24 564 590 642 596 613 65 本一批 528 577 610 577

More information

試 前 一 天, 也 沒 有 人 會 唸 的 完 所 以, 該 放 鬆 的 時 候 就 要 放 鬆, 該 唸 書 的 時 候 就 要 唸 書, 千 萬 不 要 讓 自 己 與 外 界 隔 離 太 久, 應 該 適 度 讓 自 己 走 到 戶 外, 身 心 靈 才 能 解 放, 考 試 的 壓 力 才

試 前 一 天, 也 沒 有 人 會 唸 的 完 所 以, 該 放 鬆 的 時 候 就 要 放 鬆, 該 唸 書 的 時 候 就 要 唸 書, 千 萬 不 要 讓 自 己 與 外 界 隔 離 太 久, 應 該 適 度 讓 自 己 走 到 戶 外, 身 心 靈 才 能 解 放, 考 試 的 壓 力 才 991126 就 業 輔 導 組 報 導 今 (99) 年 首 次 頒 發 在 校 生 考 取 國 家 考 試 獎 學 金, 共 有 教 政 所 張 硯 凱 等 6 位 研 究 所 學 生 及 衛 教 系 莊 鈞 涵 同 學 的 高 普 考 雙 項 獎 學 金, 以 下 為 教 政 所 張 凱 沈 婷 林 鈞 汪 琪 同 學 考 取 心 得, 與 大 家 分 享, 期 同 學 能 提 早 規 劃 高

More information

省份 科类 录取人数 最高分 最低分 平均分 本一线 投档线 理 ( 国防生 ) 辽宁 不分文理 文 内蒙古 理

省份 科类 录取人数 最高分 最低分 平均分 本一线 投档线 理 ( 国防生 ) 辽宁 不分文理 文 内蒙古 理 厦门大学 2005 年各省普高招生录取分数统计表 省份 科类 录取人数 最高分 最低分 平均分 本一线 投档线 文 32 620 581 594.9 543 580 安徽 理 67 638 577 598.7 541 574 理 ( 国防生 ) 20 609 548 568.7 541 548 北京 文 23 586 501 542.3 486 489 理 47 625 513 548.6 470

More information

編 輯 大 意 一 本 指 引 係 配 合 中 學 華 文 課 本 編 寫 而 成, 提 供 教 師 教 學 參 考 之 用 二 本 書 編 寫 重 點 如 下 : ( 一 ) 作 者 : 詳 細 介 紹 作 者 生 平 及 成 就 ( 二 ) 題 解 : 介 紹 課 文 主 旨 及 相 關 背 景

編 輯 大 意 一 本 指 引 係 配 合 中 學 華 文 課 本 編 寫 而 成, 提 供 教 師 教 學 參 考 之 用 二 本 書 編 寫 重 點 如 下 : ( 一 ) 作 者 : 詳 細 介 紹 作 者 生 平 及 成 就 ( 二 ) 題 解 : 介 紹 課 文 主 旨 及 相 關 背 景 編 輯 大 意 一 本 指 引 係 配 合 中 學 華 文 課 本 編 寫 而 成, 提 供 教 師 教 學 參 考 之 用 二 本 書 編 寫 重 點 如 下 : ( 一 ) 作 者 : 詳 細 介 紹 作 者 生 平 及 成 就 ( 二 ) 題 解 : 介 紹 課 文 主 旨 及 相 關 背 景 ( 三 ) 補 注 : 對 某 些 詞 彙 做 較 仔 細 的 說 明, 供 教 師 講 解 時 之

More information

おおさか経済の動き pwd

おおさか経済の動き pwd http://www.pref.osaka.jp/aid/sangyou/index.html 100 90 80 70 1 2 3 4 5 6 7 8 9 101112 1 2 3 4 5 6 7 8 9 101112 1 2 3 4 5 6 7 8 9 101112 H22 H23 H24-5 -10-15 5 0 10 1 2 3 4 5 6 7 8 9 101112 1 2 3 4 5 6

More information

04 文艺批评与文化产业 4822 西方文论 2 外国文学 语言学及应用语言学 01 对外汉语教学与研究 02 中文信息处理 03 语文教学与研究 3623 现代汉语 4823 语言学概论与古代汉语 语言综合同力加试 : 1 文学综合 2 写作 汉语言文字学 01 文献语

04 文艺批评与文化产业 4822 西方文论 2 外国文学 语言学及应用语言学 01 对外汉语教学与研究 02 中文信息处理 03 语文教学与研究 3623 现代汉语 4823 语言学概论与古代汉语 语言综合同力加试 : 1 文学综合 2 写作 汉语言文字学 01 文献语 四川外国语大学 2019 年招收攻读硕士学位研究生入学考试专业目录 院系 专业代码 名称 及研究方向 拟招生数考试科目备注 001 研究生院 ( 网址 :http://graduate.sisu.edu.cn/ 联系人 : 张老师 023-65385296) 050201 英语语言文学 01 英语语言理论与应用 02 英语文学 03 英语国家社会文化研究 04 英语教学理论与应用 050211 外国语言学及应用语言学

More information

工业和信息化部 水利部 全国节约用水办公室

工业和信息化部 水利部 全国节约用水办公室 附 件 : 国 家 节 水 标 杆 企 业 和 标 杆 指 标 ( 第 一 批 ) 序 号 企 业 名 称 产 品 名 称 1 太 原 钢 铁 ( 集 团 ) 有 限 公 司 不 锈 钢 标 杆 指 标 ( 单 位 产 品 取 水 量 ) 1.45 m 3 /t ( 再 生 水 用 量 占 总 用 水 量 的 50%) 2 莱 芜 钢 铁 集 团 有 限 公 司 H 型 钢 齿 轮 钢 3.43m

More information

厦门大学博士学位论文东南亚华侨民族主义发展研究 (1912-1928) 姓名 : 张坚申请学位级别 : 博士专业 : 专门史指导教师 : 李国樑 20020101 东南亚华侨民族主义发展研究

More information

7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽

7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽 - 11-%& 计算机工程与科学 7)23$$3 ; 1$ 第 卷第 % 期 年 % 月 /-%,/ 文章编号 %&%% 一种结合 和 的维吾尔文文本聚类算法 吐尔地 托合提 艾海麦提江 阿布来提 米也塞 艾尼玩 艾斯卡尔 艾木都拉 新疆大学信息科学与工程学院 新疆乌鲁木齐 摘 要 介绍了 和 聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响 在较大规模文本语料库基础上 分别用 和

More information

大连外国语大学是辽宁省省属外国语高等院校,拥有学士、硕士学位授予权

大连外国语大学是辽宁省省属外国语高等院校,拥有学士、硕士学位授予权 大连外国语大学 2019 年硕士研究生招生专业目录 ( 学术学位招生专业目录 ) 院系所代码 院系所名称 专业代码 专业名称 研究方向 050201 英语语言文学 01 英语语言学 02 英语文学研究 03 英语区域国别与跨文化研究 04 翻译学 初试科目 复试科目 拟招生数 1 英语专业基 2282 日语或 283 俄语或 284 德语或 285 础 统考 37 4861 英语翻译与写作 1 英语专业基

More information