王莎等 : 基于多特征融合的统计机器翻译译文错误检测 泛应用 [4 7] 之后, 一些研究人员开始尝试利用其他知识源作为特征, 并与 WPP 置信特征相结合来进行错误检测, 如深层次句法或深层次语义特征等 [8 9] 然而, 由于多数外部特征的复杂性 与具体语言相关等原因, 有效的并且通用的特征并不

Size: px
Start display at page:

Download "王莎等 : 基于多特征融合的统计机器翻译译文错误检测 泛应用 [4 7] 之后, 一些研究人员开始尝试利用其他知识源作为特征, 并与 WPP 置信特征相结合来进行错误检测, 如深层次句法或深层次语义特征等 [8 9] 然而, 由于多数外部特征的复杂性 与具体语言相关等原因, 有效的并且通用的特征并不"

Transcription

1 32 西安理工大学学报 JournalofXi anuniversityoftechnology(2013)vol.29no.1 文章编号 : (2013) 基于多特征融合的统计机器翻译译文错误检测 王莎, 杜金华, 刘丁 ( 西安理工大学自动化与信息工程学院, 陕西西安 ) 摘要 : 抽取了 3 种典型的单词后验概率特征 ( 基于固定位置的词后验概率 基于目标位置窗的词后验概率 基于词对齐的词后验概率 ) 和 3 种语言学特征 ( 词 词性 句法分析器抽取的句法特征 ), 并在此基础上抽取了一个来自源端的单词特征, 然后基于中英 NIST 数据集, 采用最大熵分类器来验证不同单词后验概率特征 (WPP) 独立使用及与其它特征组合后使用时对错误检测性能的影响 实验结果表明, 采用不同方法计算得到的单词后验概率特征对分类错误率的影响是显著的, 并且在单词后验概率和语言学特征组合基础上加入源端单词特征, 可以显著降低分类错误率 (CER), 提高译文错误检测能力 关键词 : 最大熵分类器 ; 单词后验概率 ; 语言学特征 ; 源端单词特征 ; 错误检测中图分类号 :TP391 文献标志码 :A ErrorDetectioninTranslationVersionbyStatisticalMachineTranslationBased onfeatureintegration WANGSha,DUJinhua,LIUDing (FacultyofAutomationandInformationEngineering,Xi anuniversityoftechnology,xi an710048,china) Abstract:Threekindsoftypicalwordposteriorprobability(WPP)features(basedonthefixedposition, slidingwindow WPPandalignment basedwpp)andthreekindsoflinguisticfeatures(word,posand LGparsingknowledge)areextractedtodetecterors,onthebasisofwhichasource sidewordfeatureis extracted,andthenbasedonnistdatasetingthemaximumentropyclasifierisadoptedtotestthedif ferentwordposteriorprobabilityfeaturesaswelastheefectupontheindependentuseanderordetection performancesofotherfeatureintegrationinuse.theexperimentalresultsshowthatthewppfeaturesob tainedusingthediferentcalculationmethodshavetheobviousefectsupontheclasificationerorrate andalsothatthesource sidewordfeatureincorporatedonthebasisofintegrationofthewppandlinguis ticfeaturescansignificantlyreducethecervaluesandimprovethedetectionperformancesintranslation versionerors. Keywords:maximumentropyclasifier;wordposteriorprobability;linguisticfeatures;source sideword feature;erordetection 近年来, 基于统计机器翻译方法的发展, 涌现出了多种不同类型的统计机器翻译 (SMT) 系统, 如基于短语 层次短语及句法的机器翻译模型等, 并且翻译性能得到了显著提高 [1 3] 本领域内一些研究人员对于如何将 SMT 系统应用到实际中做了大量工作 然而, 目前来看, 统计机器翻译译文质量仍然无法满足工业化的实际需要 因此, 为了提高机器翻 译译文质量, 自动对译文进行错误判断 分类和分析在 SMT 技术发展和应用中有着重要作用 目前, 译文错误检测方法多依据如单词后验概率 (wordposteriorprobability,wpp) 的系统特征进行译文置信度估计, 一些研究人员已经提出了多种根据 N best 或词图等计算 WPP 的方法, 并且这些方法在机器翻译译文错误检测和置信度估计中得到了广 收稿日期 : 基金项目 : 国家自然科学基金资助项目 ( ); 陕西省教育厅专项科研计划基金资助项目 (11JK1029) 作者简介 : 王莎, 女, 硕士生, 研究方向为模式识别与智能系统 E mail:hebenwangsha@126.com 杜金华, 男, 副教授, 研究方向为模式识别与智能系统 E mail:jhdu@xaut.edu.cn

2 王莎等 : 基于多特征融合的统计机器翻译译文错误检测 泛应用 [4 7] 之后, 一些研究人员开始尝试利用其他知识源作为特征, 并与 WPP 置信特征相结合来进行错误检测, 如深层次句法或深层次语义特征等 [8 9] 然而, 由于多数外部特征的复杂性 与具体语言相关等原因, 有效的并且通用的特征并不容易被抽取 因此, 目前来看, 单词后验概率特征 词以及词性等词汇化特征仍然是人们依据的主要特征 本文主要采用最大熵分类器结合不同方法计算得到的 WPP 特征及三种 WPP 特征与其他特征的组合结果, 研究其对译文错误检测能力的影响, 主要有以下三点 :1 验证三种不同方法得到的 WPP 特征对译文错误检测性能的有效性 ;2 分别将三种不同方法得到的 WPP 特征与其他三个语言学特征结合, 验证语言学特征对具体语言翻译错误检测任务的预测能力 ;3 在以上特征组合的基础上分别加入抽取的源端单词特征, 验证源端单词特征对分类错误率的影响 1 置信度特征 1.1 词后验概率特征 词后验概率是统计机器翻译译文错误检测中常用的置信度特征, 目标单词的置信度可以用其后验概率即 WPP 来表示 [5 7] 用 S 表示一个 SMT 系统, 给定源语言输入句子 f J 1 和对应的 N best 列表输出 e n,i n n,1, 其中 n=1,, N;e n 代表 N best 列表中第 n 个翻译假设, 每个翻译假设的翻译概率记为 p(f 1,e J n,i n n,1), 错误检测所用的 WPP 即 1 best 列表中每个目标词的后验概率 p(e i 1/f J 1) 下面将详细介绍三种典型的用来计算 WPP 的方法 基于固定位置的词后验概率给定源语言输入 f1, J 位于最优翻译假设 e I 1 中位置 i 的目标单词 e 的后验概率即是对 N best 列表中其他翻译假设在对应的固定位置 i 出现单词 e 的概率求和, 如公式 (1) 所示 : p i (e/f J 1)= e N δ(e n,i,e) p(f 1,e J n,i n n,1) n=1 N δ(e n,i,e ) p(f 1,e J n,i n n,1) n=1 (1) 基于目标位置窗的词后验概率在 N best 列表中, 翻译假设的句长是在某一范围内动态变化的, 使得由于不同的翻译假设因句长不同等因素的影响, 导致在同一位置 i 上的目标词 e i 有可能是不同的, 即对应不同的源语言词, 因此, 难以保证单词 e 出现的位置 i 是固定不变的, 但有可 能出现在位置 i 附近, 即上下文中 因此, 若将初始的固定位置 i 变为一个动态值, 使其能在初始值的某一范围内滑动, 当目标单词出现在限定范围内时, 其参与后验概率计算 这就是在固定位置基础上改进的基于位置窗的方法思想 记位置窗为 i±t,t 为窗口大小, 为自然数 如果单词在位置窗范围内出现, 同样认为单词出现在当前翻译假设 因此, 单词的后验概率可以由此窗范围内的位置上单词出现的后验概率之和来决定, 计算公式如 (2) 式所示 : p i,t (e/f 1)= i+t J p k (e/f 1) J (2) k=i-t 基于词对齐的词后验概率另一种直接且有效的计算方法是利用 N best 列表中生成的最优目标译文 e I 1 与 N best 列表中其他句子的词对齐信息得到词后验概率 本文实验利用的是基于 Levenshtein 的对齐, 根据此对齐信息, 最优译文中每个单词 e 的后验概率 p(e/f 1,e J 1) I 可以通过对 Levenshtein 对齐结果中位置 i 上包含 e 的所有翻译假设的概率之和得到 此方法由 Uefing 等人最早提出, 并通过实验验证了其有效性 [5,7] 用 L(e 1,e I n,i n n,1) 表示最优译文 e I 1 和 N best 列表中其他翻译假设 e n,i n n,1 之间的 Levenshtein 对齐关系, 则对于位置 i 的单词 e, 其具有 Levenshtein 对齐关系的句子后验概率可由下式给出 : 其中 : p lev (e/f 1,e J 1)= p lev(e,f 1,e J 1) I I p lev (e,f 1,e J 1) (3) I p lev (e/f J 1,e I 1)= e N δ(e,l i (e 1,e I n,i n n,1)) p(f 1,e J n,i n n,1) n=1 式中 p(f 1,e J n,i n n,1) 表示 N best 列表中给出的翻译假设的后验概率 δ(x,y) 代表克罗奈克函数, 即 : 1.2 语言学特征 { δ(x,y)= 1 x=y 0 其他 33 近年来, 本领域的一些研究人员开始尝试利用外部知识源作为特征, 如深层次句法或深层次语义特征等 1.1 节中的单词后验概率特征是基于系统的特征, 无法提供足够的语法或句法知识, 因此, 考虑抽取如句法 语义等语言学特征来提高检测准确率 本文主要用到了两类常用的语言学特征 : 词汇化特征和句法特征 下面对这两类特征做一个详细的描述

3 34 西安理工大学学报 (2013) 第 29 卷第 1 期 词汇化特征对于翻译假设中的大多数单词, 通常认为出现频率高的单词序列和出现频率较高的词性标注序列为正确的概率要大于出现频率较少的单词序列和词性标注序列 这里, 考虑单词及词性标注的上下文信息, 对于每个单词和词性标注, 取其前 2 个和后 2 个及其本身构成特征向量, 具体形式表示如下 单词特征 : Word:(w -2,w -1,w,w 1,w 2 ) 词性标注特征 : Pos:(pos -2,pos -1,pos,pos 1,pos 2 ) 语法特征句法知识一般是通过句法分析器对源语言或目标语言进行句法分析后得到的 当分析器无法对整个句子进行分析时, 则忽略问题单词以找到剩余单词的联系从而完成句法分析 被忽略的单词就成为与句子中其他单词没有连接的单词, 称为 nul link 单词 一般认为, 这些与其他单词没有联系的单词存在语法错误的可能性更大, 利用此语法信息来定义二值句法特征, 如下式所示 : link(e)= yes e 与其他词存在连接关系 { no 其他 1.3 源端单词特征 统计机器翻译译文错误检测大部分研究中所用的置信度特征均是关于目标端的特征, 如 WPP 特征 语言学特征和其他常用的句法语义特征等 在此基础上本文以源端为对象, 抽取源端特征 从 MT 解码过程中可以跟踪生成译文中目标短语所对应的源语言短语, 并且利用简单的对齐模型能够很快找到对应短语间源语言单词和目标语言单词之间的对齐关系, 即提取源端单词特征 [11] 这些特征用来得到给定错误标注中源语言单词和目标单词出现的相似度 可以认为 : 如果源语言单词和目标单词同时出现在同一类别的概率很大, 那么可以认为生成的目标单词在将来翻译结果中很可能属于此标注类别 实验中所用的源端单词特征模板如图 1 所示, 第一行为源语言中文序列, 第二行是利用统计机器翻译系统得到对应的英文输出结果 源端单词特征的定义如公式 (4) 所示 : f (1 3) (nearly)= 1 ifsource-word= 近 { 0 otherwise } (4) 式中,f (1 3) 中的 1 和 3 分别表示目标单词在翻译假设中的位置和对应的源语言单词在源语言句子中的位置 图 1 源端单词特征 Fig.1 Sourcewordfeature 如果源语言单词对应到目标端语言的是一个短语, 如图 1 中源语言中文词语 丧生 对应的目标端句子中的成分为短语 havebeenkiled, 则需要返回到短语模型训练过程中生成的短语表中, 从表中的对齐信息找到中文单词与英文短语中每个单词的一一对应关系, 最终得到源端单词对齐信息 2 分类器 机器翻译中的译文错误检测问题通常是作为一个二值分类问题来进行研究, 如监督机器学习问题 自然语言处理领域中最常用的分类器包括最大熵分类器 [10 13] SVM 分类器等 实验中选择最大熵分类器作为其译文错误检测分类工具, 结合抽取的多个不同特征分析比较不同特征组合的分类性能 最大熵分类器是朴素贝叶斯分类器的一个泛化模型, 其本质思想是不考虑任何未知因素, 对所有已知因素建立一个连续的模型, 使用最大熵方法建模的一个主要优点是不同的特征可以被方便地添加到模型中 将二值分类器样例用 (x 1,y 1 ),,(x n,y n ) 表示, 其中 x i 表示特征样例, 本实验中 y i {c,i} 给定了单词的特征向量后, 采用最大熵模型预测单词正确与错误的公式如式 (5) 所示 exp( (λ i f i (x,y))) i p(y/x) = (5) (exp( λ i f i (x,y))) y i 式中,f i 代表二值模型特征函数, 其值由单词分类类别 y(c,i) 和特征向量 x 来决定 λ i 代表对应 f i 的权重 利用最大熵模型作为译文错误检测的分类器, 需要将特征向量转换为分类器所能接受的文本格式 具体格式如下所示 : line1:labelindex1:value1index2:value2 line2:cwpp -2 :1 pos -2 :1 word -2 :1 link -2 :1 source -2 :1 line3:cwpp -2 :0 pos -2 _JJ word -2 _white link -2 :1 white 白宫

4 王莎等 : 基于多特征融合的统计机器翻译译文错误检测 在此特征向量公式中,line1 表示最大熵分类器的标准数据模板, 包括标注结果 ( 分类类别 ) 特征和特征值 line2 用来说明对应于 line1 的特征及其特征值的具体文本数据格式,line3 则是将特征用具体指代内容代替后的数据格式, 为最大熵模型训练时所使用的模板 其中,line1 中的 label 对应于 line2 和 line3 中的第一行, 即单词分类结果 {c,i} 中的值,line1 中的 index 为抽取的特征, 对应 line2 和 line3 中的特征, 而 value 则表示每个特征对应的函数值, 对应 line2 中特征之后的 1, 因为在 line2 中只将特征值为 1 的特征罗列了出来, 故在 line3 中对应 value 的函数值均为 1 根据最大熵模型的特性训练文本和测试文本特征值省略不写 3 实验和设计分析 3.1 中文 英文统计机器翻译系统 本文实验中的统计机器翻译系统选用基于短语的机器翻译系统 :Moses 系统 利用此系统在测试集解码过程中, 为每个源语言句子输出 个最好翻译假设, 即 N =10000 翻译语言对的方向为中文到英文的翻译 翻译模型训练语料为 LDC 提供的数据集, 共计 句对 ( 主要包括香港新闻 FBIS ISI 汉英网络数据 新华新闻等 ) 语言模型采用五元模型, 其训练语料包括以上双语语料的英文部分和英文 Gigaword 的新华部分, 共计约 1000 万句 机器翻译系统的开发集为 NIST 机器翻译评测任务 2006 年 curent 集, 共计 1664 句, 每个源语言输入对应 4 个参考答案 测试集为 NIST2005cur rent 数据集 1082 句和 NIST2008curent 数据 1357 句, 每句对应有 4 个参考答案 3.2 译文错误检测任务 [14] 数据标注 : 本文利用 TER 工具包中的 WER 准则来确定翻译假设中每个单词的真实分类结果 首先找到四个参考译文中与翻译假设编辑距离最小的参考译文作为基准, 利用 WER 准则将假设译文与基准参考译文做词对齐, 如果翻译假设中的单词与参考译文中相同位置上的单词一致则标记为 c, 反之标记为 i SMT 系统生成的 NISTMT2008 翻译结果中, 1 best 翻译假设包含 个单词, 其中标为 c 的为 个, 标为 i 的 个, 其样本为 正确 的类别比例 (RCW) 为 37.99% NISTMT2005 翻译结果的 1 best 翻译假设包含 个单词, 其中标为 c 的 个, 标为 i 的 个, 其样本为 正 确 的类别比例 (RCW) 为 41.59% 开发集和测试集 : 在译文错误检测任务中使用 NISTMT2008 数据集 (1357 句 ) 作为最大熵模型参数训练的开发集, 将 NISTMT2005(1082 句 ) 数据集作为分类任务的测试集 3.3 评价准则 译文错误检测任务评价准则有 : 分类错误率 (CER) 准确率 (P) 召回率 (R) 和 F 准则 分类类别为错的单词个数 CER = (6) 单词总个数准确率定义为分类器将真实类别为 i 的单词准确分类的个数 n m 与分类器标记为 i 的单词总数 n t 之比 : P = n m n t (7) 召回率定义为分类器将真实为类别 i 的单词准确分类的个数 n m 与真实类别为 i 的单词总数 n g 之比 : R = n m n g (8) F 准则定义为准确率和召回率的权衡, 即 : F = 2 P R P+R (9) CER 基线水平 : 由于作为测试集的 MT 05 数据中 RCW=41.59%, 低于 50%, 即标为 incorect 的单词多于标为 corect 单词, 所以将 corect 的单词全部标为 incorect 时所得到的评价准则得分, 也就是 RCW 作为分类错误率的基线水平 3.4 译文错误检测实验 基于独立特征的分类实验利用最大熵分类器分别对三种典型的 WPP 特征和三个语言学特征及抽取的源端单词特征进行独立特征分类实验并分析比较其结果 分类实验结果如表 1 所示 表 1 独立特征的错误检测结果 Tab.1 ResultsofindividualfeatureforTranslation ErorDetection 特征 CER/% P/% R/% F/% 基线 WPP_Dir WPP_Win WPP_Lev Wd Pos Link Source

5 36 西安理工大学学报 (2013) 第 29 卷第 1 期 表中,WPP_Dir 表示基于固定位置的 WPP, WPP_Lev 表示基于 Levenshtein 对齐的 WPP, WPP_Win 表示基于目标位置窗的 WPP 单词特征用 Wd 表示, 源端单词特征用 Source 表示 其中基线系统的 CER 为 41.59% 从表中的数据可以得到以下几点结论 1) 三种典型的 WPP 特征独立使用时都能在一定程度上降低 CER 值, 且基于目标位置窗的计算方法因其灵活性得到了较其他两种方法更低的 CER 结果 基于 Levenshtein 对齐的 WPP 就 F 值而言性能最好 2) 语言学特征性能要比独立的 WPP 特征好 (Link 除外 ) 单词特征可以帮助系统更准确地找到错误所在 语法特征 Link 召回率最高, 预示着此特征可以帮助系统找到更多错误 表中的数据同时也揭示了语言学特征对于错误检测的贡献, 表明了语言学特征可以有效降低分类错误率, 提高错误预测能力 3) 就 CER 而言, 源端单词特征降低了 4.59% 证明了源端单词特征的有效性, 可以考虑提取更丰富的源端信息作为特征加入到分类器中来提高错误检测分类性能 基于组合特征的分类实验关于组合特征的分类实验做了两组 首先是分别将三种典型的 WPP 特征和抽取的三个语言学特征 ( 词 词性 由 LG 句法分析器抽取的句法特征 ) 进行组合, 利用最大熵分类器进行错误分类实验 表 2 第一组组合特征错误检测结果 Tab.2 Resultsofthefirstcombinedfeaturesfor TranslationErorDetection 特征 CER/% P/% R/% F/% 基线 WPP_Dir+Wd+Pos+Link WPP_Win+Wd+Pos+Link WPP_Lev+Wd+Pos+Link 从表 2 可看出, 就 CER 而言, 与基线系统相比, 三种组合特征的 CER 分别降低了 13.61% 14.52% 和 14.35%( 相对值 ), 而且 F 值也得到了显著提高 三组实验中, 特征组合 WPP_Win+Wd+Pos+ Link 的分类错误率最低, 而组合 WPP_Dir+Wd+ Pos+Link 的 F 值最高 同时也揭示了语言学特征对于错误检测的贡献 在以上组合特征实验的基础上加入源端单词特征, 同样利用最大熵分类器进行分类实验, 分析比较 组合特征的预测能力 错误分类实验结果如表 3 所示 表 3 第二组组合特征错误检测结果 Tab.3 Resultsofthesecondcombinedfeaturesfor TranslationErorDetection 特征 CER/% P/% R/% F/% 基线 WPP_Dir+Wd+Pos+Link +Source WPP_Win+Wd+Pos+Link +Source WPP_Lev+Wd+Pos+Link +Source 从表 3 和表 2 可以得出如下结论 1) 组合特征的分类能力要比单独的特征分类能力强, 且语言学特征和源端单词特征都能在一定程度上提高统计机器翻译译文错误检测能力 2) 对于加入源端单词特征的组合特征实验, 就 CER 而言, 加入源端单词特征后的组合特征,CER 分别降低了 14.55% 15.56% 16.01%( 相对值 ) 同时, 在加入源端单词特征后, 其 F 值也有一定程度的降低 3) 表 3 所用的三种不同方法计算得到的 WPP 中, 基于词对齐的 WPP 与其他四个特征的组合得到了最好的结果, 说明了位置信息与丰富的词对齐信息对错误检测分类的重要性 4 结论和展望 本文基于中英 NIST 数据集, 利用最大熵分类器对三种典型的 WPP 特征 语言学特征 源端单词特征及三种不同的 WPP 特征与其他几个特征的特征组合进行了译文错误分类实验 实验结果表明了语言学特征和源端单词特征对译文错误检测能力的有效性 同时, 可以看出基于词对齐的 WPP 与语言学特征 源端单词特征的组合得到的分类性能最好, 说明了位置信息的重要性 接下来的工作将从以下几个方向做进一步的研究 : 考虑实际情况中单词同义不同形的情况 考虑引进 复述 等技术对本文中仅仅使用 WER 准则进行 c 与 i 的标注方法做出改进 ; 提取更丰富的源端信息特征, 如利用源端 POS 标注结果代替源端单词特征, 以解决数据稀疏的问题, 提高分类器的分类性能

6 王莎等 : 基于多特征融合的统计机器翻译译文错误检测参考文献 : [1]KenjiYamada,KevinKnight.A syntax basedstatistical translationmodel:proceedingsofacl EACL 01,2001 [C].Toulouse,France,2001. [2]PhilippKoehn,FranzJosefOch,DanielMarcu.Statistical phrase based translation: ProceedingsofHLT NAACL, 2003[C].Edmonton,Canada,2003. [3]DavidChiang.Ahierarchicalphrase basedmodelforstatis ticalmachinetranslation:proceedingsofacl 05,2005 [C].AnnArbor,MI,2005. [4]SimonaGandrabur,GeorgeFoster.Confidenceestimation fortextprediction:proceedingsofconll,2003[c].ed monton,canada,2003. [5]NicolaUefing,KlausMacherey,HermannNey.Confi dencemeasuresforstatisticalmachinetranslation:pro ceedingsofmtsummitix,2003[c].nouvele Orleans, USA,2003. [6]BlatzJohn,ErinFitzgerald,GeorgeFoster,etal.Confi denceestimationformachinetranslation:proceedingsof COLING,2004[C].Geneva,Switzerland,2004. [7]NicolaUefing,HermannNey.Word Levelconfidenceesti mationformachinetranslation[j].computationallinguis tics,2007,33(1),9 40. [8]LuciaSpecia,NicolaCancedda,MarcDymetman,etal. Estimatingthesentence levelqualityofmachinetranslation systems:the13thannualconferenceoftheeuropeanas 37 sociationformachinetranslation(eamt 2009)[C]. Barcelona,Spain,2009. [9]LuciaSpecia,CraigSaunders,MarcoTurchi,etal.Impro vingtheconfidenceofmachinetranslationqualityesti mates:proceedingsofthe12thmachinetranslationsum mit,2009[c].otawa,canada,2009. [10]XiongDeyi,ZhangMin,LiHaizhou.Erordetectionfor statisticalmachine translation using linguistic features: Proceedingsofthe48thACL,2010[C].Uppsala,Swe den,2010. [11]NguyenBach,FeiHuang,YaserAI Onaizan.Goodnes: AMethodforMeasuringMachineTranslationConfidence: ProceedingsofACL, 2011[C], Portland, Oregon, USA,2011. [12]RatnaparkhiA.A maximum entropyforpart of speech tagging:proceedingsoftheempiricalmethodsinnatural languageprocesingconference(emmlp),1996[c]. Philadelphia,1996. [13]ZhangLe.MaximumentropymodelingtooklkitforPython andc++[eb/ol].htp://homepages.inf.ed.ac.uk/ s /maxenttoolkit.htm, [14]MathewSnover,BonnieDor,RichardSchwartz,etal. Astudyoftranslationeditratewithtargetedhumanannota tion:proceedingsoftheamta 06,2006[C].Boston, MA,USA,2006. ( 责任编辑王卫勋 ) 櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗 简讯西安理工大学两项科技成果获国家科技奖 2013 年 1 月 18 日上午,2012 年度国家科学技术奖励大会在北京隆重举行, 我校有两项科技成果获国家科技奖励 : 由自动化与信息工程学院刘丁教授主持完成的 大尺寸电子级硅单晶炉关键技术及其应用 获得国家技术发明奖二等奖 ; 水利水电学院张建丰教授参与完成的 都市型现代农业高效用水原理与集成技术研究 获得国家科学技术进步奖二等奖 ( 摘自理工大新闻网 ) 櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗

博士论文答辩报告.ppt

博士论文答辩报告.ppt 博士论文答辩报告 树到串统计翻译模型研究 答辩人 : 刘洋 指导教师 : 林守勋研究员 时间 :2007 年 6 月 16 日 提纲 引言 词语对齐的对数线性模型 树到串统计翻译模型 模型 1 模型 2 模型 3 实验 总结 MT Strategies (1954-2004) Knowledge Acquisition Strategy All manual Electronic dictionaries

More information

基于SVM的机器翻译自动评价方法的研究

基于SVM的机器翻译自动评价方法的研究 机器翻译自动评价十年 杨沐昀 赵铁军 朱俊国哈尔滨工业大学计算机科学与技术学院 机器智能与翻译研究室 2012 年 9 月, 西安 前言 自动评价已成为机器翻译中的关键因素 自动评价为导向的 MT 建模 研究中采用多种自动评价指标验证成果 评测中使用多种自动评价指标考量性能 每年不断出现新的角度构建自动评价策略 某些情况下自动评价仍无法正确区分翻译质量 系统融合案例 提纲 机器翻译自动评价研究概况

More information

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位 自然科学版 文章编号 视网膜图像中视盘的快速自动定位方法 赵晓芳 林土胜 李碧 摘 要 基于眼底视网膜血管的分布结构及视盘本身的特点 提出一种快速自动定位视盘的方法 首先根据视网膜血管的网络分布结构大致定位视盘的垂直坐标 然后根据视盘 的亮度信息及视盘与血管的关系来定位视盘的水平坐标 最后把视盘限定在以粗定位的视盘为中心的一个小窗口内 用 变换精确定位视盘中心 该方法不需要事先分割视网膜血管 也不需要对算法进行训练

More information

第 卷 第 期 年 月 半 导 体 学 报! " # $%&'%' $!&' #% #$1 /#1 $'! / ?/ ?/ / 3 0,?/ ) * +!!! '!,!! -. & ' $! '! 4% %&1)/1(7%&)03 (% )

第 卷 第 期 年 月 半 导 体 学 报!  # $%&'%' $!&' #% #$1 /#1 $'! / ?/ ?/ / 3 0,?/ ) * +!!! '!,!! -. & ' $! '! 4% %&1)/1(7%&)03 (% ) 第 卷 第 期 年 月!"# $%&'%' $!&'#%#$1/#1 $'! /18103 2?/03101?/18103 /3 0,?/0301.13 )*+!!! '!,!! -.&' $!'! 4%%&1)/1(7%&)03(%)%&,%*(1&0)%$-0*,%30)17*1*)0(+1(1+&1*+*),)1; &113(%44(10&.0701&0-&00*/)%;()1%-1+%&0)0*1*)%

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 多策略的机器翻译 王海峰 2006 年 11 月 21 日 提纲 概述 东芝的机器翻译研究 概况 规则方法 实例方法 统计方法 其它 多种方法的融合 讨论与展望 Page 2 三种主流机器翻译方法 对语言规律良好的概括和描述能力 规则方法 机器翻译产品仍以规则系统为主 仍有不断提高的潜力 (Zhu. 2005) 实例方法 统计方法 对相似句子相当精确的翻译能力 依然活跃 (MT Journal, MT

More information

标题

标题 第 35 卷第 期西南大学学报 ( 自然科学版 ) 3 年 月 Vol.35 No. JouralofSouthwestUiversity (NaturalScieceEditio) Feb. 3 文章编号 :673 9868(3) 69 4 一类积分型 Meyer-KiḡZeler-Bzier 算子的点态逼近 赵晓娣, 孙渭滨 宁夏大学数学计算机学院, 银川 75 摘要 : 应用一阶 DitziaṉTotik

More information

98

98 / / 河北师范大学学报 // / /... 人本与物本 翻译 与 语义谱系分析比较 牛云平, 杨秀敏 (., ;., ) : 翻译 与 的语义谱系有着根本不同之处 : 前者的本义是语官及其解释活动, 具有明显的人文特征 ; 后者的本义则是物体搬移行为, 具有明显的物化特征 两词的语义谱系不同, 决定了各自理论发展形态有别, 证明了中西翻译学自然而然地有着不同的研究重心和研究取向 因此, 中国学人强求与西人苟同乃是不智之举,

More information

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用 第 卷 第 期 年 月 交通运输工程学报 曹 源 唐 涛 徐田华 穆建成 为了确保列车运行控制系统设计和开发的正确性 比较了仿真 测试和形式化 种能够验证 系统设计正确性的方式 根据列车运行控制系统对安全的苛求性 提出了 个与系统安全相关的重要特性 即实时性 混成性 分布 并发 性 反应性 并分析了与这些特性相关的具体形式化方法 通 过对每种形式化方法的数学基础和应用范围的分析和归类 给出了各种方法的优势和不足

More information

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析 电子科学技术电子科学技术第 02 卷第 03 期 Electronic 2015 年 Science 5 月 & Technology Electronic Science & Technology Vol.02 No.03 May.2015 年 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 刘高军, 李丹, 程利伟, 钱程, 段然 ( 北方工业大学计算机学院, 北京,100144)

More information

內政部中區老人之家九十四年六月份基本資料

內政部中區老人之家九十四年六月份基本資料 內 政 部 區 老 人 之 家 101 年 5 月 份 機 構 及 收 容 動 態 月 報 表 壹 機 構 基 本 資 料 一 本 家 101 年 社 會 福 利 基 金 預 算 數 :168,207,000 元, 本 月 份 執 行 率 : 81.15 % 二 員 工 人 數 : 種 類 預 算 員 額 合 理 員 額 現 有 人 數 職 員 26 26 25 人 駐 警 4 0 4 人 技 工

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 NiuTrans 开源统计机器翻译系统技术分析 李强, 孙坤杰, 刘卓, 肖桐, 朱靖波 ( 东北大学自然语言处理实验室, 辽宁沈阳 110819) 摘要 : 本文主要介绍了最新版 NiuTrans 开源统计机器翻译系统的技术特点 在最新版的 NiuTrans 中, 包含当前主流的统计机器翻译模型, 即 : 基于短语的翻译模型, 基于层次短语的翻译模型, 基于句法 ( 树到串 / 串到树 / 树到树

More information

北京大学学报 ( 自然科学版 ) 图 1 使用短语对完成解码过程 ( 虚线框中是未生成的短语 对 ) Fig. 1 Decoding with using phrase pairs (phrase pair in dashed rectangle is not generated) 进行拼装, 完成

北京大学学报 ( 自然科学版 ) 图 1 使用短语对完成解码过程 ( 虚线框中是未生成的短语 对 ) Fig. 1 Decoding with using phrase pairs (phrase pair in dashed rectangle is not generated) 进行拼装, 完成 http://www.cnki.net/kcms/detail/11.2442.n.20150929.1436.010.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2016.007 李强 1, 李沐 2 张冬冬 2 朱靖波 1 1. 东北大学自然语言处理实验室,

More information

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!"# " < ABC DE c AB ^ " M F GE PQ M ""# = 摘要! "#$ %&' (!)*+,!-*.# /.01 # $ 89 :; /.012 # ' $ <= ABCD E /.01 F

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!#  < ABC DE c AB ^  M F GE PQ M # = 摘要! #$ %&' (!)*+,!-*.# /.01 # $ 89 :; /.012 # ' $ <= ABCD E /.01 F 南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 " < ABC DE c AB ^ " M F GE PQ M ""# = 摘要! "#$ %&' (!)*+,!-*.# /.01 # 234 567$ 89 :; /.012 # ' $ ?@ ABCD E /.01 F >GH >? I'J K ABCD > LMNO > > 0PQ RI'7 > S. KTUVW XY EN

More information

7 北京大学学报 医学版 # +94* 4 ' % 论著!! "# $ #% %"&!%'!! $ "( )& * $ +,-.)/ ) 01 " * ). " 2")3 )01 ( /" 433% /1 " 0 "51 " -.)/$ 6',)") 4.))%) 0

7 北京大学学报 医学版 # +94* 4 ' % 论著!! # $ #% %&!%'!! $ ( )& * $ +,-.)/ ) 01  * ).  2)3 )01 ( / 433% /1  0 51  -.)/$ 6',)) 4.))%) 0 论著!! "# $ #% %"&!%'!! $ "( )& * $ +,-.)/ ) 01 " * ). " 2")3 )01 ( /" 433% /1 " 0 "51 " -.)/$ 6',)") 4.))%) 0 ".. " - 23 )"." ( ).)") 4. " ' $ 7 " #$%"$8 &' + +." 0"3 / 3 3( 0 ) %.% "(% 2). +.) ")( ) (

More information

Microsoft Word - Moses操作手册--冯洋.doc

Microsoft Word - Moses操作手册--冯洋.doc Moses 操作手册 冯洋 2016-12-15 Moses 是用于机器翻译的工具, 其他所有的从源端序列生成目标端序列的问题也可以看成是机器翻译问题, 比如问题改写, 从而使用 Moses 进行建模 下面笔者着重介绍两个模型 : 短语模型和层次短语模型 短语模型主要是通过查找与源端匹配的短语, 进而将短语进行拼 接从而生成目标译文 比如, 对于一个等价的问题对 什么是成人高考 成人高考介绍 短语模型会抽取以下短语

More information

基于“松弛尺度”的短语翻译对抽取方法

基于“松弛尺度”的短语翻译对抽取方法 中科院自动化所 CWMT2009 评测技术报告 张家俊, 李茂西, 周玉, 陈钰枫, 宗成庆中国科学院自动化研究所模式识别国家重点实验室北京 100190 E-mail: {jjzhang, mxli, yzhou, chenfy, cqzong}@nlpr.ia.ac.cn 摘要 : 本文主要介绍了中科院自动化所参加 CWMT2009 研讨会的技术报告, 我们一共参加了四个项目的评测任务, 包括汉英新闻单一系统评测任务

More information

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20 Three papers in NLP fields: Chinese word segmentation (ACL2012), dependency parsing (EMNLP 2012) and SMT (ACL2012) Reporter:Fandong Meng 2012/12/26 Three papers Ø Fast Online Training with Frequency-Adaptive

More information

任春平 邹志利 在坡度为 的平面斜坡上进行了单向不规则波的沿岸流不稳定运动实验 观测到了沿 岸流的周期性波动 波动周期约为 利用最大熵方法和三角函数回归法求得这种波动的主 频率以及幅值 分析了波动幅值在垂直岸线方向的变化 结果表明该变化与沿岸流变化类似 即在 沿岸流最大值附近这种波动强度最大 为了分析波动的机理 利用线性沿岸流不稳定模型对模型实验结果进行了分析 求得了不稳定运动增长模式和波动周期 并与对应实测结果进行了比较

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky, Kevin Knight, Chris Callison-Burch,

说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky, Kevin Knight, Chris Callison-Burch, MINDS Workshops Machine Translation Working Group Final Report 报告人 : 刘群 2011-8-20 于 CNCCL2011 说明 本报告是对 MINDS Workshops Machine Translation Working Group Final Report 一文的讲解 ( 原文作者是 Alon Lavie, David Yarowsky,

More information

胡 鑫 陈兴蜀 王海舟 刘 磊 利用基于协议分析和逆向工程的主动测量方法对 点播系统进行了研究 通过对 点播协议进行分析 获悉该协议的通信格式和语义信息 总结出了 点播系统的工作原理 在此基础上设计并实现了基于分布式网络爬虫的 点播系统主动测量平台 并对该平台获取的用户数据进行统计分析 获得了 点播系统部分用户行为特征 研究结果对 点播系统的监控及优化提供了研究方法 点播 协议分析 爬虫 主动测量

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 基于最长名词短语分治策略的神经机器翻译 张学强, 蔡东风, 叶娜, 吴闯 ( 沈阳航空航天大学人机智能研究中心, 辽宁沈阳 110136) 摘要 : 神经机器翻译自兴起以来, 不断给机器翻译领域带来振奋人心的消息 但神经机器翻译没有显式地 利用语言学知识对句子结构进行分析, 因此对结构复杂的长句翻译效果不佳 本文基于分治法的思想, 识 别并抽取句子中的最长名词短语, 保留特殊标识或核心词与其余部分组成句子框架

More information

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!"#$%&' ()*+,-./* :; 1 < #D.E? FGAH!" BI7JK LM.NO F

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!#$%&' ()*+,-./* :; 1 < #D.E? FGAH! BI7JK LM.NO F 南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!"#$%&' ()*+,-./*+01. 23456789:;1 < =>?

More information

中北大学常规事项财务报销操作指南

中北大学常规事项财务报销操作指南 中 北 大 学 常 规 事 项 财 务 报 销 操 作 指 南 一 办 公 费 报 销 指 南 定 义 : 办 公 费 是 单 位 购 买 按 财 务 会 计 制 度 规 定 不 符 合 固 定 资 产 标 准 的 日 常 办 公 用 品 书 报 杂 志 等 支 出 通 俗 讲 是 指 办 公 场 所 使 用 的 低 值 易 耗 品 办 公 用 品 的 类 别 : 纸 薄 类 笔 尺 类 装 订 类

More information

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!!' C!! 摘 要!"#$ %& '" ()*+#,-./01,!/0 ", "789:, ; <=>?$& BC "/D?E, D F"GH,IJ KLD"MN& +,O, D, PQRST

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!!' C!! 摘 要!#$ %& ' ()*+#,-./01,!/0 , 789:, ; <=>?$& BC /D?E, D FGH,IJ KLDMN& +,O, D, PQRST 南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!!' C!! J2KL@! 摘 要!"#$ %& '" ()*+#,-./01,!/0", 23456.1 "789:, ;?$& +@,A BC"/D?E,DF"GH,IJ KLD"MN& +,O, D, PQRST UVWXYK, CKZD["\ ]^_ " `abvwc ", 4 M",P " Y_ 关键词 2 中图分类号 文献标识码

More information

1971 7 6 1993 3 8 1993 2 17 1992 2 5 1991 2 3 1 2 1972 2 217 1972 1 270 1987 113 1988 296 1989 132 1990 12 30 1990 8 2 1992 2 7 1986 3 1 1960 28 1960 31 1945 1950 1987 17 1972 1 1 1972 1 39 1972 2 301

More information

PowerPoint Presentation

PowerPoint Presentation CWMT 机器翻译评测 回顾与展望 吕雅娟 中国科学院计算技术研究所 自然语言处理研究组 2012-09-16 第八届全国机器翻译研讨会 (CWMT 2012) 西安 主要内容 CWMT 机器翻译评测回顾 2013 年机器翻译评测设想与规划 2013 年机器翻译评测讨论 2012-09-16 第八届全国机器翻译研讨会 (CWMT 2012) 西安 2 全国机器翻译研讨会 统计机器翻译研讨会 (SSMT,2005

More information

字没有, 存在词对齐缺失问题 如 : 小鸟 在纳西语中没有形容词对齐词, 只有 鸟 ( ) 字在纳西文中有对齐的词, 这样在解码过程中就找不到完全对齐模板 通用的短语或句法翻译模型在处理这些语言现象时, 由于仅考虑汉纳双语词语对齐关系, 而对于目标语言多义词的翻译选择及未对齐词处理方面效果并不理想,

字没有, 存在词对齐缺失问题 如 : 小鸟 在纳西语中没有形容词对齐词, 只有 鸟 ( ) 字在纳西文中有对齐的词, 这样在解码过程中就找不到完全对齐模板 通用的短语或句法翻译模型在处理这些语言现象时, 由于仅考虑汉纳双语词语对齐关系, 而对于目标语言多义词的翻译选择及未对齐词处理方面效果并不理想, 1 基于词义归纳模型的汉 - 纳统计机器翻译 周珂, 余正涛 *, 高盛祥, 程立, 毛存礼 ( 昆明理工大学信息工程与自动化学院, 昆明 650500) 摘要 : 为了解决汉纳机器翻译中一词多义及词对齐缺失的问题, 提出了基于词义归纳翻译模型的汉 - 纳的统计机器翻译方法 该方法首先对汉语 - 纳西语词对齐语料进行统计分析, 选取词及前后 3 个词上下文作为聚类文本, 通过 LDA 的方法对词进行聚类分析,

More information

,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - ); (. ),, (, : ),,,,,,,,,, (

,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - ); (. ),, (, : ),,,,,,,,,, ( * 华东地区 县乡镇政府机构改革的个案研究 王 波 :,.,,.,... - ',. - 1,,,,,,,,,,,,,, :, ;,, ;,,, *, 1 ,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - );

More information

从 他的老师当得好 谈起 黄正德 哈佛大学语言学系 波士顿 黄正德 美国麻省理工学院语言学博士 美国哈佛大学语言学系教授 先后执教于美国夏威夷大学 台湾清华大学 台湾师范大学 美国康乃尔大学 美国加州大学 在法国 日本 西班牙 澳大利亚等国家担任客座教授 学术研究专治语 法理论 着重于句法学 句法语义接口 语言参数理论以及汉语语法研究方面 出版学术专书与期刊论文数十部

More information

by 1 2 3 4 5 6 7 x 1,,x n n n X Y Z t T t T Y Y (X) X Z Z (X) X f (Y ) f : Y R g(z) g : Z R Y Ŷ Z Ẑ d( ) δ M N 1 1.1 X X Y Y Z Z t t T Y f : Y R Y Z g : Z R Z X X Ŷ = arg max f (Y ) Y (X) (X) X

More information

エスポラージュ株式会社 住所 : 東京都江東区大島 東急ドエルアルス大島 HP: ******************* * 关于 Java 测试试题 ******

エスポラージュ株式会社 住所 : 東京都江東区大島 東急ドエルアルス大島 HP:  ******************* * 关于 Java 测试试题 ****** ******************* * 关于 Java 测试试题 ******************* 問 1 运行下面的程序, 选出一个正确的运行结果 public class Sample { public static void main(string[] args) { int[] test = { 1, 2, 3, 4, 5 ; for(int i = 1 ; i System.out.print(test[i]);

More information

山东建筑大学学分制管理规定(试行)

山东建筑大学学分制管理规定(试行) 山 建 大 校 字 2015 67 号 山 东 建 筑 大 学 关 于 印 发 学 分 制 管 理 规 定 ( 试 行 ) 的 通 知 各 院 部 校 直 各 部 门 : 山 东 建 筑 大 学 学 分 制 管 理 规 定 ( 试 行 ) 已 经 学 校 研 究 同 意, 现 印 发 给 你 们, 请 认 真 遵 照 执 行 山 东 建 筑 大 学 2015 年 8 月 7 日 1 山 东 建 筑

More information

[Smadja et al.,1996;melamed,2000], 其中典型的对齐软件就是 GIZA++ [Och,2000;Och et al.,2003] GIZA++ 实现了 IBM 公司提出的 5 个模型 [Brown et al.,1993] 和隐马尔科夫模型 (HMM)[Och et

[Smadja et al.,1996;melamed,2000], 其中典型的对齐软件就是 GIZA++ [Och,2000;Och et al.,2003] GIZA++ 实现了 IBM 公司提出的 5 个模型 [Brown et al.,1993] 和隐马尔科夫模型 (HMM)[Och et 面向短语的词语对齐方法 田亮黄辉 周沁 澳门大学自然语言处理与中葡机器翻译实验室澳门 E-mail:{ma96572, derekfw, lidiasc}@umac.mo 摘要 : 自动词语对齐技术在统计机器翻译领域中起了很大的作用 然而,GIZA++ 训练得出的对齐结果并不是很令人满意 本文提出了一种基于最大匹配法 (MMM) 和 GIZA++ 的词语对齐方法 首先, 我们使用了最大匹配法分别把平行的英文和中文句子划分成单词和短语,

More information

吉林大学学报 工学版 244 第 4 卷 复杂 鉴于本文篇幅所限 具体公式可详见参考文 献 7 每帧的动力学方程建立及其解算方法如图 3 所示 图4 滚转角速度与输入量 η 随时间的变化波形 Fig 4 Waveform of roll rate and input η with time changing 图5 Fig 5 滚转角随时间的变化波形 Waveform of roll angle with

More information

PowerPoint Presentation

PowerPoint Presentation 基于 Amazon Comprehend 的文本 分析开发实践 奚文俊,AWS 技术客户经理 Wenjun Xi, Technical Account Manager, Amazon Web Services 2018 年 5 月 15 日 May 15, 2018 自然语言处理的趋势 自然语言处理的研究方向 语法语义 分析 对话系统 信息抽取 问答系统 自然语言处 理 文本挖掘 信息检索 机器翻译

More information

Chinese-English Spoken Language Machine Translation in Limited Domain

Chinese-English Spoken Language Machine Translation in Limited Domain 对语音翻译现状的认知以及展望 徐波 中科院自动化所 报告提纲 口语翻译发展概况 紫冬 口译系统基本情况 口语统计翻译存在的问题 口语翻译改进的途径以及展望 讨论 语音翻译 --- 巨大的挑战 Good text translation was hard enough to pull off, Speech-to-speech MT was beyond going to the Moon --- It

More information

单击此处输入中文题吊(上超过20个汉字)

单击此处输入中文题吊(上超过20个汉字) 英汉人名音译方法研究 邹波, 赵军 ( 中国科学院自动化研究所模式识别国家重点实验室, 北京 100080) 摘要 : 本文详细比较了两种机器学习方法和两种统计翻译模型在英汉人名音译上的应用效果 本文首先提出了将英汉人名翻译问题看作序列标注问题的处理思路, 并且将两种机器学习方法 : 最大熵模型和条件随机场模型应用于人名翻译 在使用机器学习算法进行音译时, 本文比较了不同特征集对人名音译的影响, 实验表明字母串特征和标注之间转移特征对提高音译性能有很大帮助

More information

,, (, ),,,, (, ),,, :, :,, :,, ( ),,, ( ) ( &, ), :(),, ( ),, (, ;., ), ()( ),,, ( ) ( ) ()(, ),,,,, ;,, ;, ( ),,,,,,, ( -, ), ( &, ),, ( ),,,

,, (, ),,,, (, ),,, :, :,, :,, ( ),,, ( ) ( &, ), :(),, ( ),, (, ;., ), ()( ),,, ( ) ( ) ()(, ),,,,, ;,, ;, ( ),,,,,,, ( -, ), ( &, ),, ( ),,, * 李 煜 :. -. -.,,, -,,. :( ) -, -. -.( ) -.,, -,., (, ),, ( )( ),,,,,,,,,, ;,,,, ;,,, *,, ,, (, ),,,, (, ),,, :, :,, :,, ( ),,, ( ) ( &, ), :(),, ( ),, (, ;., ), ()( ),,, ( ) ( ) ()(, ),,,,, ;,, ;, ( ),,,,,,,

More information

<4D6963726F736F667420576F7264202D20D1A7C9FACAD6B2E1B8C4D7EED6D5A3A8B4F8B1EDB8F1BCD3D2B3C2EBB0E6A3A9372E3239>

<4D6963726F736F667420576F7264202D20D1A7C9FACAD6B2E1B8C4D7EED6D5A3A8B4F8B1EDB8F1BCD3D2B3C2EBB0E6A3A9372E3239> 北 京 科 技 大 学 学 生 手 册 ( 本 科 生 ) 学 生 工 作 部 ( 处 ) 二 〇 一 五 年 七 月 北 京 科 技 大 学 学 生 手 册 ( 本 科 生 ) 编 委 会 主 编 于 成 文 盛 佳 伟 编 委 ( 按 姓 氏 笔 画 排 序 ) 丁 煦 生 尹 兆 华 龙 洋 史 立 伟 曲 涛 刘 晓 东 杜 振 民 杨 雄 何 进 宋 波 张 卫 冬 张 卫 钢 张 文

More information

桂林市劳动和社会保障局关于

桂林市劳动和社会保障局关于 桂 林 市 人 力 资 源 和 社 会 保 障 局 文 件 市 人 社 发 2012 60 号 桂 林 市 人 力 资 源 和 社 会 保 障 局 关 于 2012 年 秘 书 等 十 八 个 职 业 国 家 职 业 资 格 全 国 全 区 统 一 考 试 有 关 问 题 的 通 知 各 有 关 单 位 : 根 据 自 治 区 人 力 资 源 和 社 会 保 障 厅 关 于 做 好 2012 年 国

More information

Microsoft Word 年度选拔硕博连读研究生的通知.doc

Microsoft Word 年度选拔硕博连读研究生的通知.doc 南 工 (2015) 研 字 第 3 号 关 于 选 拔 2015 年 度 硕 博 连 读 研 究 生 的 通 知 各 有 关 学 院 : 为 适 应 我 国 构 建 社 会 主 义 和 谐 社 会 和 建 设 创 新 型 国 家 的 战 略 需 要, 加 快 拔 尖 创 新 人 才 的 培 养, 我 校 决 定 继 续 推 荐 和 选 拔 一 批 基 本 素 质 好 业 务 基 础 强 品 学 兼

More information

C++ 程序设计 告别 OJ2 - 参考答案 MASTER 2019 年 5 月 3 日 1

C++ 程序设计 告别 OJ2 - 参考答案 MASTER 2019 年 5 月 3 日 1 C++ 程序设计 告别 OJ2 - 参考答案 MASTER 2019 年 5 月 3 日 1 1 TEMPLATE 1 Template 描述 使用模板函数求最大值 使用如下 main 函数对程序进行测试 int main() { double a, b; cin >> a >> b; cout c >> d; cout

More information

!!

!! 徐二明 陈 茵 以企业资源基础理论为基础 从企业吸收能力这一概念入手 剖析企业吸收能力与企业竞争优势的关系 研究组织管理机制对企业吸收能力构建和发展的影响 依据吸收能力经典文献对吸收能力的前因进行重新梳理和归类 对现有文献中各种思路有一定的整理和明示作用 通过研究两种吸收能力的 类影响因素 辨识出中国企业在吸收能力培养和发展方面的优势和弱势 通过实证方法全面衡量和验证潜在吸收能力与实际吸收能力两者之间以及两能力与企业竞争优势的关系

More information

000

000 出 國 報 告 ( 出 國 類 別 : 其 他 ---- 兩 岸 青 年 交 流 ) 2013 年 臺 灣 大 學 院 校 青 年 赴 大 陸 民 族 院 校 參 訪 交 流 活 動 出 國 報 告 服 務 機 關 : 蒙 藏 委 員 會 姓 名 職 稱 : 娥 舟 文 茂 簡 任 秘 書 兼 副 處 長 韓 慈 穎 科 長 派 赴 國 家 : 中 國 大 陸 出 國 期 間 :102. 8. 25

More information

<4D F736F F D D BBFAC6F7B7ADD2EBC6C0B2E2B1A8B8E6A3A8D6D5B0E6A3A92E646F63>

<4D F736F F D D BBFAC6F7B7ADD2EBC6C0B2E2B1A8B8E6A3A8D6D5B0E6A3A92E646F63> 第七届全国机器翻译研讨会 (CWMT2011) 评测报告 赵红梅吕雅娟贲国生黄云刘群中国科学院计算技术研究所智能信息处理重点实验室自然语言处理研究组北京 100190 E-mail:{zhaohongmei, lvyajuan, benguosheng, huangyun, liuqun}@ict.ac.cn 1 概述 为了全面了解国内外机器翻译技术的现状, 促进机器翻译技术的研究, 按照惯例, 第七届

More information

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系 电子科学技术 Electronic Science & Technology 电子科学技术第 02 卷第 05 期 2015 年 9 月 Electronic Science & Technology Vol.02 No.05 Sep.2015 年 一种卫星遥测在线状态监测及分析系统的设计 董房 1,2, 刘洋 2, 王储 2 2, 刘赞 (1. 上海交通大学, 上海,200240; 2. 上海卫星工程研究所,

More information

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC>

<4D F736F F F696E74202D20BEE4D7D3B6D4C6EBCBE3B7A8BDE9C9DC> 句子对齐算法介绍 Weigang I IRab, HIT 2002-11-6 对齐的算法的简单描述 给定双语语料, 在所有可能的对齐中找出概率最大的对齐如用公式表示, 就有 arg max P A / S, T α 其中 A 是对齐文本,S 和 T 分别是英语和汉语文本 一个对齐的例子 英语文本 Most of us, however, take life for granted. We know

More information

东北大学硕士、博士学位论文排版打印格式

东北大学硕士、博士学位论文排版打印格式 分类号 密级 UDC 学位论文 短语统计机器翻译关键技术研究 作者姓名 : 李强 指导教师 : 朱靖波教授 东北大学信息科学与工程学院 申请学位级别 : 硕士 学科类别 : 工学 学科专业名称 : 计算机应用技术 论文提交日期 : 2013 年 6 月论文答辩日期 : 2013 年 6 月 学位授予日期 : 2013 年 7 月答辩委员会主席 : 申德荣 评阅人 : 张俐 战学刚 东北大学 2013

More information

成 都 诗 词 田 正 中 水 调 歌 头 感 丙 戌 金 秋 风 树 生 凉 意, 胸 次 觉 清 新 园 中 丹 桂 撑 月, 雏 菊 傲 霜 芬 情 系 南 飞 北 雁, 坐 爱 枫 林 醉 染, 秋 色 更 迷 人 歌 故 早 相 约, 览 胜 宝 宾 村 巨 龙 腾, 金 风 翥, 气 凌

成 都 诗 词 田 正 中 水 调 歌 头 感 丙 戌 金 秋 风 树 生 凉 意, 胸 次 觉 清 新 园 中 丹 桂 撑 月, 雏 菊 傲 霜 芬 情 系 南 飞 北 雁, 坐 爱 枫 林 醉 染, 秋 色 更 迷 人 歌 故 早 相 约, 览 胜 宝 宾 村 巨 龙 腾, 金 风 翥, 气 凌 九 峰 吟 草 一 一 一 一 一 一 一 一 一 ~- - - 一 一 -- ~ - ~ ~ ~ ~ ~.. ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~. ~ ~. ~ ~ ~ ~ - ~ ~ ~ ~ ~ ~ 一 r 气 户 孜 犷 杯 只 匀 风 向 方 镇 忆 漾 阳 七 律 壕 江 两 岸 好 风 光, 古 史 连 篇 四 面 藏 典 语 南 桥 添 锦 绣, 泠 东 半 塔 裕 民 康 西

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 深度学习与机器翻译 统计机器翻译中的 深度学习 张家俊中国科学院自动化研究所 www.nlpr.ia.ac.cn/cip/jjzhang.htm jjzhang@nlpr.ia.ac.cn 2 机器翻译 今天烟台天气不错 The weather is fine in Yantai today 源语言句子段落篇章源语言句子 机器翻译 机器翻译 目标语言句子段落篇章目标语言句子 一个序列 模型? 另一个序列

More information

Fig1 Theforceappliedtothetrainwhenrunning :w = w j +w q (3) :w = w = w 0 +w j (4) w i 121 基本阻力 w r = 600 R ( N/kN) (8) :R : [2] w s [3] w s =0

Fig1 Theforceappliedtothetrainwhenrunning :w = w j +w q (3) :w = w = w 0 +w j (4) w i 121 基本阻力 w r = 600 R ( N/kN) (8) :R : [2] w s [3] w s =0 31 4 2012 8 JournalofLanzhouJiaotongUniversity Vol31No4 Aug2012 :1001-4373(2012)04-0097-07 * 张友兵 张 波 ( 100073) : 分析了列车运行过程中的受力情况 给出了制动过程中减速度的计算方法 并采用正向 反向两种迭代方式计算列车制动曲线 两种方式计算出的制动曲线一致 证明了计算制动曲线的方法是正确的

More information

Microsoft Word - report 4.doc

Microsoft Word - report 4.doc , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA 1.1.1 1.1.2 1.1.3 , USA , USA , USA 1.1.4 , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA , USA

More information

Microsoft Word - construct_smts.doc

Microsoft Word - construct_smts.doc 利用现有软件构建统计机器翻译系统 刘洋 中国科学院计算技术研究所数字化技术研究室 yliu@ict.ac.cn 1 介绍 本文的主旨是介绍如何利用现有软件在很短的时间内构建一个统计机器翻译 (Statistical Machine Translation) 系统 重点将放在具体的操作上, 而不是相关的理论 2 准备工作 为了构建统计机器翻译系统, 必须准备一下资源 : [1] Linux 操作系统

More information

少数民族语言信息化推进民族地区农牧业发展研究

少数民族语言信息化推进民族地区农牧业发展研究 少数民族语言机器翻译资源与技术瓶颈 李淼 中国科学院合肥物质科学研究院智能机械研究所 2012-09-20 西安 报告提纲 一 少数民族语言机器翻译现状 二 资源瓶颈 三 技术瓶颈 四 实验室工作简介 五 总结 : 一些可借鉴的工作 一 少数民族语言机器翻译现状 研究主要集中于藏 蒙 维等少数几种语言 藏 1995 年, 陈玉忠 李延福等实现了汉藏科技机器翻译系统的原型系传统农业统 ; 2000 年,

More information

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,,

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, 吴亦明 : '. ',,, -,,, -,., -..., -. - -.,, ( ),,,,,,,,,,,,,,,, :,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, ,,,,,,,,,,,,,.

More information

Microsoft Word - ??山

Microsoft Word - ??山 没 药 山 要 宣 告 耶 和 华 的 名, 你 们 要 将 大 德 归 于 我 们 的 神! 你 当 追 想 上 古 之 日, 思 念 历 代 之 年 问 你 的 父 亲, 他 必 指 示 你 ; 问 你 的 长 者, 他 必 告 诉 你 ( 申 32 3 7) 凡 是 真 实 的, 可 敬 的, 公 义 的, 清 洁 的, 可 爱 的, 有 美 名 的 ; 若 有 什 么 德 行, 若 有 什

More information

Microsoft Word - 助理人員教育訓練-會計室.docx

Microsoft Word - 助理人員教育訓練-會計室.docx 壹 報 帳 流 程 區 分 為 以 下 三 種 流 程 : 請 購 單 流 程 請 款 單 流 程 借 款 核 銷 流 程 一 請 購 單 流 程 1 二 請 款 單 流 程 1 3 NO YES 10 20 2 3 三 借 款 核 銷 流 程 貳 憑 證 的 種 類 及 內 容 一 統 一 發 票 1. 三 聯 式 統 一 發 票 (1) 買 受 人 : 務 必 請 廠 商 填 上 輔 仁 大 學

More information

关于规范区委、区委办公室发文

关于规范区委、区委办公室发文 浦 东 情 况 通 报 第 13 期 中 共 浦 东 新 区 区 委 办 公 室 2015 年 6 月 8 日 沈 晓 明 同 志 在 全 区 党 员 领 导 干 部 三 严 三 实 专 题 教 育 党 课 上 的 讲 话 (2015 年 5 月 15 日 ) 前 不 久, 中 央 下 发 了 在 县 处 级 以 上 领 导 干 部 中 开 展 三 严 三 实 专 题 教 育 的 方 案, 刘 云

More information

目 录 第 一 部 分 档 案 局 概 况 一 主 要 职 责 二 部 门 决 算 单 位 构 成 第 二 部 分 档 案 局 2016 年 度 部 门 预 算 表 一 2016 年 度 市 级 部 门 收 支 预 算 总 表 二 2016 年 度 市 级 部 门 支 出 预 算 表 三 2016

目 录 第 一 部 分 档 案 局 概 况 一 主 要 职 责 二 部 门 决 算 单 位 构 成 第 二 部 分 档 案 局 2016 年 度 部 门 预 算 表 一 2016 年 度 市 级 部 门 收 支 预 算 总 表 二 2016 年 度 市 级 部 门 支 出 预 算 表 三 2016 档 案 局 2016 年 度 部 门 预 算 1 目 录 第 一 部 分 档 案 局 概 况 一 主 要 职 责 二 部 门 决 算 单 位 构 成 第 二 部 分 档 案 局 2016 年 度 部 门 预 算 表 一 2016 年 度 市 级 部 门 收 支 预 算 总 表 二 2016 年 度 市 级 部 门 支 出 预 算 表 三 2016 年 度 市 级 部 门 财 政 拨 款 支 出 预

More information

2015 年 度 收 入 支 出 决 算 总 表 单 位 名 称 : 北 京 市 朝 阳 区 卫 生 局 单 位 : 万 元 收 入 支 出 项 目 决 算 数 项 目 ( 按 功 能 分 类 ) 决 算 数 一 财 政 拨 款 168738.36 一 一 般 公 共 服 务 支 出 53.83 二

2015 年 度 收 入 支 出 决 算 总 表 单 位 名 称 : 北 京 市 朝 阳 区 卫 生 局 单 位 : 万 元 收 入 支 出 项 目 决 算 数 项 目 ( 按 功 能 分 类 ) 决 算 数 一 财 政 拨 款 168738.36 一 一 般 公 共 服 务 支 出 53.83 二 2015 年 度 部 门 决 算 报 表 ( 含 三 公 经 费 决 算 ) 2015 年 度 收 入 支 出 决 算 总 表 单 位 名 称 : 北 京 市 朝 阳 区 卫 生 局 单 位 : 万 元 收 入 支 出 项 目 决 算 数 项 目 ( 按 功 能 分 类 ) 决 算 数 一 财 政 拨 款 168738.36 一 一 般 公 共 服 务 支 出 53.83 二 上 级 补 助 收 入

More information

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w

34 2 夏静, 柴玉梅, 昝红英 : 基于统计和规则的常用词的兼类识别研究 w w-4 p-4 w-3 p-3 w-2 p-2 w-1 p w + 1 p + 1 w + 2 p + 2 w 2013 2 计算机工程与设计 Feb. 2013 34 2 COMPUTER ENGINEERING AND DESIGN Vol. 34 No. 2 夏 静, 柴玉梅, 昝红英 : ( 郑州大学信息工程学院, 河南郑州 450001) 词的兼类问题是汉语词性标注中的关键问题之一针对常用词的兼类识别进行研究, 综合考虑了影响兼类词识别 的不同特征, 分别使用条件随机场模型 最大熵模型和 k 最近邻等统计方法,

More information

壹:教育文化公益慈善機關或團體免納所得稅適用標準

壹:教育文化公益慈善機關或團體免納所得稅適用標準 教 育 文 化 公 益 慈 善 機 關 或 團 體 結 算 申 報 重 要 法 令 目 錄 壹 : 教 育 文 化 公 益 慈 善 機 關 或 團 體 免 納 所 得 稅 適 用 標 準 02 貳 : 教 育 文 化 公 益 慈 善 機 關 或 團 體 所 得 稅 結 算 申 報 須 知 05 參 : 教 育 文 化 公 益 慈 善 機 關 或 團 體 結 算 申 報 重 要 法 令 彙 整 10

More information

<4D F736F F D B0EAA5C1A470BEC7A4CEB0EAA5C1A4A4BEC7B8C9B1CFB1D0BEC7B9EAAC49A4E8AED7>

<4D F736F F D B0EAA5C1A470BEC7A4CEB0EAA5C1A4A4BEC7B8C9B1CFB1D0BEC7B9EAAC49A4E8AED7> 國 民 小 學 及 國 民 中 學 補 救 教 學 實 施 方 案 中 華 民 國 100 年 10 月 27 日 臺 國 ( 二 ) 字 第 1000193000 號 函 中 華 民 國 103 年 1 月 24 日 臺 教 國 署 國 字 第 1030004427 號 函 壹 方 案 緣 起 教 育 是 國 家 經 濟 社 會 發 展 的 重 要 投 資, 落 實 教 育 機 會 均 等 的 理

More information

第 期 黄雪莲等 响应面优化绿色木霉菌培养基 材料与方法 菌种 仪器与试剂 菌种的活化 单因素试验 响应面优化试验 优化工艺的验证 数据处理 结果与分析

第 期 黄雪莲等 响应面优化绿色木霉菌培养基 材料与方法 菌种 仪器与试剂 菌种的活化 单因素试验 响应面优化试验 优化工艺的验证 数据处理 结果与分析 第 卷第 期 年 月 食品与生物技术学报 响应面优化绿色木霉菌培养基 黄雪莲 于新 仲恺农业工程学院轻工食品学院 广东广州 利用响应面分析法对绿色木霉菌的培养基进行优化 通过测量不同营养条件下绿色木霉 菌落生长直径研究其生物学特性 在单因素实验的基础上 选定葡萄糖添加量 丙氨酸添加量和磷酸二氢钾添加量 个因素进行中心组合实验 建立二次回归方程 并应用响应面分析法进行优化 结果表明 绿色木霉菌最佳培养基为葡萄糖

More information

从美国 加拿大 英国 澳大利亚 韩国和日本图书馆学情报学学院的发展历程入手 介绍并分析国外图书馆学情报学研究生教育的改革与重组 教学目标与教学方法 专业设置与课程体系 师资队伍与学生情况 入学资格与毕业条件 进而对我国的图书馆学情报学研究生教育制度提出一些改进意见 图书馆学 情报学 研究生 教育 作者简介 葛敬民 男 年生 教授 硕士生导师 刘荣华 女 年生 硕士生 王林 男 年生 硕士生

More information

PowerPoint Presentation

PowerPoint Presentation 机器翻译原理与方法 第四讲基于规则和基于实例的机器翻译方法 刘群中国科学院计算技术研究所 liuqun@ict.ac.cn 中国科学院计算技术研究所 2011 年秋季课程 内容提要 基于规则的方法 基于实例的方法 2 例子 考虑设计一个中译英系统和一个英译中系统, 能够实现以下两个句子的互译 : 小王在联想工作了三年 Xiao Wang has worked in Lenovo for three

More information

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1 C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 月 3 日 1 1 INPUTOUTPUT 1 InputOutput 题目描述 用 cin 输入你的姓名 ( 没有空格 ) 和年龄 ( 整数 ), 并用 cout 输出 输入输出符合以下范例 输入 master 999 输出 I am master, 999 years old. 注意 "," 后面有一个空格,"." 结束,

More information

文章首先对 云计算 环境下数字图书馆的概念 特点 原理等进行概述 然后根据 云计算 环境下图书馆数字资源安全性要求 对影响数字图书馆安全的诸多因素进行深入探讨 最后研究了云计算环境下数字图书馆数据安全 应用安全以及虚拟化安全面临的威胁及对策 云计算数字图书馆信息安全对策 本文系甘肃省教育厅 年度科研项目 移动计算环境下的数字图书馆建设研究 批准号 的研究成果之一 马晓亭 女 年生 兰州商学院信息工程学院副教授

More information

探索与研究 discovery and research Abstract Machine translation towards patent domain has become one important application of machine translation in recent

探索与研究 discovery and research Abstract Machine translation towards patent domain has become one important application of machine translation in recent discovery and research 探索与研究 面向专利领域的汉英机器翻译融合系统 1. 北京师范大学中文信息处理研究所北京 100875;2. 北京奇虎科技有限公司北京 100015; 3. 中科鼎富 ( 北京 ) 科技发展有限公司北京 100107 1 李洪政 2 赵凯 1 胡韧奋 3 蒋宏飞 1 朱筠 3 晋耀红 摘要面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一 本文提出了一个汉英专利文本机器翻译融合系统,

More information

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,,

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,, 刘中荣王平周长城 矿区作为一类特殊的社区, 它的发展所追求的不仅是矿产资源和经济效益的提 高, 而且是一种涉及社会各个方面的整体性进步 这种进步应以经济发展为基础, 以矿区职工和居民素质的提高 生活的改善为核心的经济与非经济方面的均衡发展 作者在对大冶市铜绿山铜铁矿深入调查的基础上, 分析了矿区人口与就业 教育与文 化 工农关系与社会治安 矿区管理体制以及社会保障制度等方面的现状和问题 文 章指出,

More information

研究阶段的两种主流方法 由于当时这些方法相对粗糙, 无法实现令人信服的自动翻译应用, 因此, 在 1966 年美国国家科学院发布的 ALPAC 报告的影响下, 美国政府和军方对机器翻 译研究所投入的资助几乎都终止了, 机器翻译研究在世界范围内陷入了低谷 但是, 并不是所有的机器翻译研究人员都放弃了希

研究阶段的两种主流方法 由于当时这些方法相对粗糙, 无法实现令人信服的自动翻译应用, 因此, 在 1966 年美国国家科学院发布的 ALPAC 报告的影响下, 美国政府和军方对机器翻 译研究所投入的资助几乎都终止了, 机器翻译研究在世界范围内陷入了低谷 但是, 并不是所有的机器翻译研究人员都放弃了希 机器翻译研究进展与趋势 CCF 中文信息技术专委会 摘要机器翻译实现自然语言之间的自动互译, 是自然语言处理和人工智能领域的经典难题之一 近年来, 机器翻译受到越来越多的关注 一方面, 机器翻译技术拥有迫切的社会需求, 并不完美的机器翻译技术在产业界的应用越来越广泛, 实时语音翻译系统和在线翻译服务已进入日常生活 ; 另一方面, 机器翻译一直是学术界研究的一个热点, 关于机器翻译技术的研究论文在数量上长期占据计算语言学

More information

Microsoft Word 聂雪梅.doc

Microsoft Word 聂雪梅.doc 4 4 Vol. 4 No. 4 2013 8 Journal of Food Safety and Quality Aug., 2013 聂雪梅 *, 李立, 孙利, 高飞 (, 100123) 摘要 : 2011 12,, 2007~2011,,,, 关键词 : ; ; ; ; Trade and notification situation on food import and export

More information

!""#!$% & # &((! $% ) &((! %" & $!""# & # &((( )# &( &((! # &(((!*+ % *

!#!$% & # &((! $% ) &((! % & $!# & # &((( )# &( &((! # &(((!*+ % * +!" #!!$!%& ( % )% *) &!!) &!!( && &!!! " ""& + ""& ##" &!!% &( # !""#!$% & # &((! $% ) &((! %" & $!""# & # &((( )# &( &((! # &(((!*+ % * (!""#!""" $%%% &#% & $"! *!""! "#$!""! #%!% &% & &" ( #%!% % #)

More information

材料导报 研究篇 年 月 下 第 卷第 期 种球的制备 单步溶胀法制备分子印迹聚合物微球 洗脱处理 种子溶胀聚合机理 种球用量的影响

材料导报 研究篇 年 月 下 第 卷第 期 种球的制备 单步溶胀法制备分子印迹聚合物微球 洗脱处理 种子溶胀聚合机理 种球用量的影响 水相中 组氨酸单分散分子印迹聚合物微球的合成 表征及其识别性能研究 李思平等 李思平 徐伟箭 较佳工艺条件下 在水性体系中选用无皂乳液聚合法制得的单分散微米级聚苯乙烯微球为种球 分别以组氨酸 甲基丙烯酸 或丙烯酸胺 乙二醇二甲基丙烯酸酯 为模板分子 功能单体和交联剂 合成了 组氨酸分子印迹聚合物微球 研究了形貌 粒径及其分布以及模板分子与功能单体之间的相互作用 分别以 激光粒度分析仪紫外分光光度法和红外光谱表征功能单体与交联剂之间的共聚情况

More information

中 国 公 路 学 报 年

中 国 公 路 学 报 年 第 卷 第 期年 月 中 国 公 路 学 报 孟 瑾 朱 平 胡志刚 根据耐久性试验中常用的整车台架试验方法 通过多体动力学模型仿真模拟整车在四轮路面 激励下的运动状态 提取车身与底盘连接位置的载荷历程 采用有限元法分析动载荷作用下的车身 结构响应 基于传统的应力 寿命方法 方法 寻找车身薄弱环节 辨识危险零件应力 双轴性 并选择多轴疲劳损伤参量预测车身疲劳寿命 分析结果表明 结合多体动力学与多轴疲劳的寿命

More information

Microsoft Word - 杜金华论文_v1.3.doc

Microsoft Word - 杜金华论文_v1.3.doc 分类号 TP391 密级 UDC 编号 中国科学院研究生院 博士学位论文 基于多系统融合的统计机器翻译模型及系统研究 杜金华 指导教师徐波研究员中国科学院自动化研究所 申请学位级别工学博士 学科专业名称模式识别与智能系统 论文提交日期 2008.5 论文答辩日期 2008.05.23 培养单位 学位授予单位 中国科学院自动化研究所 中国科学院研究生院 答辩委员会主席黄泰翼 Research on

More information

629 计算机学报 2017 年 Finaly,weobservesignificantimprovementsfrom0.8to2.8BLEUpointswhentranslating Bengali,Tamil,Uzbek,andHungarianonthetestdatasetscompare

629 计算机学报 2017 年 Finaly,weobservesignificantimprovementsfrom0.8to2.8BLEUpointswhentranslating Bengali,Tamil,Uzbek,andHungarianonthetestdatasetscompare 第 40 卷第 4 期 2017 年 4 月 计算机学报 CHINESEJOURNALOFCOMPUTERS Vol.40No.4 Apr.2017 稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究李强王强肖桐朱靖波 ( 东北大学自然语言处理实验室沈阳 10819) 摘要该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究. 文中将基于中间语言的机器翻译方法分为系统级

More information

2 A 1 A 2 B B - 16 -

2 A 1 A 2 B B - 16 - Word2013/2010/2007 5A 1. 31 Word 12 2 1 A B 1.25 2-15 - 2 A 1 A 2 B B - 16 - 1. 1. Tab Space Tab 23 2. 2. 3. 664 40-17 - 2 Word2013 5A 2. 1 Word2010 2007 Word2013 Office.com - 18 - l 5A 3. Word2013 3 Word2010

More information

Microsoft Word - swcl2006_paper.doc

Microsoft Word - swcl2006_paper.doc 1 中文 base NP 识别 : 错误驱动的组合分类器方法 徐昉 1, 宗成庆 1, 王霞 1 ( 中科院自动化化研究所模式识别国家重点实验室, 北京,100080) ( 诺基亚中国研究中心 ) 摘要 : 本文采用一种新的错误驱动的组合分类器方法来实现中文 base NP 识别 本文首先对中文和英文 base NP 识别技术现状进行了简要分析和概述, 明确了中文 base NP 识别的任务, 然后,

More information

幻灯片 1

幻灯片 1 基于 n-gram 相似度的开发集选择 郑达奇涂兆鹏姜文斌米海涛刘洋刘群 {zhengdaqi, tuzhaopeng, jiangwenbin, htmi, yliu, liuqun}@ict.ac.cn 自然语言处理实验室中国科学院计算技术研究所 概要 领域自适应 概要 领域自适应 训练集选择 ( 调权 / Weighting) 更好的翻译规则 概要 领域自适应 训练集选择 ( 调权 / Weighting)

More information

books to read to improve english grammar

books to read to improve english grammar Books To Read To Improve English Grammar ->>->>->> http://bit.ly/2xq4jy3 1 / 5 2 / 5 Test...and...seven...books...in...the...popular...Caught'ya!...ENGLISH...MET... How...to...improve....English...grammar...without...reading...grammar...book?:^)?...33...repliesForums......General....English...Grammar...&...Vocabulary,...Listening...&...Speaking......General...

More information

? :,,, : ` ',,, (, : ),,,,,, 1, (, : ) :,,,, (, : ) 2, (, : ) 3 :,,, :, (, : ), 4? :,,,, (, : ) 5 :,,, ,,,, - -, ( ) -, ( ) -,( ) -, ( ) - (,

? :,,, : ` ',,, (, : ),,,,,, 1, (, : ) :,,,, (, : ) 2, (, : ) 3 :,,, :, (, : ), 4? :,,,, (, : ) 5 :,,, ,,,, - -, ( ) -, ( ) -,( ) -, ( ) - (, ( 下 ) 吕炳强 ( ):, :? ( ),,, 1 : ( ),,, 2,, ( ), ( ), ( - ), ( ) 3,,, (, : ) : (, : ), :( ) ( ),,,, (, : ), 1 :.( ), ( ), ( ), ( ),.( ) 2 (, ) 3 (, : - ) ? :,,, : ` ',,, (, : ),,,,,, 1, (, : ) :,,,, (, :

More information

!!

!! 涂正革 肖 耿 本文根据中国 个省市地区 年规模以上工业企业投入 产出和污染排放数据 构建环境生产前沿函数模型 解析中国工业增长的源泉 特别是环境管制和产业环境结构变化对工业增长模式转变的影响 研究发现 现阶段中国工业快速增长的同时 污染排放总体上增长缓慢 环境全要素生产率已成为中国工业高速增长 污染减少的核心动力 环境管制对中国工业增长尚未起到实质性抑制作用 产业环境结构优化对经济增长 污染减少的贡献日益增大

More information

2005年度863机器翻译评测研究方法与实施*

2005年度863机器翻译评测研究方法与实施* * 2005 年度 863 机器翻译评测方法研究与实施,3,4 侯宏旭 刘群 2 张玉洁 2 井佐原均 中国科学院计算技术研究所, 北京,00080, 2 日本情报通信研究机构, 日本京都,84-8795, 3 内蒙古大学, 内蒙古自治区,0002 4 中国科学院研究生院, 北京,00080 hxhou@ict.ac.cn 摘要 :2005 年度 863 计划机器翻译评测于 2005 年 9 月举行

More information

二 外汇风险溢酬的度量及其时间序列模型

二 外汇风险溢酬的度量及其时间序列模型 外汇风险溢酬理论述评 郑振龙 邓弋威 一 外汇风险溢酬问题的提出 国家自然科学基金项目 非完美信息下基于观点偏差调整的资产定价 福建省自然科 学基金项目 卖空交易对证券市场的影响研究 教育部人文社科一般项目 市场有效性 价格发现与 定价权争夺 基于人民币即期汇率和远期汇率的研究 教育部留学回国人员科研启动基金 人民币 即期与远期汇率关系及外汇市场协同稳定机制研究 郑振龙 男 福建平潭人 厦门大学金融系教授

More information

( ),, :1 : : ( ), 2 :, 3 : ( ), 4 : 5 : :, 6 :,,,,,,,,, :,,,.....,,,, 1, ;2,

( ),, :1 : : ( ), 2 :, 3 : ( ), 4 : 5 : :, 6 :,,,,,,,,, :,,,.....,,,, 1, ;2, 张 翼 本文对近年来我国人口出生性别比失衡原因作了社会学意义的探索和研究 认为家族主义与以家庭为最小生产单位的农业劳作方式, 家庭人口再生产对男婴的需 求与国家人口再生产对出生人数的限定, 以及妇女经济地位的相对低下等, 是造成出 生性别比升值的基本社会动因 指出, 在影响人口再生产的三只手 国家 家庭和市场中, 惟有借助于国家强有力的调控手段, 才能使失衡的出生性别比在短期内渐次 回落 作者 :

More information