年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技

Size: px
Start display at page:

Download "年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技"

Transcription

1 第 卷 第 期 年 月!"# $ %&'& 文章编号 维吾尔语形态切分语料库 哈里旦木 阿布都克里木 孙茂松 刘洋 阿布都克力木 阿布力孜 清华大学计算机科学与技术系智能技术与系统国家重点实验室 清华信息科学与技术国家实验室 筹 北京 ( 清华大学人文学院计算语言学实验室 北京 ( 摘 要 ")!&*+,"-./0,1/.*-.))0,1*!&*+,&'&0) 0/.&/&*+1- 是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库 原始语料从 年的天山网维文版 下载 题材内容包含新闻 法律 财经 生活等 语料库构建步骤为 爬虫 校对原始语料 分句 校对分句 人工和自动形态切分结合 人工标注语音和谐变化现象 人工校对形态切分和语音和谐变化现象 语料库包含 个文档 个句子 词语类型为 个 分为词级和句子级两类标注 开源网址为,+,11)&*+,,1/'+&*0 该研究不仅对维吾尔语语料库的建设具有参考意义 而且为维吾尔语自然语言处理的研究提供了有益的资源 关键词 ")!&*+, 维吾尔语 形态切分中图分类号 "# 文献标识码!"# '.2/11213'.1!&-&/0 4/0 1213'.11'.5. 6)&*&*)&7/'.0/"8,/&'&0)/2 )--"-./0,1.&/'&*&*) 7&*/7&*.&/ 8./8/2"8,/&'&0)9+*/&7&+1* 8./8/2"8,/&'&0) "-./0,1/.*-.):.;./0(,./ &*&*)&7&+1.&/'./ ,&&'&71/..-"-./0,1/.*-.):.;./0(,./ $#%")!&*+, "-./0,1 /.*-.) )0,1*!&*+,&'&0) 0/.&/&*+1-.-/ )0,1*8&*+1-.,&*+,-0/.&///&.&/-",&*.0./'8&*+1-.-2&/'&227*& "./-,/-.././8'1 2./0/-''.78&*+1-*+*&8--2)+*&&7*2./0&7,&*.0./'8&*+1-8'1---0/.&//2 +*&&7*2./0/1'/21&.8//&.&/7&*&*+,-0/.&//1'//&.&/&7+,&/.8,*&/) +,/&/&//1'8&**8.&/&7&*+,-0/.&//2+,&/.8,*&/)",8&*+1-8&/./-2&8 1/--//8-/2&*2)+-,.8,*//&2&,&*2''/2-//8''", 8&*+1-.-.'',+,11)&*+,,1/'+&*0 &'#")!&*+,)0,1*&*+,-0/.&/ 引言形态切分 &*+,&'&0.8'-0/.&/ 是将一个词切分成形态或语素的结构化预测任务 其输出结果能够帮助提高各种不同应用任务的性能 如自 动语音识别 词汇表示学习 机器翻译和句法 ( 分析等 形态丰富的语言存在大量形态不同的词 造成在执行自然语言处理时出现严重的数据稀疏问题 例如 维吾尔语通过屈折和派生可以生成无限数量的词 3* 认为黏着语建立词典是不可能的 因此 词应该被切分成最小语义单 收稿日期 定稿日期 基金项目 国家自然科学基金 国家 高技术项目 (,+1)-8/

2 年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技术主要是有监督的学习 深度学习的 成功运用前提是先具有一定规模的标注语料 维吾尔语在语料库建设方面已做了大量的工 作 新疆大学吐尔根 依布拉音等和新疆师 ( 范大学的玉素甫 艾白都拉等都已构建了百万词次的维吾尔语词法分析语料库 并分别在这些语料库基础上进行了词法 句法及面向具体任务的标注等 除此之外 文献 构建了 * 文献 建立了语法信息词典 文献 建立了小规模命名实体关系语料库 虽然当前已有了相当规模的维吾尔语语料库 但是还没有可公开使用的维吾尔语形态切分语料库 本文建立的形态切分语料库 ")!&* +, 分为词级和句子级两种 可用于维吾尔语有监督 半监督 无监督的形态切分 以及维吾尔语分词 词干提取等任务 在建立过程中本文参考了 )/ &*' 的工作 建立和公开的维吾尔语形态切分语料库的开源网址为,+,11)&*+,,1/'+&*0 该研究不仅对维吾尔语语料库的建设具有参考意义 而且为维吾尔语自然语言处理研究提供了有益的资源 研究背景 维吾尔语形态切分的特点 世界上语言分类包括 孤立语 屈折语和黏着语等 孤立语的特点一般不通过词形变化来表达语法作用 如汉语 屈折语和黏着语的共同点是使用词缀来实现语法功能 但是两者的区别在于屈折语可通过一个词缀实现多个语法功能 而黏着语中的一个词缀一般只具有一个语法功能 因此黏着语中经常会出现一个词内部有多个缀黏着的现象 属于黏着语的语言有日语 韩语 朝鲜语 芬兰语 土耳其语 维吾尔语 蒙古语和哈萨克语等几十种 这些黏着语的特点是词的词汇变化和各种语法变化都是通 过在实词词干上连接不同词缀的方式来体现的 因此可以说黏着语是形态丰富的语言 作为黏着语 维吾尔语形态的多变性是维吾尔语最突出的特点之一 维吾尔语形态切分的难点维吾尔语形态切分是维吾尔语自然语言处理的一大难点 导致维吾尔语分词精度不高的原因一般有 黏着性 语音变化现象 歧义和形态切分问题等 黏着性维吾尔语作为一种黏着语在语素的组合上具有高度的灵活性 所谓黏着性指的是维吾尔语的绝大部分附加成分都依附在词根之后 在同一个词根上 依次连缀几个附加成分 形成一种线条性特点 虽然词干和词缀的数量有限 但是理论上可以组合生成无限的词语 其中 绝大多数维吾尔语词语在语 料库中只出现一次 维吾尔语通过在词干上添加词缀来实现丰富的句法和语义功能 这种情况在维吾尔语自然语言处理中造成了严重的数据稀疏问题 语音变化现象维吾尔语词缀种类多 数目多 在词干和缀 缀与缀连接过程中 由于语音和谐规律 某些词干或词缀会发生弱化 增音 脱落等音变现象 例如 词干 花园 后面连接后缀 化 后构成新词 花园化 我们可以发现词干里的弱化为 ( 节将在建立好的语料上对语音和谐变化现象进行统计分析 歧义维吾尔语词的歧义现象也较严重 这种现象对维吾尔语形态切分任务带来一定的困难 表 给出了一些例子 表 维吾尔语的歧义现象举例维吾尔语词语义 语义 手指去 动词 兔子装满 苹果别拿袖子新 ( 形态切分问题维吾尔语的形态切分问题还存在意见分歧 传统形态学把形态变化的附加成分分为构词附加成分

3 期 哈里旦木 阿布都克里木等 ")!&*+, 维吾尔语形态切分语料库 构词词缀 和构形附加成分 构形词缀 构词词缀的功能是构成新词 构形词缀是不改变词义 而只改变词的语法意义 并表示词的各种语法关系 有的维吾尔语语法书把构词词缀称为 词缀 而把构形词缀称为 词尾 上述分类方法有很多不足 还有自相矛盾的地方 维吾尔语里面的一部分附加成分 从形式上看 它们好像是构词附加词缀 但是在功能上它们却具有构形附加成分的功能 例如 我的知识 这里有两个 形式相同 但功能不一样 第一个是构词词缀 和 知道 动词结合构成 知识 名词 第二个是构形词缀 它只是第一人称单数词缀 既不改变 知识 的语义 也不改变词性 指名词属于第一人称 因此 对此类词汇进行自动形态切分很难达到预期效果 维吾尔语形态切分标注库建设 标注规范 基本规则词干是一个词除去构形附加成分的部分 词干可能由词根构成 也可能由词根加上构词附加成分构成 例如 作者 是词尾 是词根 是构词附加成分 这个词除去构形附加成分 剩下的就是词干 维吾尔语有两种词缀 构词词缀和构形词缀 本文只考虑构形词缀的形态切分 例如 旅游 旅游者 旅游者 的 旅游业 的 旅游者 旅游业 由构词词缀构成 而 旅游者的 旅游业的 由构形词缀构成 本文的形态切分任务是将 旅游者的 和 旅游业的 分别切分成 旅游者 的 和 旅游业 的 而构词成分 旅游者 和 旅游业 不切分 当词干单独出现时 不加任何标记 默认为词干 例如 旅游 当词干与构形词缀一起出现时 词干后面 与词缀分开 例如 旅游者 的 ( 当词干或词缀发生语音变化时 后面加 后面写原形 例如 切分细则我们主要以名词 形容词 数词 量词 副词 代 词 动词为依据来进行切分 目前进行的是粗切分 即构形切分 名词 名词原形 名词的主格形式 为词干 派生名词 名词的零派生形式 专用名词可以单独做词干 例如 人名 名词后面加各种名词人称 格 数语法范畴时 名词语法范畴和名词词干分开 形容词 形容词的原形和最高级被认为是词干 维吾尔语形容词的最高级不带任何构形词缀 减弱和增强级要切分 例如 浅蓝色 数词 数词跟其他成分分开 基数是数词 词干 其他形式要切分 如 第四 我们六个 等 ( 量词 量词跟其他成分分开 量词没有加构形附加成分的部分就是量词词干 当量词后面加 词缀时词缀和词干要分开 例如 每公里 副词 维吾尔语中大部分副词是独立出现的 作为词干来处理 只有极少一部分副词带后缀 这时要将副词与后缀切分开 例如 快点 直到现在 代词 代词单数是代词词干 代词复数要切分 除此之外 维吾尔语代词经常与名词词缀组 合 这种形式的代词要与词缀分开 例如 把你 我们的 等 动词 动词带静词化附加成分和时态附加成分 因此动词带的语态附加成分 体语附加成分 否定附加成分 静词化附加成分 时态附加成分 人称附加成分 语气附加成分都与词干切分开 例如 我走了 我写了 我们要买 努力 等 模拟词 模拟词是词干 连词 连词单独出现时是词干 附带实词作构形附加成分时要切分 后置词 后置词是词干 语气词 单独使用的语气词本身被视为词干 附带实词作构形附加成分的语气词要切分 如 可能 你呢 他也来了呢 等 感叹词 维吾尔语中的所有感叹词以词干形式出现 除此之外 维吾尔语中的缩略词基本上存在三种情况 只取每个词的首字母 并用空格隔开 因此 目前不存在切分问题 例如

4 ( 年 取第一个词的第一个音节和最后一个词的第一个音节 合并成为一个词干 例如 等 用拉丁字母缩写 作为独立的词 例如 $9#"6" 等 形态切分语料库建立流程我们首先从天山网维文版 下载了维吾尔语语料 包含新闻 法律 经济和生活等 语料库构建步骤为 爬虫 校对原始语料 分句 校对分句 人工和自动形态切分 人工标注语音和谐变化现象 人工校对形态切分和语音和谐变化现象 语料库包含 个文档 个句子 不同领域文档数量的具体分布如表 所示 表 不同领域文档数量的领域分布领域文档数量国际 了语音变化现象统计 该新闻语料词表中发生语音和谐变化的词占总词表的 为了进一步了解发生语音和谐变化的词中词干和词缀在不同语音和谐变化现象下的分布我们做了进一步统计 统计结果见表 表 语音和谐变化现象分布语素弱化 增音 脱落 词干 词缀 从表 可知 语音变化现象主要体现为弱化 词干和词缀的弱化分布相似 一般情况下 语音和谐变化发生在词干或语素内部 而语素之间不会发生语音和谐变化 由以上分析我们得知维吾尔语中语音和谐变化很严重 而且其中的弱化现象应为研究重点 新疆 ( 维吾尔语词级形态切分语料库 国内 地区 州 社会 乌鲁木齐 科教 ( 经济 其他 我们使用 &3/.5*+*',+-0.,1 8&&---&--28&2* 工具对语料进行了标点符号切分 同时 为了减轻标注的工作量 我们提取了语料中的词语类型作为人工标注的数据 我们从中央民族大学维吾尔语语言学专业的学生中选择了七位学生对语料进行人工形态切分 要求对每一个词进行带有语音和谐变化的形态切分 在人工标注过程中不断对语料和人工切分错误及不一致性进行更正 人工标注完成后 从七位学生中选出标注最好的一份力克 阿卜杜瓦伊提进行了一次校对 之后又邀请了新疆大学的阿布都热依木 热合曼副教授和这位原标注者交替进行了校对 我们从已进行形态切分的维吾尔语词表 个 中抽取出一部分建立数据集 用于形态切分任务 该数据集有 条维吾尔语词 我们将该数据集分为训练集 开发集和测试集 训练集有 条词 开发集和测试集分别是 条词 测试任务分为两种 一种是只进行词干和词缀的切分 一种是词干 词缀切分的同时考虑语音变化 该数据集已开源免费使用 目前 已有工作使用该数据集研究了维吾尔语形态切分在神经网络中的性 能体现 获得了具有参考价值的实验结果 对应的预处理后的数据集和代码也已开源 ) 维吾尔语句子级形态切分语料库我们进一步完善形态切分语料的建设 在词级语料库的基础上建立了句子级形态切分语料 句子级语料包含 条句子 因为词级形态切分语料建设中已经建立了标注规范 词级规范直接应用到句子中 句子级形态切分时 对句子中的每一个词进行人工形态切分并校对 词干和词缀之间用 号来分开 表示右边的语素是词干 表示左边的语素是右边语素的原形 如下例所示 维吾尔语语音变化现象分布 我们对人工切分后的新闻领域语料的词表进行,+1)-8/,+,11)&*+,,1/'+&*0,+-0.,18&,'.2/1"!

5 期 哈里旦木 阿布都克里木等 ")!&*+, 维吾尔语形态切分语料库 句子级语料的建设比词级形态语料建设有以下几方面的优势 句子级形态切分时完全可以按上下文来判断句子中每一个词的词干部分 这样就避免兼类词难切分的情况 句子形态切分时可以避免一些正字法 方言词等词汇切分错误 我们对句子级形态切分语料库进行了统计 统计结果见表 ( 通过实验我们发现词 词干 词缀的平均长度是 ( 和 维吾尔语词的最大长度为 每个词的词缀的平均个数是 表 ( 维吾尔语句子级形态切分语料库统计结果自动统计字符词的最长长度 词的最短长度 词的平均长度 词干的最长长度 词干的最短长度 词干的平均长度 ( 缀的最长长度 缀的最短长度 缀的平均长度 词缀的最多个数 词缀的最少个数 词缀的平均个数 带词缀的词的比例 词干发生变形的词的比例 词缀发生变形的词的比例 词干与词缀同时变形的比例 只有 个缀变形的比例 有 个或 个以上缀变形的比例 结论本文描述了构建的维吾尔语形态切分语料库 ")!&*+, 并着重分析了维吾尔语形态切分规则 同时进行了一些语言学上的统计 该语料库 已被开源免费使用 该文工作不仅对相关维吾尔语 语料库的建设具有参考意义 而且为维吾尔语自然 语言处理的研究提供了有益的资源 参考文献 7.7)! *.3)61& 6'/,1-&7 &*+,&'&0.8' /')-.- 7&* 2.'8' *.8 -+8, *8&0/..&//*-+8, #./,/* /.&/'&/7*/8&/ +&3/ /010#*&8--./0 #.-10,# :&,:'1/-&#&+&-..&/'&*+,&'&0)7&* &*2*+*-/.&/-/2'/010 &2'./0 #*&82./0-&7,-/*/.&/'&/7*/8&/!8,./ */./0 :.;./0,./!( #&'1 '.7&/ *3*&././0&*+,-2 8,./*/-'.&/.,+&-+*&8--./0 &*+,+* 2.8.&/#*&82./0-&7,(, //1'!./0 &7,--&8..&/7&*&+1.&/'./ / /010 "8,/&'&0.- #&*'/2 *0&/ --&8..&/ 7&* &+1.&/'./ ( ( 3*./&0'10*+,-2'.82+/2 /8)+*-*7&*;&./ &*+,&'&0.8'-0/.&//2 -)/8.8/')-.-"*/-8.&/-&7,--&8..&/ 7&*&+1.&/'./ &*' 8,15 &./-/.8-)/,-.-/2 &*+,&'&0.8'/')-.-&7,2*.2&*2"*/- 8.&/-&7, --&8..&/7&*&+1.&/'./ (!*-'/.'-&/ <.8'*+*-/.&//2+*&8--!*.20!!"#*-- 哈里旦木 阿布都克里木 刘洋 孙茂松 神经机器翻译系统在维吾尔语 汉语翻译中的性能对比 清华大学学报 自然科学版 /0&=.4'!&*+,&'&0.8' 0/.&/.,./2& "! 1*'&*3- #*&82./0-&7,",.*.,&/7*/8&/*.7.8.'/'.0/8#,&/.<*.5&/ --&8..&/7&*, 2/8/&7 *.7.8.'/'.0/8 (( >&,+:41*9!)'"*/-7**/./07&*

6 年 -,&+6)&&+/ +*./0*/*/.&/'#1'.-,./0(( 6,*;./0!.,1.!/2"1*0/4' //&.&/-8,-7&*8&/-*18./0 )0,1*/2 /.)*'.&/8&*+1- #*&82./0-&7/*/.&/' &/7*/8 &/ -./ /010 #*&8--./0 "./&+1* &8.) &*'%..*" 8,?5 ;&./&2'&7 &*,&0*+,)/2 &*+,&'&0.8'-0/.&/ #*&82./0-&7,&/7*/8&7,&*, *.8/,+*&7,--&8..&/7&*&+1.&/'./ //010"8,/&'&0.- /9. 0&'.7&*/.--&8..&/7&* &+1.&/'./ ( 艾孜尔古丽 阿力木 木拉提 玉素甫 艾白都拉 基于形态分析的现代维吾尔语名词词干识别研究 哈里旦木 阿布都克里木 程勇 刘洋 等 基于双向门限递归单元神经网络的维吾尔语形态切分 &-&1*81*'!8,./"*/-'.&/#*& 82./0-&7,&/7*/8&/+.*.8'!,&2-./1*'/010#*&8--./01-./"<-- -&8..&/7&*&+1.&/'./ 吐尔根 依布拉音 阿里甫 库尔班 基于词典的现代维吾尔语词性自动标注系统的研究 中国中文信息学会二十五周年学术会议 北京 中国中文信息学会 ( 艾山 吾买尔 维吾尔语词法句法分析关键技术的研究 9 乌鲁木齐 新疆大学 买合木提 买买提 吐尔根 依布拉音 基于 0* 的维吾尔语词性标注研究 第二届全国少数民族青年自然语言处理学术研讨会 合肥 中国中文信息学会 "",2'&+/&7002) 0,1*8&*+1-#*&82./0-&7,,# &/7*/8&//010/7&*.&//2&+1.&//&-./0+&*# *./0 &.( ( /2*/2!'."#*&0*--&/ 8&/-*18.&/8,/&'&0)&7 )0,1*3/&'20- #*&82./0-&7,/*/.&/' )+&-. 1&//'.0/.1.&1-&+1./0/2218.&/-,./0&/9 &+1* &8. )(!.*;.01'.' /&7,)0,1** 2-3&+ &7*/0./*./0..')..6,*;./0':1.'2./0 8&/+&**) )0,1*0*.8'./7&*.&/2.8.&/*) #*&82./0- &7 &*'2.2 /010 *.8/7*-*181* 8&/2 /*/.&/' &*3 清华大学学报 自然科学版 1213'.1'.2/1,/04&/0.14/0 ')0,1*&*+,&'&0.8'-0/.&/.,.2.*8.&/'$ /1*'/&*3- "-./0,1 /. 8./2"8,./,./- 1213'.1 '.2/1.1 4,/ =' */./02.-*.12*+*-/.&/-&7)0,1*&*2- /2 &*+,- #*&82./0- &7 # :9$1/05,&1,./ +*./0* 霍盛 试论维吾尔语形态变化的功能及其特点 新疆大学学报 哲学社会科学版 ( 哈里旦木 阿布都克里木 博士研究生 主要研究领域为自然语言处理.'23','20.'8& 孙茂松 博士 教授 主要研究领域为自然语言处理 网络智能 计算社会科学.'--.'-./0,1218/ 刘洋 通信作者 博士 副教授 主要研究领域为自然语言处理 机器翻译.''.1)/0-./0,1218/

第 ** 卷第 * 期 中文信息学报 Vol. **,No. * 201* 年 * 月 JOURNAL OF CHINESE INFORMATION PROCESSING ***.,201* 文章编号 :1003-0077(2017)00-0000-00 * THUUyMorph: 维吾尔语形态分析语料库 * 收稿日期 : 定稿日期 : 基金项目 : 国家自然科学基金重点项目 (61331013);

More information

Microsoft PowerPoint - 诓敧-8.19

Microsoft PowerPoint - 诓敧-8.19 考研英语二语法与长难句 王丽 关于词的那些事 1 学习目标 什么是词? 什么是语? 英语中的词性有哪些? 每种词性最重要的使用规则是什么? 什么是词? 什么是语? 单词 : persistence [pəˈsistəns] n. 坚持不懈 句子 : Persistence is the key to success. 坚持不懈是成功的关键 句法核心 :XX 词在句中作 XX 语 词 : 词性, 每个单词自然属性

More information

标题

标题 ISSN1000G0054 CN11G2223/N 清华大学学报 ( 自然科学版 ) 2017 年第 57 卷第 8 期 JTsinghuaUniv(Sci& Technol), 2017,Vol.57, No.8 17/19 878G883 神经机器翻译系统在维吾尔语汉语翻译中的性能对比 哈里旦木 阿布都克里木, 刘 洋, 孙茂松 ( 清华大学计算机科学与技术系, 智能技术与系统国家重点实验室,

More information

标题

标题 ISSN1000G0054 CN11G2223/N 清华大学学报 ( 自然科学版 ) 2017 年第 57 卷第 1 期 JTsinghuaUniv(Sci& Technol), 2017,Vol.57, No.1 1/20 1G6 基于双向门限递归单元神经网络的维吾尔语形态切分 哈里旦木 阿布都克里木, 程勇, 刘洋, 孙茂松 ( 清华大学计算机科学与技术系, 智能技术与系统国家重点实验室, 清华信息科学与技术国家实验室

More information

<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA>

<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA> 中科院计算所多语言处理和机器翻译 研究进展 姜文斌 中国科学院计算技术研究所自然语言处理研究组 第九届全国自然语言处理青年学者研讨会深圳,2012 年 8 月 大纲 研究背景 问题与挑战 研究进展 翻译评测 2 中国的多语言环境 少数民族语言众多 维吾尔语 哈萨克语 柯尔克孜语 蒙古语 藏语 朝鲜语 周边语言环境复杂 语言种类多 : 英语 日语 韩语 泰语 越南语 俄语 很多语言与国内少数民族语言相通

More information

Microsoft Word - final script.doc

Microsoft Word - final script.doc 蒙古语语法信息词典 形容词库 建设中的若干问题 雪艳中国呼和浩特,010021 内蒙古大学蒙古语文研究所 tsasun@126.com 宝金良中国呼和浩特,010021 内蒙古大学蒙古语文研究所 xijir@126.com 摘要 蒙古语语法信息词典 是为实现蒙古语的自动分析与自动生成而研制的一部机器词典 本文着重讨论 蒙古语语法信息词典 形容词库有关收词 子类划分方面的问题, 与此同时, 对于在蒙古语语法研究中有争议的两点问题,

More information

第 卷 第 期 年 月 半 导 体 学 报! " # $%&'%' $!&' #% #$1 /#1 $'! / ?/ ?/ / 3 0,?/ ) * +!!! '!,!! -. & ' $! '! 4% %&1)/1(7%&)03 (% )

第 卷 第 期 年 月 半 导 体 学 报!  # $%&'%' $!&' #% #$1 /#1 $'! / ?/ ?/ / 3 0,?/ ) * +!!! '!,!! -. & ' $! '! 4% %&1)/1(7%&)03 (% ) 第 卷 第 期 年 月!"# $%&'%' $!&'#%#$1/#1 $'! /18103 2?/03101?/18103 /3 0,?/0301.13 )*+!!! '!,!! -.&' $!'! 4%%&1)/1(7%&)03(%)%&,%*(1&0)%$-0*,%30)17*1*)0(+1(1+&1*+*),)1; &113(%44(10&.0701&0-&00*/)%;()1%-1+%&0)0*1*)%

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

山 东 大 学 博 士 学 位 论 文 晚 清 四 大 谴 责 小 说 词 汇 研 究 姓 名 : 张 威 申 请 学 位 级 别 : 博 士 专 业 : 汉 语 言 文 字 学 指 导 教 师 : 杨 端 志 20080415 山东大学博士学位论文

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

将民族文化认同置于一个多民族交往和对话 互相激荡影响的场域中予以考察 包括对少数民 族网络的官方话语 少数民族知识分子话语 商业诉求 个人表达四类话语形态的分析 在民族文化认知 情感表达等方面 网络都为少数民族文化认同提供了场域 在网络的场域下 少数民族文化认同 地域认同 国家意识形态相互浸润 形成了多层次的民族和国家认同 文化认同 少数民族 电子网络媒介 陈静静 云南大学新闻系讲师 庄晓东 哲学博士

More information

幻灯片 1

幻灯片 1 Custom makes all things easy! 本讲任务 一. 人称代词主格, 宾格 二. 形容词性物主代词与名词性物主代词 三. 反身代词 一. 人称代词 主格, 宾格 句子成分 I broke two windows. 句子成分 I broke two windows. 句子成分 I broke two windows. 主语 句子成分 I broke two windows. 主语

More information

Microsoft Word - 14_CHI_ Fu ruomei_OK.doc

Microsoft Word - 14_CHI_ Fu ruomei_OK.doc 汉语词缀与构词 CHINESE AFFIXES AND WORD FORMATION Fu Ruomei Chinese Departement, Faculty of Humanities, BINUS University Jln. Kemanggisan Ilir III No.45, Kemanggisan Palmerah, Jakarta 11480 rosemary@binus.edu

More information

Microsoft Word doc

Microsoft Word doc 蒙古语兼类词词性标注的处理 那日松 1, 敖其尔 ( 内蒙古大学计算机学院, 内蒙古呼和浩特 010021) 2 摘要 : 本文主要解析了通过最大概率值词性标注和同现概率值词性标注这两种方法对蒙古语的兼类词进行词性标注的过程, 并给出了它们详细的实验步骤和结果 根据分析过程, 可以了解这两种方法的利弊 关键字 : 词性标注 ; 兼类词 ; 最大概率值词性标注 ; 同现概率值词性标注中图分类号码 :H085.6

More information

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理

省份 科类 本一线 出档线 人数 最高分 最低分 平均分 理 青海 文 理 山东 文 理 厦门大学 2006 年普高招生分省分专业录取分数统计表 省份 科类 本一线 出档线 人数 最高分 最低分 平均分 文 573 600 25 638 601 612.7 安徽 理 566 615 74 653 615 630.1 理 ( 国防生 ) 566 596 12 621 596 607.2 北京 文 516 574 24 605 574 586.3 理 528 593 59 646 596 610.7

More information

Microsoft Word - dai-morph-analysis-term-revised.doc

Microsoft Word - dai-morph-analysis-term-revised.doc 载 中国科技术语,2009 年, 第 3 期,Vol.11,No.3 单词型术语的结构自动分析 冯志伟 摘要 : 本文根据计算术语学的原理, 使用有限状态转移网络对单词型术语进行自动分析 首先以英语术语为例, 介绍了有限状态转移网络的基本原理和分析过程, 然后, 分别讨论了德语 法语和汉语的单词型术语的自动分析问题, 最后讨论了分析结果的形式表示方法 关键词 : 计算术语学, 有限状态转移网络, 自动词法分析,

More information

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学

Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 Cet 4 大学英语四级翻译 Jesse Yang Lu Jesse Yang Lu 简介 贵学教育集团名师 ; 英国卡迪夫大学博士 ; 美国马里兰大学硕士 ; 丹麦蓝纳斯商学院学士 ; 贵粉儿昵称 国际浪子 新浪微博 : 吕洋 - 贵学 I am a student. 基本句式 I am a student. 基本句式 I am beautiful. I am a student. 主系表 基本句式

More information

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位 自然科学版 文章编号 视网膜图像中视盘的快速自动定位方法 赵晓芳 林土胜 李碧 摘 要 基于眼底视网膜血管的分布结构及视盘本身的特点 提出一种快速自动定位视盘的方法 首先根据视网膜血管的网络分布结构大致定位视盘的垂直坐标 然后根据视盘 的亮度信息及视盘与血管的关系来定位视盘的水平坐标 最后把视盘限定在以粗定位的视盘为中心的一个小窗口内 用 变换精确定位视盘中心 该方法不需要事先分割视网膜血管 也不需要对算法进行训练

More information

从 他的老师当得好 谈起 黄正德 哈佛大学语言学系 波士顿 黄正德 美国麻省理工学院语言学博士 美国哈佛大学语言学系教授 先后执教于美国夏威夷大学 台湾清华大学 台湾师范大学 美国康乃尔大学 美国加州大学 在法国 日本 西班牙 澳大利亚等国家担任客座教授 学术研究专治语 法理论 着重于句法学 句法语义接口 语言参数理论以及汉语语法研究方面 出版学术专书与期刊论文数十部

More information

密级 :

密级 : 密级 : 硕士学位论文 黏着语形态分析模型和方法研究 作者姓名 : 张海波 指导教师 : 刘群研究员 中国科学院计算技术研究所 学位类别 : 学科专业 : 研究所 : 工学硕士 计算机应用技术 中国科学院计算技术研究所 2014 年 5 月 The Research of Morphological Analysis Models and Methods of Agglutinative Languages

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 文章编号 :1003-0077(2011)00-0000-00 中文信息学报 稿件排版格式 维吾尔语形态复杂词汇的神经表征和处理机制研究 * 以心理语言学研究结论为证据 阿布都克力木. 阿布力孜 1,2, 江铭虎 1,2, 姚登峰 1,2, 哈里旦木. 阿布都克里木 4 艾山. 吾买尔 (1. 清华大学人文学院计算语言学实验室, 北京 100084; 2. 清华大学心理学与认知科学研究中心, 北京

More information

+$ 6" 空格前是动词 " 因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此

+$ 6 空格前是动词  因此应该选择一个副词 1$4! 空格前是两个形容词 因此所填的单词应是一个相关的名词 $: 空格前是定冠词 后面是名词 因此应该填一个形容词 根据句意可知 是正确的选项 5$ 从空格前后的单词可以判断应填一个名词 考虑到前后的搭配 应该选择 0$ 空格前是不定冠词 因此 选词填空练习参考答案和解析 /$3 分析句子结构 空格处应填动词谓语 " 明显是一个定语从句 且时态是现在式 因此空格处应填的动词应是动词现在式 再从语义上分析 只有 反映 合适 *$ 空格前是一个形容词 后面是介词 因此只能填名词 而且应该是单数 $ 空格前是形容词 因此应填名词或代词 仔细分析句子 可以判断 "! 在句中作动词 从词义搭配上来看 只有 合适.$8 &"! 空格前是介词 #" 而后面则一个逗号

More information

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工

厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 理工 北京 文史 理工 厦门大学 2010 年本科招生分省录取情况统计 省份 科类 本一线出档线最高分 最低分 平均分 安徽 文史 573 624 631 624 627.9 理工 562 634 655 634 640.7 北京 文史 524 567 620 567 592.5 理工 494 583 648 587 609.3 福建 文史 557 594 622 594 603.5 理工 539 602 650 602

More information

西南民族大学学报 人文社会科学版 年第 期 二 西康省早期藏文报纸的共同特征 三 西康省早期藏文报纸诞生的原因 一 四川省新一批少数民族文字报纸的创办

西南民族大学学报 人文社会科学版 年第 期 二 西康省早期藏文报纸的共同特征 三 西康省早期藏文报纸诞生的原因 一 四川省新一批少数民族文字报纸的创办 李谢莉 四川省民族地区历史上曾创立过四家正式的藏文报纸和新中国唯一的彝文报纸 这在中国少数民族报业史上占据了重要地位 本文对 世纪 年代以来各时期四川省少数民族文字报纸创立的社会背景 传播格局 具体特征和历史地位做出了简要阐述 特别针对它们当前所普遍面临的读者滑坡 发行量低迷 收支倒挂和人才缺乏等问题提出了对策建议 四川省 少数民族文字报纸 中国新闻史 一 西康省早期藏文报纸的诞生 西南民族大学学报

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 文章编号 :1003-0077(2011)00-0000-00 中文信息学报 稿件排版格式 基于语法的维吾尔语情感词汇自动获取 玛尔哈巴 艾赛提 1, 艾孜尔古丽 1, 玉素甫 艾白都拉 ( 新疆师范大学计算机科学技术学院, 新疆乌鲁木齐 830054) 摘要 : 情感词汇的获取是文本倾向性分析的基础 为了解决人工识别方法低效的不足, 并为维吾尔语情感词的研究及情感词词典的创建提供一些可供选择的方法和思路,

More information

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批

省份 批次 文科 重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 备注 山东 本一批 本一批 厦门大学 2007 年本科招生录取分数一览表 省份 批次 文科 重点线出档线最高分最低分平均分 录取人数 重点线出档线最高分最低分平均分 录取人数 备注 北京 本一批 528 562 621 572 591.6 23 531 613 655 613 631.9 52 本一批 574 580 638 584 612 23 545 559 643 594 615 67 非西藏生 广西 源定向西 625

More information

标题

标题 第 35 卷第 期西南大学学报 ( 自然科学版 ) 3 年 月 Vol.35 No. JouralofSouthwestUiversity (NaturalScieceEditio) Feb. 3 文章编号 :673 9868(3) 69 4 一类积分型 Meyer-KiḡZeler-Bzier 算子的点态逼近 赵晓娣, 孙渭滨 宁夏大学数学计算机学院, 银川 75 摘要 : 应用一阶 DitziaṉTotik

More information

98

98 / / 河北师范大学学报 // / /... 人本与物本 翻译 与 语义谱系分析比较 牛云平, 杨秀敏 (., ;., ) : 翻译 与 的语义谱系有着根本不同之处 : 前者的本义是语官及其解释活动, 具有明显的人文特征 ; 后者的本义则是物体搬移行为, 具有明显的物化特征 两词的语义谱系不同, 决定了各自理论发展形态有别, 证明了中西翻译学自然而然地有着不同的研究重心和研究取向 因此, 中国学人强求与西人苟同乃是不智之举,

More information

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20

Three papers Ø Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection (Xu Sun et al., ACL 20 Three papers in NLP fields: Chinese word segmentation (ACL2012), dependency parsing (EMNLP 2012) and SMT (ACL2012) Reporter:Fandong Meng 2012/12/26 Three papers Ø Fast Online Training with Frequency-Adaptive

More information

依克拉木江 那孜力 男 1999/8/ 克拉玛依市雏鹰青少年足球俱乐部 合格 买尔吾甫江 艾尔肯江 男 1998/9/ X 克拉玛依市雏鹰青少年足球俱乐部 合格 赛依德 赛夫丁 男 1999/4/

依克拉木江 那孜力 男 1999/8/ 克拉玛依市雏鹰青少年足球俱乐部 合格 买尔吾甫江 艾尔肯江 男 1998/9/ X 克拉玛依市雏鹰青少年足球俱乐部 合格 赛依德 赛夫丁 男 1999/4/ 王同舟 男 1999/5/22 532301199905220016 恒大足球学校 合格 不合格 黄冬冬 女 2000/10/12 23230320001012424X 大连 U16 女足 合格 张润昆 男 2003/1/9 533001200301090011 长春亚泰 合格 不合格 张济凡 男 2003/8/11 441402200308110737 长春亚泰 合格 伊尔夏提 喀哈尔 男 2001/2/28

More information

明代文学社群类型及其文坛嬗变 作者 : 张涛, 张慧萍 作者单位 : 张涛 ( 河北社会科学院, 河北石家庄,050051), 张慧萍 ( 中央财经大学图书馆, 北京,100081) 刊名 : 宁夏大学学报 ( 人文社会科学版 ) 英文刊名 : Journal of Ningxia University (Social Science Edition) 年, 卷 ( 期 ): 2014,36(5)

More information

基于增强稳定组模型的移动 P2P 网络信任评估方法 作者 : 吴旭, WU Xu 作者单位 : 西安邮电大学计算机科学与技术系西安 710121; 西安交通大学计算机科学与技术系西安 710049 刊名 : 计算机学报 英文刊名 : Chinese Journal of Computers 年, 卷 ( 期 ): 2014,37(10) 本文链接 :http://d.wanfangdata.com.cn/periodical_jsjxb201410006.aspx

More information

2007年版的

2007年版的 * CRF 与规则相结合的维吾尔文地名识别研究 买合木提 买买提 1,2, 卡哈尔江 阿比的热西提 1,2, 艾山 吾买尔 1,2, 吐尔根 依布拉音 1,2 王路路 (1. 新疆大学信息科学与工程学院, 新疆乌鲁木齐 830046;2. 新疆多语种信息技术重点实验室, 新疆乌鲁木齐 830046) 摘要 : 通过维吾尔文地名的分析研究, 提出了一种基于条件随机场和规则的维吾尔文地名识别方法 根据维吾尔文地名

More information

三字词语定量研究

三字词语定量研究 1 现代汉语未登录三字词语的计量研究 王治敏朱学锋段慧明 北京大学计算语言学研究所 100871 中国 wangzm@pku.edu.cn duenhm@water.pku.edu.cn 摘要 : 三字词语不断增多的趋势已经受到了学者们的关注 本文从信息处理的角度, 重点考察了 1998 年全年 人民日报 基本标注语料库, 统计出标注语料中 现代汉语语法信息词典 未登录的三字切分单位在实际文本中的比例,

More information

钟晋轩 男 2003/12/ XXXX 广东 合格 阿布都力艾则孜 艾买提 男 2004/1/ XXXX 广东 合格 不合格 黄学扬 男 2004/3/ XXXX 广东 合格 罗靖恒 男 2004/4/1

钟晋轩 男 2003/12/ XXXX 广东 合格 阿布都力艾则孜 艾买提 男 2004/1/ XXXX 广东 合格 不合格 黄学扬 男 2004/3/ XXXX 广东 合格 罗靖恒 男 2004/4/1 2017 年中国足协第一期骨龄测试公示表 ( 男测试日期 :3 月 8-9 日乌鲁木齐 ) 姓名 性别 出生日期 身份证号 球队名称 00 年龄段 01 年龄段 02 年龄段 03 年龄段 04 年龄段 05 年龄段 安凯尔 尔肯 男 2003/4/4 65290120030404XXXX 阿克苏 合格 赛尔达尔 阿力木 男 2003/10/28 65290120031028XXXX 阿克苏 合格

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 文章编号 :1003-0077(2011)00-0000-00 汉语二语教学领域词义标注语料库的研究及构建 王敬, 杨丽姣, 蒋宏飞, 苏靖杰, 付静玲 (. 北京师范大学中文信息处理研究所, 北京市 100875) 摘要 : 汉语二语教学领域, 词汇教学在其中占有极为重要的地位, 其中多义词又是词汇教学的重点和难点 本 研究通过分析三部经典领域词表, 选取了 1181 个重点多义词, 以 现代汉语词典

More information

简单德语语法

简单德语语法 简单德语语法 1. Ich spreche Deutsch. 我说德语 2. Sprichst du Englisch? 你说英语吗? 3. Er spricht Chinesisch. 他说汉语 4. Ihr sprecht gut Deutsch. 你们德语说得很好 5. Sprechen sie Deutsch? 他们说德语吗? 6. Sprechen Sie auch Chinesisch?

More information

西南民族大学学报 人文社科版 第 期本刊网址

西南民族大学学报 人文社科版 第 期本刊网址 西南民族大学学报 人文社科版 总第 期 期刊的学术规范性一方面反映了期刊的治学态度 另一方面也便于期刊开展学术交流 扩大期刊的学术影响力 文章从高校人文社科综合性学报的篇均引用文献数 期刊作者地区分布 基金论文占有比例 本机构论文比例以及作者机构标注比例入手 并分别列出各项指标的前 名进行分析 从而反映该领域内高校人文社科综合性学报所载论文学术含量 学术规范及其发展变化 高校人文社科综合性学报 期刊学术规范

More information

改 版 前 言

改 版 前 言 上 海 理 工 大 学 学 报 (社会科学版) 第 34 卷 第 4 期 2012 年 12 月 Journal of University of Shanghai for Science and Technology Vol. 34 No. 4 Dec. 2012 不同英语水平学习者英语动词后缀联想研究 李俊敏 李德高 (浙江大学 外国语言文化与国际交流学院 杭州 310058) 摘要 对英语学习者进行英文词词汇联想测量结果表明

More information

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending]

Ch. 7 形容词 [Adjectives]: 大纲 7-2 形容词的屈折变化 形容词的用法 Mappiq 指向字尾 [Directional Ending] Ch. 7 形容词 [Adjectives]: 目标 有些教科书要求掌握形容词的屈折变化 我的课不要求 你需要掌握的内容 : 1. 基于形容词的字尾识别其性和数 2. 找出形容词的词典形 3. 识别形容词在上下文中的具体用法 ( 名词 [substantival], 谓语 [predicate], 或属性 [attributive]). 4. 根据不同的用法翻译形容词 7-1 Ch. 7 形容词 [Adjectives]:

More information

谈汉语单复句学说 源 流 的方枘圆凿关系长期存在 兼说 汉语现代语法学史一个 历史性的大误会 及其原因作者 : 孙良明, Sun Liangming 作者单位 : 山东师范大学古籍整理研究所, 山东济南,250014 刊名 : 英文刊名 : 年, 卷 ( 期 ): 2012,57(1) 山东师范大学学报 ( 人文社会科学版 ) Journal of Shandong Teachers' University(Humanities

More information

30 尼扎吉 喀迪尔 维吾尔族 陕西师范大学 博士 31 买买提尼牙孜 托科提 维吾尔族 新疆大学 硕士 32 毛吉旦 阿布都热依木 维吾尔族 新疆大学 本科 33 米克拉依 艾麦提 维吾尔族 西安外国语大学 本科 34 纳迪兰 克依木 维吾尔族 西安理工大学大学 本科 35 尼加提. 卡米力 维吾

30 尼扎吉 喀迪尔 维吾尔族 陕西师范大学 博士 31 买买提尼牙孜 托科提 维吾尔族 新疆大学 硕士 32 毛吉旦 阿布都热依木 维吾尔族 新疆大学 本科 33 米克拉依 艾麦提 维吾尔族 西安外国语大学 本科 34 纳迪兰 克依木 维吾尔族 西安理工大学大学 本科 35 尼加提. 卡米力 维吾 1 阿不都热合曼. 尼牙孜 维吾尔族 新疆大学 硕士 2 阿尔普丁 艾尼瓦尔 维吾尔族 辽宁石油化工大学 本科 3 阿巴拜克热 艾买提卡力 维吾尔族 天津师范大学 本科 4 阿布都沙拉木 吐尔洪 维吾尔族 南昌工学院 本科 5 杜曼 吐开 哈萨克族 新疆农业大学 本科 6 迪力努尔 阿布拉 乌孜别克族 北京林业大学 本科 7 苏热曼姑丽 热合曼 维吾尔族 大连外国语大学 本科 8 古丽扎尔 艾力 维吾尔族

More information

摘要近些年, 语法化问题重新成为语言学家关注的问题 所谓语法化, 就是语言中意义实在的词项或结构式变成无实在意义 仅表语法功能的语法成分, 或者由一个不太虚的语法成分变成更虚的语法成分 语法化使得语言单位在语义 语用 形态和语音等方面都产生了新的变化和特点 汉语名词 头 也经历了语法化的过程, 通过

摘要近些年, 语法化问题重新成为语言学家关注的问题 所谓语法化, 就是语言中意义实在的词项或结构式变成无实在意义 仅表语法功能的语法成分, 或者由一个不太虚的语法成分变成更虚的语法成分 语法化使得语言单位在语义 语用 形态和语音等方面都产生了新的变化和特点 汉语名词 头 也经历了语法化的过程, 通过 硕士学位论文 汉语 头 的语法化探析 姓 导 名 : 周康 师 : 顾阳 学号 :08001140 学学学日 位 : 汉语语言学及语言获得专业文学硕士系 : 语言学及现代语言系校 : 香港中文大学期 : 二零零九年五月二十九日 摘要近些年, 语法化问题重新成为语言学家关注的问题 所谓语法化, 就是语言中意义实在的词项或结构式变成无实在意义 仅表语法功能的语法成分, 或者由一个不太虚的语法成分变成更虚的语法成分

More information

Microsoft Word doc

Microsoft Word doc 蒙古语语料库综述 雪艳 1, 文化 2, 那顺乌日图 ( 内蒙古大学蒙古学学院, 内蒙古呼和浩特 010021) 3 摘要 : 内蒙古大学蒙古语文研究所, 自 1983 年以来先后建立了各种语料库 10 余个, 这些语料库是蒙古语研究的重要资源, 尤其是经过浅加工的 100 万词级现代蒙古语语料库自建成到现在一直都是现代蒙古语研究和蒙古文信息处理研究的重要数据来源 直至今天, 蒙古语语料库的建设和研究工作整整经历了

More information

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5>

<4D F736F F F696E74202D E4E4C50A3BAB4CAB7A8A1A2BEE4B7A8A1A2D3EFD2E5> 中文自然语言处理平台 FudanNLP: 从词法到句法, 再到语义 报告人 : 邱锡鹏 xpqiu@fudan.edu.cn http://jkx.fudan.edu.cn/~xpqiu/ 提纲 1 FudanNLP 系统介绍 2 算法原理 3 词法 句法 语义 FudanNLP 系统介绍 设计目标 为中文自然语言处理研发一个开源平台, 使用统一框架, 集成先进研究成果, 降低中文分析门槛, 促进中文自然语言处理的发展

More information

<4D F736F F D20D3EFC1CFBFE2D1D0BEBFD3EBD3A6D3C32E68746D>

<4D F736F F D20D3EFC1CFBFE2D1D0BEBFD3EBD3A6D3C32E68746D> 语料库研究与应用综述 目录一概述二中国语料库建设的基本情况三语料库的加工 管理和规范四语料库在语言研究中的的应用五参考文献 语料库研究与应用综述 (1998-2003) 傅爱平 一概述 语料库通常指为语言研究收集的 用电子形式保存的语言材料, 由自然出现的书面语或口语的样本汇集而成, 用来代表特定的语言或语言变体 经过科学选材和标注 具有适当规模的语料库能够反映和记录语言的实际使用情况 人们通过语料库观察和把握语言事实,

More information

安徽 专业 科类 最高分 最低分 专业 科类 最高分 最低分 社会学 理 哲学 文 网络与新媒体 理 社会学 文 公共事业管理 理 翻译 文 经济学 理 网络与新媒体 文

安徽 专业 科类 最高分 最低分 专业 科类 最高分 最低分 社会学 理 哲学 文 网络与新媒体 理 社会学 文 公共事业管理 理 翻译 文 经济学 理 网络与新媒体 文 安徽 社会学 理 636 636 哲学 文 635 635 网络与新媒体 理 638 638 社会学 文 634 634 公共事业管理 理 636 636 翻译 文 636 636 经济学 理 638 638 网络与新媒体 文 634 634 国际商务 理 637 635 工商管理 文 636 636 行政管理 理 635 635 国际商务 文 635 635 信息管理与信息系统 ( 法治信息管理方向

More information

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!"# " < ABC DE c AB ^ " M F GE PQ M ""# = 摘要! "#$ %&' (!)*+,!-*.# /.01 # $ 89 :; /.012 # ' $ <= ABCD E /.01 F

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版!#  < ABC DE c AB ^  M F GE PQ M # = 摘要! #$ %&' (!)*+,!-*.# /.01 # $ 89 :; /.012 # ' $ <= ABCD E /.01 F 南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 " < ABC DE c AB ^ " M F GE PQ M ""# = 摘要! "#$ %&' (!)*+,!-*.# /.01 # 234 567$ 89 :; /.012 # ' $ ?@ ABCD E /.01 F >GH >? I'J K ABCD > LMNO > > 0PQ RI'7 > S. KTUVW XY EN

More information

第二章 : 英语词汇的形成与发展 服务 QQ: 记得要给老师评分哦 ~ 记得要做随堂考哦 ~

第二章 : 英语词汇的形成与发展 服务 QQ: 记得要给老师评分哦 ~ 记得要做随堂考哦 ~ 第二章 : 英语词汇的形成与发展 第三章 : 英语构词法 I Warming up unhappy, uniform, ex-boyfriend toothache, easy-going, eggache motel (motor+hotel), smilence, vegeteal quake(earthquake), dorm(dormitory), flu(influenza), pop(popular

More information

忠义 符号 : 论近代中国历史上的关岳祀典 作者 : 田海林, 李俊领, Tian Hailin, Li Junling 作者单位 : 田海林,Tian Hailin( 山东师范大学历史与社会发展学院, 山东济南,250014), 李俊领,Li Junling( 中 国社会科学院近代史研究所, 北京,100006) 刊名 : 山东师范大学学报 ( 人文社会科学版 ) 英文刊名 : Journal of

More information

省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 专业成绩 美术学 ( 地方免费师范生 ) 综合成绩 提前艺术体育本 科 提前一批本科 体育 ( 文 ) 体育 ( 理 ) 文史 体育教育 ( 地方免费师范生 ) 专

省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 专业成绩 美术学 ( 地方免费师范生 ) 综合成绩 提前艺术体育本 科 提前一批本科 体育 ( 文 ) 体育 ( 理 ) 文史 体育教育 ( 地方免费师范生 ) 专 省份批次科类录取专业招生数 录取 最低分 备注 艺术 音乐学 ( 地方免费师范生 ) 31 81.1 专业成绩 美术学 ( 地方免费师范生 ) 30 593.7 综合成绩 提前艺术本 科 提前一批本科 ( 文 ) ( 理 ) 教育 ( 地方免费师范生 ) 12 67.4 专业成绩 社会指导与管理 5 67.4 专业成绩 教育 33 61.9 专业成绩 教育 ( 地方免费师范生 ) 15 68.9 专业成绩

More information

第 期徐双胄 等 从语法范畴看语言与认知的关系 一 语言类型论 奥古斯特 施莱谢尔在 以系统的观点看欧洲语言 这本书中 确立了屈折语 黏着语和孤立语三种语言类型 孤立语是每个词由很低词素率组成的语言 在极端情况下 词由一个词素构成 以语法上没有形态变化为特征 如汉语 越南语等 黏着语的概念由洪堡特提

第 期徐双胄 等 从语法范畴看语言与认知的关系 一 语言类型论 奥古斯特 施莱谢尔在 以系统的观点看欧洲语言 这本书中 确立了屈折语 黏着语和孤立语三种语言类型 孤立语是每个词由很低词素率组成的语言 在极端情况下 词由一个词素构成 以语法上没有形态变化为特征 如汉语 越南语等 黏着语的概念由洪堡特提 第 卷 第 期 年 月 上海理工大学学报 社会科学版!! " #! $%&% '!% 从语法范畴看语言与认知的关系 徐双胄 王 斌 上海理工大学外语学院 上海 摘要 在认知科学领域 将分类的心理过程称为 范畴化 范畴化的结果是认知范畴 对于现实世界同样的现象 不同民族选择不同的认知视角 采用不同的认知方式进行概念化 这就产生了不同的语义结构 语义结构很大程度上决定语法 语法是概念内容的结构化 那么语法范畴就可以成为衡量语言发展和人类认知方式的标准

More information

少数民族语言信息化推进民族地区农牧业发展研究

少数民族语言信息化推进民族地区农牧业发展研究 少数民族语言机器翻译资源与技术瓶颈 李淼 中国科学院合肥物质科学研究院智能机械研究所 2012-09-20 西安 报告提纲 一 少数民族语言机器翻译现状 二 资源瓶颈 三 技术瓶颈 四 实验室工作简介 五 总结 : 一些可借鉴的工作 一 少数民族语言机器翻译现状 研究主要集中于藏 蒙 维等少数几种语言 藏 1995 年, 陈玉忠 李延福等实现了汉藏科技机器翻译系统的原型系传统农业统 ; 2000 年,

More information

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,,

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, 吴亦明 : '. ',,, -,,, -,., -..., -. - -.,, ( ),,,,,,,,,,,,,,,, :,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, ,,,,,,,,,,,,,.

More information

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管 海南热带海洋学院 2018 年普通高考招生计划录取数 专业省份 录取数 计划数 本科 4093 4093 安徽 132 132 普通本科 102 102 财务管理 3 3 电子商务 3 3 电子信息科学与技术 3 3 海事管理 3 3 海洋技术 3 3 海洋渔业科学与技术 3 3 海洋资源与环境 2 2 汉语言文学 3 3 化学 2 2 环境工程 4 4 会展经济与管理 3 3 计算机科学与技术 3

More information

16 阿迪力 阿卜来提 男 维吾尔族 本科学士 大连交通大学 17 阿迪力江 艾木肉拉 男 维吾尔族 硕士研究生 新疆师范大学 18 阿地力江 马合木提 男 维吾尔族 本科学士 和田师范专科学校 19 阿尔孜古丽 阿卜拉 女 维吾尔族

16 阿迪力 阿卜来提 男 维吾尔族 本科学士 大连交通大学 17 阿迪力江 艾木肉拉 男 维吾尔族 硕士研究生 新疆师范大学 18 阿地力江 马合木提 男 维吾尔族 本科学士 和田师范专科学校 19 阿尔孜古丽 阿卜拉 女 维吾尔族 1 阿巴斯江 阿不都艾尼 男 维吾尔族 1980.12 本科学士 天津师范大学援疆办 2 阿卜杜热合曼 达尼亚尔 男 维吾尔族 1991.04 硕士研究生 石河子大学 3 阿卜杜热合曼江 图尔荪 男 维吾尔族 1994.04 本科学士 大连理工大学 4 阿卜杜热黑木 阿卜力孜 男 维吾尔族 1989.12 本科学士 墨玉县北京中学 5 阿卜杜威力 阿卜杜喀迪尔 男 维吾尔族 1994.07 本科学士

More information

维吾尔语形态词汇解码的频率效应

维吾尔语形态词汇解码的频率效应 Modern Linguistics 现代语言学, 2017, 5(4), 366-374 Published Online November 2017 in Hans. http://www.hanspub.org/journal/ml https://doi.org/10.12677/ml.2017.54049 Frequency Effects of Uyghur Morphological

More information

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!"#$%&' ()*+,-./* :; 1 < #D.E? FGAH!" BI7JK LM.NO F

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!#$%&' ()*+,-./* :; 1 < #D.E? FGAH! BI7JK LM.NO F 南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!"#$%&' ()*+,-./*+01. 23456789:;1 < =>?

More information

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55

省份 浙江 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 本一批 少数民族预科班 国防生 55 厦门大学 2008 年本科招生录取分数一览表 省份 批次 文科理科重点线出档线最高分最低分平均分录取人数重点线出档线最高分最低分平均分录取人数 北京 本一批 515 534 610 548 573.3 22 502 525 649 508 593.1 54 广东 本一批 570 603 639 603 617.3 24 564 590 642 596 613 65 本一批 528 577 610 577

More information

依力亚司 艾尼完 男 环境工程技术 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 阿卜杜凯尤木 阿布力米提 男 环境工程技术 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 拉扎特 巴依木拉提 女 环境工程技术

依力亚司 艾尼完 男 环境工程技术 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 阿卜杜凯尤木 阿布力米提 男 环境工程技术 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 拉扎特 巴依木拉提 女 环境工程技术 新疆轻工职业技术学院 2018 年单独招生考试民语言考生面试资格名单 序号 报名序号 姓名 性别 报考专业 考试地点 1 24731660099 努尔特列克 叶尔卡提 男 环境工程技术 伊犁州考点 ( 伊犁州财贸学校新校区 ) 2 24731660104 阿依达娜 努尔兰别克 女 环境工程技术 伊犁州考点 ( 伊犁州财贸学校新校区 ) 3 24731660105 叶力夏提 赛热克巴依 男 环境工程技术

More information

,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - ); (. ),, (, : ),,,,,,,,,, (

,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - ); (. ),, (, : ),,,,,,,,,, ( * 华东地区 县乡镇政府机构改革的个案研究 王 波 :,.,,.,... - ',. - 1,,,,,,,,,,,,,, :, ;,, ;,,, *, 1 ,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - );

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系 电子科学技术 Electronic Science & Technology 电子科学技术第 02 卷第 05 期 2015 年 9 月 Electronic Science & Technology Vol.02 No.05 Sep.2015 年 一种卫星遥测在线状态监测及分析系统的设计 董房 1,2, 刘洋 2, 王储 2 2, 刘赞 (1. 上海交通大学, 上海,200240; 2. 上海卫星工程研究所,

More information

by 1 2 3 4 5 6 7 x 1,,x n n n X Y Z t T t T Y Y (X) X Z Z (X) X f (Y ) f : Y R g(z) g : Z R Y Ŷ Z Ẑ d( ) δ M N 1 1.1 X X Y Y Z Z t t T Y f : Y R Y Z g : Z R Z X X Ŷ = arg max f (Y ) Y (X) (X) X

More information

公共事业管理 理 政治学与行政学 文 国际政治 理 法学 ( 涉外法律人才培养模式实验班 ) 文 法学 ( 涉外法律人才培养模式实验班 ) 理 社会工作 文 德语 理 英语 文 628 6

公共事业管理 理 政治学与行政学 文 国际政治 理 法学 ( 涉外法律人才培养模式实验班 ) 文 法学 ( 涉外法律人才培养模式实验班 ) 理 社会工作 文 德语 理 英语 文 628 6 安徽 社会学 理 606 606 哲学 文 610 610 网络与新媒体 理 607 607 社会学 文 610 610 公共事业管理 理 606 606 翻译 文 611 611 经济学 理 611 611 网络与新媒体 文 611 611 国际商务 理 609 606 工商管理 文 612 612 行政管理 理 609 609 国际商务 文 611 611 信息管理与信息系统 ( 法治信息管理方向

More information

2014 年度军队文职人员招聘信息

2014 年度军队文职人员招聘信息 序号 1 军事交通学院讲师 研究生 : 新闻传播学本科 : 新闻传播学类 天津 022-84657561 2 军事交通学院讲师 研究生 : 俄语语言文学本科 : 俄语 天津 022-84657561 3 军事交通学院讲师 1 硕研以上音乐与舞蹈学天津 022-84657561 4 军事交通学院药师 研究生 : 药学本科 : 药学类 天津 022-84657561 5 军事交通学院护师 3 大专以上

More information

Microsoft Word - specification_PKU.doc

Microsoft Word - specification_PKU.doc 现代汉语语料库加工规范 词语切分与词性标注 1999 年 3 月版 北京大学计算语言学研究所 1999 年 3 月 14 日 ⒈ 前言北大计算语言学研究所从 1992 年开始进行汉语语料库的多级加工研究 第一步是对原始语料进行切分和词性标注 1994 年制订了 现代汉语文本切分与词性标注规范 V1.0 几年来已完成了约 60 万字语料的切分与标注, 并在短语自动识别 树库构建等方向上进行了探索 在积累了长期的实践经验之后,

More information

密级 : 硕士学位论文 黏着语神经网络语言模型研究 作者姓名 : 指导教师 : 顾茂杰 刘群研究员 中国科学院计算技术研究所 学位类别 : 学科专业 : 研究所 : 工学硕士 计算机软件与理论 中国科学院计算技术研究所 2017 年 5 月 Language Modelling for Agglutinative Languages By MaoJie Gu A Dissertation Submitted

More information

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W

义信息, 构建了词模式嵌入模型 目前没有公开的 大型的中文上下位数据库, 本文提出上下位关系数 据构建方法, 数据构建主要根据同义词词林与 NLPCC-2017 测评数据, 添加部分人工构建工作 本文构建了 个词语对的汉语上下位数据库 1 相关工作 1.1 语料库构建 在英语数据中, W http://kns.cnki.net/kcms/detail/11.2442.n.20180822.1814.010.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2018.055 基于词模式嵌入的词语上下位关系分类 孙佳伟 李正华 陈文亮张民

More information

经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 国际贸易学 非在职 经济管理学院 国

经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 金融学 非在职 经济管理学院 国际贸易学 非在职 经济管理学院 国 考试编号 录取学院 录取专业 录取类别 100023111502601 林学院 林业 非在职 100023122409117 人文学院 马克思主义基本原理 非在职 100033005000092 环境科学与工程学院 环境工程 非在职 100033069001339 人文学院 哲学 非在职 100033069110101 人文学院 哲学 非在职 100033070108695 人文学院 哲学 非在职

More information

厦门大学2003年陕西省本一批录取情况统计表

厦门大学2003年陕西省本一批录取情况统计表 厦门大学 2003 年各省分专业招生录取分数统计表 北京天津河北山西内蒙古辽宁吉林黑龙江 上海 江苏 浙江 安徽 江西 山东河南 湖北 湖南 陕西 甘肃 青海 宁夏 新疆广西 海南 重庆 四川 贵州 云南 厦门大学 2003 年北京市本一批录取情况统计表 科类专业录取人数最低分最高分平均分 文史 经济学 3 519 557 536.8 国际经济与贸易 2 528 532 530 ( 共 21 人 )

More information

对于中文信息处理中若干观点之探讨

对于中文信息处理中若干观点之探讨 统计和规范中的误区 宋柔北京语言大学 songrou@blcu.edu.cn 1. 关于统计方法 随着计算机硬件的飞速进步以及文本数量的海量增长, 自然语言处理中的统计方法越来越受到青睐 统计方法的确有其不可替代的优势, 但盲目使用统计公式却不问其适用条件的倾向却是一种误区 在关于自然语言处理统计方法的论文 教科书中, 我们常常看到一些概率演算公式 比如, 讲解汉语统计分词的原理时, 概率演算过程如下

More information

刘春辉.tpf

刘春辉.tpf 第卷第期燕山大学学报年月文章编号 :1007-791X (2009) 02-0124-06 基于优化最大匹配与统计结合的汉语分词方法 刘春辉, 金顺福, 刘国华, 李 颖 ( 燕山大学信息科学与工程学院, 河北秦皇岛 ) 摘要 : 汉语自动分词是中文信息处理的前提, 如何提高分词效率是中文信息处理技术面临的一个主要问题 基于词典和基于统计的分词方法是现有分词技术的主要方法, 但是前者无法处理歧义字段,

More information

Ch. 9 代词后缀 [Pronominal Suffixes] 目标 9-1 能够翻译有代词后缀的名词和介词并识别 : 词典形 数及名词可能的性 后缀的类 (type) 性 数及人称 例 : א ח ינוּ 是 אח MP+1cp (type 2) our brothers 例 : ל is +

Ch. 9 代词后缀 [Pronominal Suffixes] 目标 9-1 能够翻译有代词后缀的名词和介词并识别 : 词典形 数及名词可能的性 后缀的类 (type) 性 数及人称 例 : א ח ינוּ 是 אח MP+1cp (type 2) our brothers 例 : ל is + Ch. 9 代词后缀 [Pronominal Suffixes] 目标 9-1 能够翻译有代词后缀的名词和介词并识别 : 词典形 数及名词可能的性 后缀的类 (type) 性 数及人称 例 : א ח ינוּ 是 אח MP+1cp (type 2) our brothers 例 : ל is + ל 2ms (type 1) to you (ms) 把代词后缀作为词汇掌握 制作单词卡 选作 : 把它作为

More information

龚依玲 女 汉族 乌鲁木齐市一中 苏雪琦 女 汉族 乌鲁木齐市一中 杨宸博 男 汉族 乌鲁木齐市一中 李子葳 男 汉族 乌鲁木齐市一中 01

龚依玲 女 汉族 乌鲁木齐市一中 苏雪琦 女 汉族 乌鲁木齐市一中 杨宸博 男 汉族 乌鲁木齐市一中 李子葳 男 汉族 乌鲁木齐市一中 01 01111010001 李天山 男 汉族 0101101 乌鲁木齐市一中 01111010002 何令芸 女 汉族 0101101 乌鲁木齐市一中 01111010003 李子恒 男 回族 0101101 乌鲁木齐市一中 01111010004 梁小禹 女 汉族 0101101 乌鲁木齐市一中 01111010005 陈叶无霜 女 汉族 0101101 乌鲁木齐市一中 01111010006 苏喆

More information

湖南师范大学硕士学位论文一夫一妻制的伦理思考姓名 : 任晓晴申请学位级别 : 硕士专业 : 伦理学指导教师 : 李桂梅 20061101 一夫一妻制的伦理思考 作者 : 任晓晴 学位授予单位 : 湖南师范大学 被引用次数 : 1 次 本文读者也读过 (9 条 ) 1. 谭永一夫一妻制的哲学基础

More information

未命名

未命名 一个汉英机器翻译系统的计算模型与语言模型 * 刘群 + 詹卫东 ++ 常宝宝 ++ 刘颖 + ( + 中国科学院计算技术研究所二室北京 100080) ( ++ 北京大学计算语言学研究所北京 100871) 摘要 : 本文介绍我们所设计并实现的一个汉英机器翻译系统 在概要介绍本系统的主要目标和设计原则的基础上, 着重说明系统的计算模型和语言模型, 最后给出实验结果和进一步的打算 关键词 : 自然语言处理机器翻译中文信息处理一

More information

无论中国的传统学术还是西方的大学制度 因 修道 之旨而生 教化 之需的轨迹是颇为相似的 正如中国的 小学 是为 大学 的读经作准备 欧洲中世纪大学的 人文学科 也是要帮助凡人理解神圣的文本 在西方 进一步使语言成为民族国家的根本标志 并通过强势族群与强势语言的共生互动 为后世的殖民扩张提供了基本 原型 中国早期教会大学对于语言的选用 当代西方国家的相关语言政策 也都可以成为语言标准之统治性力量的生动例证

More information

43 萨伊普加玛丽 麦麦提明 人力资源管理 44 艾力夏提 巴拉提 计算机网络技术 45 阿丽米热 艾海提 食品营养与检测 46 奴尔比亚 阿不力肯 法律事务 47 阿布都拉 玉山

43 萨伊普加玛丽 麦麦提明 人力资源管理 44 艾力夏提 巴拉提 计算机网络技术 45 阿丽米热 艾海提 食品营养与检测 46 奴尔比亚 阿不力肯 法律事务 47 阿布都拉 玉山 新疆轻工职业技术学院 2018 年单独招生考试双语班预录取考生名单公示 序号 姓名 报名序号 预录取专业 1 古丽米热 艾则孜 28191240180 食品营养与检测 2 艾孜买提 艾尼瓦尔 32491410022 法律事务 3 努尔 艾合买提 29291100067 会计 4 祖力亚尔 阿卜拉江 24291120048 酒店管理 5 如克耶姆 阿卜来提 31294020093 法律事务 6 太杰力

More information

考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 )

考生编号 科目代码 科目名称 成绩 复核结果 翻译硕士英语 66 无误 翻译硕士英语 65 无误 翻译硕士英语 58 无误 日语 ( 外 ) 考生编号 科目代码 科目名称 成绩 复核结果 110659850003734 211 翻译硕士英语 66 无误 110659850004303 211 翻译硕士英语 65 无误 110659850007372 211 翻译硕士英语 58 无误 110659850009803 245 日语 ( 外 ) 65 无误 110659850005177 308 护理综合 170 无误 110659850006267

More information

,,, - % - % (, : ),, (, : ),,,, (, : ),,,. %,. %,. %,. %,. %,. %,. %, (, : - ), ( ),,,,,,,,,, ;,,? (%) , -,,,,, ( ), : (, : ) : ` ',, ; ;

,,, - % - % (, : ),, (, : ),,,, (, : ),,,. %,. %,. %,. %,. %,. %,. %, (, : - ), ( ),,,,,,,,,, ;,,? (%) , -,,,,, ( ), : (, : ) : ` ',, ; ; 李强 唐壮 :, '. -. -. -, -.. ( = ) ( = ), ( = ) ( = ).,,,,,,,, :.,.,. (, : ),,,, : ( ) ( - ) ( - ) ( - )(, ),,,, -,, ; -,, ,,, - % - % (, : ),, (, : ),,,, (, : ),,,. %,. %,. %,. %,. %,. %,. %, (, : - ), (

More information

年 月

年 月 摘 要 关键词 分类号 基础理论 之一 本文系教育部人文社科基金项目 网络引文的相关规律及其应用研究 编号 的研究成果 总第三七卷 第一九三期 年 月 引用动机 总第三七卷 第一九三期 年 月 引文分析方法 引文数据库 总第三七卷 第一九三期 分析工具 科学评价方面 年 月 总第三七卷 第一九三期 科学交流方面 年 月 总第三七卷 第一九三期 杨思洛湘潭大学公共管理学院知识资源管理 系讲师 年 月

More information

Abstract

Abstract RC23590 (C0504-006) April 22, 2005 Computer Science IBM Research Report A Combination Training Framework for Domain-Specific Nominal Entity Recognition Hong Lei Guo, Zhi Li Guo IBM Research Division China

More information

<4D F736F F D20A1B6CFD6B4FABABAD3EFB9E6B7B6D3C3B7A8B4F3B4CAB5E4A1B7C6C0BDE92E646F63>

<4D F736F F D20A1B6CFD6B4FABABAD3EFB9E6B7B6D3C3B7A8B4F3B4CAB5E4A1B7C6C0BDE92E646F63> 语文词典中的语法功能描写 兼评 现代汉语规范用法大词典 王惠 新加坡国立大学中文系 chswh@nus.edu.sg 一 引言 汉语的语文词典自古以来都很重视词语的形 音 义的标注 而实际上, 在确定一个词的信息量时, 单靠这三个要素是不够的 一个词除了具备这三者以外, 还有一个很重要的因素 词在一定语言环境中所能发挥的能力与作用, 即词的功能或用法 词的意义和词的用法有着密切的关系 词典的任务就是帮助读者了解词义,

More information

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用 第 卷 第 期 年 月 交通运输工程学报 曹 源 唐 涛 徐田华 穆建成 为了确保列车运行控制系统设计和开发的正确性 比较了仿真 测试和形式化 种能够验证 系统设计正确性的方式 根据列车运行控制系统对安全的苛求性 提出了 个与系统安全相关的重要特性 即实时性 混成性 分布 并发 性 反应性 并分析了与这些特性相关的具体形式化方法 通 过对每种形式化方法的数学基础和应用范围的分析和归类 给出了各种方法的优势和不足

More information

《中文信息学报》投稿模版

《中文信息学报》投稿模版 基于多策略的维吾尔文网页识别方法 阿力木 木拉提 1,2,3, 艾孜尔古丽 4, 杨雅婷 1,2, 李晓 (1. 中国科学院新疆理化技术研究所, 乌鲁木齐 830011;2. 新疆民族语音语言信息处理重点实验室, 乌 鲁木齐 830011;3. 中国科学院大学, 北京 100049;4. 新疆师范大学计算机科学技术学院, 乌鲁木齐 830054) 摘要 : 经过对大量维吾尔文网站的调查与分析, 本文从多语种混合网页中针对维吾尔文网页识别进行了研

More information

热比耶姆 图尔迪 女 服装设计与工艺 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 祖丽皮艳木 艾则孜 女 服装设计与工艺 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 穆乃外尔 米吉提 女 服装设计与工艺 乌

热比耶姆 图尔迪 女 服装设计与工艺 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 祖丽皮艳木 艾则孜 女 服装设计与工艺 乌鲁木齐市考点 ( 新疆轻工职业技术学院 ) 穆乃外尔 米吉提 女 服装设计与工艺 乌 新疆轻工职业技术学院 2018 年单独招生考试双语班考生面试资格名单 序号 报名序号 姓名 性别 报考专业 考试地点 1 24191810051 努尔夏提 都德拜 男 机电一体化技术 伊犁州考点 ( 伊犁州财贸学校新校区 ) 2 24191810134 阿勒德 哈斯尕 男 机电一体化技术 伊犁州考点 ( 伊犁州财贸学校新校区 ) 3 24791660079 阿依波塔 巴合提 女 应用化工技术 伊犁州考点

More information

分层次构建汉语树库

分层次构建汉语树库 分阶段构建汉语树库 周强 1, 任海波 2, 孙茂松 1,3 清华大学计算机系 2 上海师范大学 智能技术与系统国家重点实验室 国际文化交流学院 北京 100084 上海 200234 zhouq@s1000e.cs.tsinghua.edu.cn, renhb@shtu.edu.cn lkc-dcs@mail.tsinghua.edu.cn 3 摘要 : 本文介绍了一种分阶段构建汉语树库的研究思路

More information

Microsoft Word - FengZhiWei doc

Microsoft Word - FengZhiWei doc Journal of Chinese Language and Computing, 2002, Vol.12, No.1, pp.43-62 43 中国语料库研究的历史与现状 冯志伟教育部语言文字应用研究所朝内南小街 51 号 100010 北京, 中国 e-mail: zwfengde@public.bta.net.cn 2001 年 11 月 25 日提交,2002 年 7 月 25 日修改

More information

上海理工大学学报 社会科学版 年第 卷 的话题 本研究以德语教学为例 力求解决上述问题 选择德语教学作为研究对象的优点在于 两种模式的培养对象均为零起点 无需进行前期测试 研究结果可信度高 同时 以同济大学德语专业和以德语作为第一外语 第一 指语言的重要性 不指语言的习得顺序 的德语强化教学为例 后

上海理工大学学报 社会科学版 年第 卷 的话题 本研究以德语教学为例 力求解决上述问题 选择德语教学作为研究对象的优点在于 两种模式的培养对象均为零起点 无需进行前期测试 研究结果可信度高 同时 以同济大学德语专业和以德语作为第一外语 第一 指语言的重要性 不指语言的习得顺序 的德语强化教学为例 后 第 卷 第 期 年 月 上海理工大学学报 社会科学版!! " #! $%&% ' % 一项语言能力与培养模式的相关性研究 黄崇岭 石丽荣 同济大学外国语学院 上海 摘要 针对不同的培养模式会否导致培养对象的语言能力差异的问题 以同济大学德语专业学生和以德语作为第一公共外语的强化班两组学生作为受试 就其词汇能力 形态和句法能力进行了测试和研究 结果表明 德语专业的学生在词汇使用上不论数量还是质量都略胜一筹

More information

中国人民大学哲学系 北京 哲学是民族化 个性化的 只有民族的语言 才能建构与这种民族的语言形 式相适应的哲学形态 和合语言哲学力图在语言结构与民族文化 民族精神融突而和合的基点上运用并整合言 象 意范畴 语言符号与形象是言与象的关系 言 象与意义 意境是 言与意 象与意的关系 言尽象与不尽象 言尽意与不尽意的争论 以及由 得象忘言 得 意忘象 而推致 得意忘言 历来见仁见智 在和合语言哲学语境中 尽与不尽

More information

Microsoft Word - 绋稿.docx

Microsoft Word - 绋稿.docx 第 ** 卷第 * 期 中文信息学报 Vol. **,No. * 201* 年 * 月 JOURNAL OF CHINESE INFORMATION PROCESSING ***.,201* 文章编号 :1003-0077(2018)00-0000-00 基于汉维映射关系构建维吾尔语依存树库 吐尔洪 吾司曼, 杨雅婷, 王磊, 周喜, 程力 (1. 中国科学院新疆理化技术研究所, 新疆乌鲁木齐 830011;2.

More information

:,,?,?,,,,,,, 1 ( ) (. ) ( ) :,?? :,,,,, ( ) (. ) : (. ) ( ),,, ( ) ( ), (. ), ( ) ( ) - (. - ) (. ) ;, (. ) ( ),, ( ),,, : ( - ), ( - - ) ( ) (. ),,,

:,,?,?,,,,,,, 1 ( ) (. ) ( ) :,?? :,,,,, ( ) (. ) : (. ) ( ),,, ( ) ( ), (. ), ( ) ( ) - (. - ) (. ) ;, (. ) ( ),, ( ),,, : ( - ), ( - - ) ( ) (. ),,, * 以徐家村为例 黄玉琴 :, -.' : '.,,??,., :,. -,,,,. : -,, - -.,, '. 1,, ( ) ( ) 2 3,,, 4 :? :,,? :,,,,,,!,,!!! :, 5, * 1 : ; : 2 :,, ;,, 3 :,, 4 :, 5 :, :,,?,?,,,,,,, 1 ( ) (. ) ( ) :,?? :,,,,, ( ) (. ) : (. )

More information