7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽

Size: px
Start display at page:

Download "7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽"

Transcription

1 - 11-%& 计算机工程与科学 7)23$$3 ; 1$ 第 卷第 % 期 年 % 月 /-%,/ 文章编号 %&%% 一种结合 和 的维吾尔文文本聚类算法 吐尔地 托合提 艾海麦提江 阿布来提 米也塞 艾尼玩 艾斯卡尔 艾木都拉 新疆大学信息科学与工程学院 新疆乌鲁木齐 摘 要 介绍了 和 聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响 在较大规模文本语料库基础上 分别用 和 的方法进行维吾尔文文本聚类实验及性能对比分析 针对经典 算法对初始聚类中心的过分依赖性及不稳定性缺点以及 的高计算复杂性 提出了一种结合 和 的维吾尔文聚类算法 本算法分两步完成聚类操作 首先是 模块从少量文本集中获取最优的初始类中心 然后是 模块对大量文本集进行快速聚类 实验结果表明 新算法在聚类准确率和时间复杂度上都有了显著的提高 关键词 维吾尔文 文本聚类 结合算法 中图分类号 文献标志码 "#"$"%&""%" " "#$% & % ()$*+,-./)+011 $1 */ 1(/)$1$23$$3&$#$3$4$)56$($ (77$))()()(/)$3)()($ 7)))8))$)(53()8)7))$/)$3$$5"9 )(/3/)8)7.)()()()(/)$3 )() 5)53()8)/)$387$)77)$4/5$"4$)( ()$3)())()($47))($$)$//))$).// )(($3(7))$/7/8$)5)( )()($777753()8)/) $3/3$)(.$$3)()()("(77/3$)(())7" :$)/5)(7)$/$$)$//))$.)$)(/))8)).5)( )("1/5)(/3))8))$)/).5)()("287$)/ /)()())(77/3$)( ($3$$)$)(/)$35)( )$7/8$)5" $53()8))8)/)$3.$/3$)( 引言 随着新疆地区信息化建设的快速发展 维吾 尔文等少数民族语种大量的文字信息开始以数字化形式呈现 或过去积累的海量纸质文字信息开始数字化存储 众多应用领域都需要通过计算机自动归类的方法去整合及有效利用海量文本信息 因 收稿日期 % 修回日期 基金项目 国家自然科学基金资助项目 新疆维吾尔自治区高技术研究发展计划项目 新疆维吾尔自治区高校科研计划重点项目 &,2 教育部新世纪优秀人才支持计划资助项目 -2 通讯地址 新疆乌鲁木齐市胜利路 号新疆大学信息科学与工程学院 号楼 室 9$/$31(/)$1$23$$3&$#$3$4$)51(3/$6$ &$#$3""($

2 7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽可能相似而不同组内的数据尽可能不同 其目的是揭示数据分布及内在联系的真实情 况 对中英文来说 技术方法早已成熟 但维吾尔文等少数民族语种文字特点与中英文不同 我们无法直接套用现有的中英文方法 这就需要从不同语言文字特点出发开展系统的理论研究及算法研究 进行仿真实验及评测 在此基础上进行必要的改进或优化 本文在较大规模文本语料库基础上 用向量空间模型 1+)17 +/ 表示文本 以 75)( 为开发平台 分别设计并实现了基于 和 /)$4 /)$3 的维吾尔文本聚类算法 并进行了仿真实验及评测 同时 结合这两种算法的优缺点 实现了一种划分和层次方法相结合的维吾尔文文本聚类算法 给出了其结合前后的实验及评价结果 维吾尔文文本预处理及文本表示 文本聚类系统中 首先要对待聚类的每一篇文本进行分词 去除停用词等必要的预处理 然后使用某一种文本表示模型对文本进行表示 就是把文本表示成计算机可计算的形式 最后采用某一种聚类算法对文本集进行聚类 因此 针对不同语言文本的语言特征 要进行一些必要的处理 建立一个较好的文本模型是文本聚类系统的关键 它会直接影响聚类效率 分词及停用词过滤 维吾尔文属于阿尔泰语系突厥语族 由 个字母组成 是一种拼音文字 与英文类似 词间是空格隔开 因此将文本中的标点符号和非维吾尔文字符去除之后 以空格作为自然分隔符很容易获取文本单词集 文本聚类中 从文本得到的单词集还不能作为特征集来表示文本 因为它包含文本集各类文本中普遍出现的通用词和弱词性词 这类词区分类别的能力普遍很弱甚至没有任何文本标引作用 被称为停用词 因此 需要建立一个停用词表 并按照此表从单词集中过滤所有的停用词 从而降低特征空 间维数 减少噪音 停用词的定义在文本聚类领域尚未达成共识 根据文本分类涉及的具体领域和研究的需要 可以自行建立停用词表 在维吾尔文文本聚类研究工作中 我们在较大规模文本集 类 篇文本 的基础上 以人工统计的方式建立如表 所示的停用词表 用于过滤单词集中的停用词 #$% 表 维吾尔文停用词表 词性维吾尔文停用词助词连词副词量词代词数词叹词 词干提取维吾尔文文本聚类中 词干提取是文本预处理 中的关键 它会极大地影响聚类效率 因为 维吾尔文中的一个词 常会以不同词形 词干 构形词缀 在同类文本中多次出现 词干是词去掉构形附加成分后剩下的部分 它包含着词的词汇意义 以词干作为特征项 一方面可以进一步缩小单词集大小 降低特征空间维数 比如说 一个文本由同词干不同构形后缀的词集 在学校 从学校 学校的 往学校 把学校 组成 这些词的本质含义就在于其词干 学校 如以词作为特征项 那么文本在向量空间中的位数是 如以词干作为特征项 那么该文本在向量空间中的位数降到 另一方面 能够有效排除构形词缀对文本相似度计算的消极影响 假如 以上 个词按整词看待 那就是完全不同的 个特征项 如提取其词干 那么完全是同一个特征项 出现这些词干的文本之间存在一定的相似性 中文的分词问题 在维吾尔文中不是一个关键技术 而其难点在于词干的切分 因为维吾尔文是一种黏着语 词缀连接词干产生的词法变化较复杂 如元音弱化 辅音弱化 元音脱落等 这就增加了词干提取的难度和算法复杂度 在研究中 我们深入研究维吾尔文词法规则 用规则及统计语言模型结合的方法 实现了一种高切分准确率的维吾尔

3 吐尔地 托合提等 一种结合 和 的维吾尔文文本聚类算法 文词干提取算法 软件登记号 1 并将其引用到文本聚类的词干提取中 获取了基于词干的特征集 有效降低了特征空间维数 本文实验中 我们将 类 篇文本作为实验数据 分别以词和词干作为特征表示文本 进行对比 词和词干特征下的 1+ 向量维数对比如图 所示 :$31+53() 图 维吾尔文词及词干 1+ ( 文本表示文本表示的模型有多种 如布尔模型 概率模型 向量空间模型和潜在语义索引等 不同的模型有不同的理论基础和性能特征 在效率和计算复杂性上也有所区别 其中 向量空间模型 1+ 构造简单 系统易于实现 还提供了简单的计算特征项权重的方法 通过调节对应权重的大小来反映特征项与所在文档的相关程度 易于对向量进行修改 目前被广泛接受 本文也是用向量空间模型来表示维吾尔文文本 经过将待聚类的每一篇文本转换成词干集的形式之后 采用某种权重计算函数计算出每一个词干在文本中的权值 然后把权值大于一定值的词干作为特征向量依次加入向量空间中 而权重小于给定值的词干不予考虑 常用的权重计算函数有布尔函数 频度函数 开根号函数 对数函数 熵函数及 :: 函数 其 中 :: 函数作为特征权值函数在文本处理领域应用广泛 并且取得了不错的效果 本文也是通过 :: 函数来计算特征项 词干 权重 根据向量空间模型的相关概念 定义文档 ) 为一个文本文档并记为 定义特征项 为文档中所含有的基本语言单位 本文中为词干 并记为 定义特征项权重 $3() 为表示特征项在文档中的重要程度并记为 对于含有 个特征项的文档 如果特征项 的权重用 表示 那么文档就可用 表示 简记为 那么表示特 征项 对文档 的重要程度 就可用 表示 其计算公式是 其中 表示特征项 在文档 中出现的次数 值越高 意味着特征项 对于文档 越重要 表示特征项的反比文档频数 值越高意味着特征项 对于文档的区别作用越大 /3 其中 是全部文档的总数量 表示包含特征项 的文档数量 值越高 意味着特征项 在衡量文档之间相似性方面的作用越低 如果一个特征项 仅出现在一个文档中 则 /3 如果一个特征项 出现在所有的文档中 则 /3 为防止出现 的意外 常用 /3 其中 为常数 通常取一个比较小的值 如 " 作为影响因子 防止分母出现 的情况发生 另外 还应考虑到文档的长度 对公式 归一化调整后得到 槡 ( 文本聚类算法 /3 /3 聚类算法是一种无监督机器学习算法 其实质就是对我们事先不了解的数据集进行分组 使得同一组内的数据尽可能相似而不同组内的数据尽可能不同 其目的是揭示数据分布的真实情况 目前已有很多聚类算法可供选择 如基于划分的聚类方法 $-1 等 基于层次的聚类方法 2(/ 等 基于密度的聚类方法 等 基于网格的聚类方法 <=24/) 1- 等 基于神经网络的聚类方法 1+ 等 这些算法都有各自的优点和缺点 几种常用的文本聚类算法性能对比如表 所示 从表 中可以看出 91-<=2 1+ 等算法 因为较低的聚类质量和准确率 特征空间的高维性 较高的计算复杂度等缺点 很难满足大规模数据集的聚类需求 算法 以其极高的准确率 较低的特征维数及聚类粒度的灵活性强等聚类能力 在聚类算法中被排在前列 但其高计算性的缺点 使算法在大规模文本聚类中没能得到广泛应用 算法 收敛速度快 能扩展以用于大规模的数据集 但对 值的选择没有准则可依循 聚类结构可能不平衡 也很难得到较

4 7)23$$3 ; 1$ 计算机工程与科学 % )""$%% 表 常用聚类算法性能对比 算法 效率 聚类对象形状 噪音及异常数据的敏感性 数据输入顺序的敏感性 高维性 计算复杂度 一般 凸形 敏感 不太敏感 一般 较低 较高 任意形 不敏感 不太敏感 一般 较高 91- 一般 任意形 敏感 敏感 一般 较高 <=2 较低 凸形或球形 一般 不太敏感 高 较高 1+ 一般 任意形状 敏感 敏感 高 较高 高的聚类效率 根据以上算法的综合性能 本文选择了 和 算法 对维吾尔文文本进行聚类分析 并在两种算法的优缺点上找到了一种巧妙的结合 从而在准确率和时间复杂度的综合性能上 得到一定的提高和改善 ( 聚类算法 在算法的开始 首先从待聚类的数据点集合中随机选取 是由用户指定 个数据点作为初始的聚类中心 然后 计算每个数据点与各个种子聚类中心之间的距离 把每个数据点分配给距离它最近的聚类中心 一旦全部数据点都被分配完了 每个聚类的聚类中心会根据聚类中现有的数据点被重新计算 这个过程将被不断重复直到满足某个终止条件 终止 收敛 条件可以是以下 的任何一个 没有 或最小数目 数据点被重新分配给不同的聚类 没有 或最小数目 聚类中心再发生变化 误差平方和 112 局部最小 $"% "# 其中 表示给定的聚类数目 # 表示第 个聚类 % 是聚类 # 的聚类中心 # 中所有数据点的均值向量 $"% 表示数据点 " 和聚类中心 % 之间的距离 在欧氏空间中 聚类的均值可以用以下公式计算 % # " # " 其中 # 表示 # 中的数据点的个数 数据点 " 和聚类均值 % 之间的距离可以被计算如下 $" % " &% 槡 " &% " &% " &% 聚类的特点是使各聚类本身尽可能地紧凑 而各聚类之间尽可能地分开 从而得到同 一聚类中的对象相似度较高 而不同聚类中的对象相似度较小 ( 聚类算法 是属于自底向上的凝聚层次聚类算法 这种方法首先将每个数据点作为一个簇 然后合并这些原子簇为越来越大的簇 直到所有的数据点都在一个簇中 或者某个终结条件被满足 给定要聚类的 个对象 数据点 以及 的距离矩阵 或者是相似性矩阵 聚类方法的基本 % 步骤如下 * 将每个对象归为一类 共得到 类 每类仅包含一个对象 类与类之间的距离就是它们所包含的对象之间的距离 这里定义距离为类间数据两两距离的平均值 用组平均距离 7 43<$>3 来度量类间距离 其公式为 43 & * 找到最接近的两个类并合并成一类 总类数减少一个 *( 重新计算新的类与所有旧类之间的距离 *+ 重复 1)7 和 1)7 直到最后合并成一个类为止 此类包含了 个对象 (( 和 的结合 聚类初始中心的选择对古典 算法非常重要 初始中心选择不当会使迭代很快结束 使聚类陷入局部最优解 并且随机选择的初始中心会带来聚类结果的波动 因此 很多学者也针对初始中心的选择问题作了较深入的研究并提出了一些 有效的改进方法 在一定程度上提高了聚类效果 古典 算法的缺点就是过分依赖于初始类中心 但它在算法简单易于实现 快速处理大量数据等方面很有优势 因此它作为划分聚类中的代表性算法被广泛应用 层次聚类的 算法中不牵涉到初始类中心选择问题 稳定性好 但

5 吐尔地 托合提等 一种结合 和 的维吾尔文文本聚类算法 对大量数据的高计算性也是评价算法性能时的一个不足之处 本文针对古典 算法的不稳定性及 算法的高计算性采取一种前后互补平衡的方法 我们实现的结合算法是两种聚类算法的巧妙结合 前端是 而后端是 因此要有对应的两种输入文本集 < <37 和 1 1/7 其中 < 是待聚类的大文本集 是后端 的输入 1 是 < 的少一部分 是前端 的输入 算法聚类过程是这样的 * 输入 1 进行 聚类 * 计算 1)7 聚类结果中的每一类的类中心 质心向量 其计算公式如下 % 其中 为 类的质心向量 为 类中的文档向量 为 类中文档的数量 *( 将 作为初始类中心输入给后端 再对文本集 < 进行 快速聚类并输出 的计算复杂性对文本量特别敏感 但稳定且准确 因此将 1 作为前端输入 在不提高时间复杂性的前提下快速获取较准确的类中心 时间复杂度较低 如不考虑对初始类中心的过分依赖性及稳定性 那么是大量文本集聚类中的最佳选择 因此 将前端输出的较优类质心向量作为初始类中心 再经过后端 快速聚类 得到了对文本集 < 较准确的聚类结果 本算法在聚类准确率 召回率及时间复杂度上都体现出了优越性 算法流程如图 所示 :$3.$)$ /3$)(753()8)/)$3 图 和 结合的维吾尔文文本聚类算法流程 + 文本聚类实验及分析 + 数据集对于中 英文的文本分类 聚类研究 国内外已经有相对标准的 开放的文本语料库 这样就可以在共同的文本集上比较不同的特征选择和聚类方法的性能 但是 文本分类 聚类研究在维吾尔文中刚刚起步 目前还没有标准 开放的文本集可供使用 所以 我们从互联网维吾尔文网站收集 篇维吾尔文文本 属于房地产 计算机 健康和体育类 每类均为 篇文本 本文为了进行对比实验 分别建立了两种实验文本集 < 和 1 < 是包含全部 篇文本的大文本集 再从 类 篇文档中选取每类 篇组成 篇文本的小文本集 1 + 评价指标常用的评价指标包括准确率 $$ 召回率 / 和 值等 准确率 聚类正确的 实际聚类的 召回率 聚类正确的 应有的 在实验中 采用以上三种指标分别衡量古典 及结合 和 的结合 算法效率的同时 本文还将算法时间复杂度看成相当重要的性能指标来评价算法 +( 聚类实验及分析本文用跨平台开发工具 75)( 分别设计并实现了古典 和结合聚类 和 的结合 的维吾尔文本聚类系统 实验是在配置为 )/ 双核 2%"*? 处理器 9 内存 操作系统为 $% 的 机上进行的 本文实验中 将文本集 < 和 作为实验数据 分别进行古典 及结合算法的文本聚类实验 其中 和 的输入是 < 而结合算法的输入是 1 和 < 实验结果及算法效率对比如表 表 所示 从表 给出的三种算法性能对比中可以看到 我们的结合算法比 算法用更短的时间 得到了比古典 更高的聚类效率 因为结合算法在这两种算法的优缺点上 找到了一种巧妙的结合

6 7)23$$3 ; 1$ 计算机工程与科学 % (%%" 类别 表 ( 古典 聚类实验结果 聚类结果原有聚类正确实际聚类 体育 " 房产 %" 健康 " " 计算机 " " 类别 +%%" 表 + 聚类实验结果 聚类结果原有聚类正确实际聚类 体育 " " 房产 % %" " 健康 " %" 计算机 % " ",%%" 类别 表, 结合算法聚类实验结果 聚类结果原有聚类正确实际聚类 体育 % % " 房产 % " 健康 " %" 计算机 % " " -)""."% 表 - 时间 %" " " " " " " " 结合算法 " " "% " 古典 中 算法从待聚类文本集中随机选取 个文本点作为初始类中心 如果被随机选的 个文本点恰恰是最优的类中心 那么得到较好的聚类效果 但是 这种可能性是不确定的 因此对同样的数据集进行多次聚类 可能得到不同的聚类结果 这是 的一个致命缺点 如果解决这种随机性 并给算法提供较优的初始类中心 在大规模文本聚类中成为一个快速 高效的聚类算法是完全可能的 是一种自底向上的层次聚类算法 根 本就不存在初始类中心的选取问题 通过较复杂的向量计算得到较高的聚类准确率 因此数据量的稍微增加也会大大延长计算时间 本文实验中 对 篇文本 1 的 聚类用时为 " 秒 而 篇文本 < 的聚类用时为 " 秒 结合算法中 前端用 算法对小规模 本实验中 篇 文本进行聚类 在不增加计算时间的前提下得到了较准确的聚类结果 并把它作为后端 的初始类中心 再对大规模 本实验中 篇 文本进行快速聚类 本算法是 和 优缺点上的一种平衡 在大规模文本聚类中 会体现出比 和 更优越的综合性能, 结束语 本文介绍了维吾尔文特点 文本预处理及文本表示方法 较深入研究 和 聚类算法思想 并在此基础上提出了一种结合 和 的维吾尔文文本聚类算法 在较大规模文本语料库基础上 分别用 和 的方法进行维吾尔文文本聚类实验及性能对比分析 综合考虑经典 算法对初始聚类中心过分依赖的缺点 以及 算法高计算性缺点 实现了两种算法前后巧妙结合的一种高效聚类算法 从实验结论得知 本文采取的方法是可行的 有效的 参考文献 1 $>1#5 ") $$3)(5 7)$+": +$3-$(353)/)$"9$ #$3($+($ "$($ $()$$$ +#>*/"5)( $653(?>535?/)8)(3$ )$4/4,"7)23$$3 %"$($ 9,$/3")$)$4/5) $3. )(4$)7/,",/)$% "$($" A(3 0331($$3<B,$"74) 77/$)$::)(.)8)/$$)$," 7)23$$3 %%"$($ <$&$3$<$,")$$3>/3$45 +"9$#$3*$3(2)$"$($ <$9$3".) $$3+"0 03&$3 *$35$)/)$"9$#$3$3($4$)5 "$($ %+&$530"(($($//)$3

7 吐尔地 托合提等 一种结合 和 的维吾尔文文本聚类算法 /3$)(,"7)1$%"$ ($ (3"8)/)$3$/)$5). $74 /3$)(,"7) 1$/)$ %%"$($ A(3 $3,$30&$#$")8) /)$3/3$)(.$)5)$3(.,",/7)77/$)$% "$($ <$0/$<$&$5"/)$3/3$)(. $)5,"7) 23$$3 77/$)$ %"$($ 附中文参考文献 1$>1#5" 数据挖掘基础教程 +" 范明 牛常勇 译 " 北京 机械工业出版社 " 吐尔地 托合提 维尼拉 木沙江 艾斯卡尔 艾木都拉 " 维 哈 柯全文搜索引擎检索器的关键技术," 计算机工程 %" 包金龙 " 基于向量空间模型的信息检索系统的设计," 情报杂志 % " 张玉芳 彭时名 吕佳 " 基于文本分类 :: 方法的改进与应用," 计算机工程 %%" 李雄飞 李军 " 数据挖掘与知识发现 +" 北京 高等教育出版社 " 刘兵 ". 数据挖掘 +" 俞勇 薛贵荣 韩定一 译 " 北京 清华大学出版社 " % 马晓艳 唐雁 " 层次聚类算法研究," 计算机科学 %" 潘大胜 " 基于改进的 算法的文本聚类仿真系统," 计算机仿真 %%" 张文明 吴江 袁小蛟 " 基于密度和最近邻的 文本聚类算法," 计算机应用 %" 刘艳丽 刘希云 " 一种基于密度的 均值算法," 计算机工程与应用 %" 作者简介 吐尔地 托合提 % 男 新疆拜城人 博士生 副教授 : 会员 + 研究方向为自然语言处理及文本挖掘 /)58#"" #01.$%( $)$)7:.+($ ($))$/)//337$3 )8)$$3" 艾海麦提江 阿布来提 男 新疆疏附人 硕士生 研究方向为自然语言处理 /.4()".$+1 $)($ ( $)) $/ )//337$3" 米也塞 艾尼玩 女 新疆莎车人 硕士生 研究方向为文本挖掘 / %%66" #**0. $ +1 $)( ( $))$ /)8)$$3" 艾斯卡尔 艾木都拉 % 男 新疆叶城人 博士后 教授 : 会员 + 研究方向为多语种信息处理 />8#"" *0 %.$%7) )7:. +($($ ))$//)$/$3/$)$7$3"

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位 自然科学版 文章编号 视网膜图像中视盘的快速自动定位方法 赵晓芳 林土胜 李碧 摘 要 基于眼底视网膜血管的分布结构及视盘本身的特点 提出一种快速自动定位视盘的方法 首先根据视网膜血管的网络分布结构大致定位视盘的垂直坐标 然后根据视盘 的亮度信息及视盘与血管的关系来定位视盘的水平坐标 最后把视盘限定在以粗定位的视盘为中心的一个小窗口内 用 变换精确定位视盘中心 该方法不需要事先分割视网膜血管 也不需要对算法进行训练

More information

第 期 房建成等 动态定位的强跟踪卡尔曼滤波研究

第 期 房建成等 动态定位的强跟踪卡尔曼滤波研究 第 卷第 期 年 月 东南大学学报 房建成万德钧吴秋平 东南大学仪器科学与工程系 南京 提出一种改进的强跟踪卡尔曼滤波算法 应用于 动态定位滤波中获得明显效果 首先采用描述机动载体运动的 当前 统计模型 建立了一种新的 动态定位扩展卡尔曼滤波模型及其自适应算法 然后 为了进一步提高滤波器的动态性能 改进了周东华等提出的强跟踪滤波器 大大提高了 动态定位扩展卡尔曼滤波器的跟踪能力 动态定位 卡尔曼滤波

More information

教学输入与学习者的语言输出 温晓虹 本文从三个方面探讨了语言的输入与输出的关系 首先从理论研究的角度讨 论了从语言输入到语言输出的习得过程 实验研究表明 输入的语言素材必须被学习者所接收 即使接收了的内容也并不会自动进入中介语的体系 而是需要进一步对输入语言进行 分解 归类等分析性与综合性的处理 在语言 内化 的基础上 学习者的中介语系统才能 够不断地得到重新组合 趋于目的语 另外 学习者在语言输出前和输出时需要调节

More information

Fig1 Theforceappliedtothetrainwhenrunning :w = w j +w q (3) :w = w = w 0 +w j (4) w i 121 基本阻力 w r = 600 R ( N/kN) (8) :R : [2] w s [3] w s =0

Fig1 Theforceappliedtothetrainwhenrunning :w = w j +w q (3) :w = w = w 0 +w j (4) w i 121 基本阻力 w r = 600 R ( N/kN) (8) :R : [2] w s [3] w s =0 31 4 2012 8 JournalofLanzhouJiaotongUniversity Vol31No4 Aug2012 :1001-4373(2012)04-0097-07 * 张友兵 张 波 ( 100073) : 分析了列车运行过程中的受力情况 给出了制动过程中减速度的计算方法 并采用正向 反向两种迭代方式计算列车制动曲线 两种方式计算出的制动曲线一致 证明了计算制动曲线的方法是正确的

More information

第四章 102 图 4唱16 基于图像渲染的理论基础 三张拍摄图像以及它们投影到球面上生成的球面图像 拼图的圆心是相同的 而拼图是由球面图像上的弧线图像组成的 因此我 们称之为同心球拼图 如图 4唱18 所示 这些拼图中半径最大的是圆 Ck 最小的是圆 C0 设圆 Ck 的半径为 r 虚拟相机水平视域为 θ 有 r R sin θ 2 4畅11 由此可见 构造同心球拼图的过程实际上就是对投影图像中的弧线图像

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

!

! 孙文凯 肖 耿 杨秀科 本文通过对中国 美国和日本资本回报率及其影响因素的计算 认为 中国居高不下的投资率是由于中国具有非常可观的投资回报 由于中国资本回报率显著高于其他大国 因此带来了 的较快速增长 三国资本回报率在过去三十年尚未出现收敛 这意味着投资率差异会持续 将持续涌入中国 资本回报率受经济周期影响 长期资本回报率遵从一个递减的趋势 由于中国的劳动者份额及资本 产出比仍处于较低的水平 中国的高资本回报率将会维持相当长一段时间

More information

实验方法

实验方法 英汉语心理词库联想反应的具体性 效应对比研究 张 萍 本研究探讨具体性效应对一语 汉语和英语 和二语 英语 心理词库联想反应的影响 依据 的认知语法理论 本文从空间概念和感官体验两个角度首次对不同词性的具体性进行定义 并用量表验证所选词的具体性程度 研究表明 具体性效应没有改变一语心理词库语义联结的特质 但对二语心理词库有一定影响 其具体词的语义 非语义反应比差远高于抽象词的语义 非语义反应比差 且抽象词的横组合反应明显示弱

More information

石油与天然气地质 杨少春 信荃麟 断块油藏测井解释模型的建立 资料的处理及储层评价应始终考虑地质因素的影响 不同类型储层 不同沉积相带以及不同开发时期的测井响应 岩性 物性 韵律性 电性及含水率等均不相同 根据这些差异和特点 分别建立了孔隙度 渗透率和含油饱和度等参数的解释模型和计算模型 提高了解释精度 勘探和开发阶段测井资料的处理除应考虑岩性 沉积相带 注水后储层结构变化外 还应考虑断块的复杂性及断块之间的联系

More information

标题

标题 第 35 卷第 期西南大学学报 ( 自然科学版 ) 3 年 月 Vol.35 No. JouralofSouthwestUiversity (NaturalScieceEditio) Feb. 3 文章编号 :673 9868(3) 69 4 一类积分型 Meyer-KiḡZeler-Bzier 算子的点态逼近 赵晓娣, 孙渭滨 宁夏大学数学计算机学院, 银川 75 摘要 : 应用一阶 DitziaṉTotik

More information

年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技

年 元 语素 例如 维吾尔语词./0,8,.'-,1*8,..5 释义 我们准备建园林 切分成语素是 因此 形态切分是维吾尔语自然语言处理领域基础且重要的任务 深度学习在自然语言处理领域中广泛应用 形态切分工作也取得了极大进展 实现了从规则和传 统统计方法向神经网络方法的跨越 然而 当前的深度学习技 第 卷 第 期 年 月!"# $ %&'& 文章编号 维吾尔语形态切分语料库 哈里旦木 阿布都克里木 孙茂松 刘洋 阿布都克力木 阿布力孜 清华大学计算机科学与技术系智能技术与系统国家重点实验室 清华信息科学与技术国家实验室 筹 北京 ( 清华大学人文学院计算语言学实验室 北京 ( 摘 要 ")!&*+,"-./0,1/.*-.))0,1*!&*+,&'&0) 0/.&/&*+1- 是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库

More information

网络民族主义 市民社会与中国外交 & 一 中国网络民族主义所涉及的公共领域 特征与性质 ( & (!! # # ) #

网络民族主义 市民社会与中国外交 & 一 中国网络民族主义所涉及的公共领域 特征与性质 ( & (!! # # ) # 世界政治 年第 期 网络民族主义 市民社会与中国外交 王 军 近年来 网络空间下中国大众民族主义逐渐成为影响中国社会和中国外交的新因素 从中国网络民族主义的政治社会属性和作用上看 它正拓展着中国的公共领域 以国家民族主义和族裔民族主义为核心议题 催生着中国市民社会的新构造 反映着中国的民族主义思潮 推动着网络内外中国大众的民族主义行动 作为一种社会思潮与社会运动 中国大众的网络民族主义因其信息获取能力增强

More information

OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数

OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数 OOP with Java Yuanbin Wu cs@ecnu OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数 复习 类的复用 组合 (composition): has-a 关系 class MyType { public int i; public double d; public char c; public void set(double

More information

况伟大 本文在住房存量调整模型基础上 考察了预期和投机对房价影响 理性预 期模型表明 理性预期房价越高 投机越盛 房价波动越大 适应性预期模型表明 当消费 性需求占主导时 上期房价越高 房价波动越小 当投机性需求占主导时 上期房价越高 房价波动越大 本文对中国 个大中城市 年数据的实证结果表明 预期及 其投机对中国城市房价波动都具有较强的解释力 研究发现 经济基本面对房价波动影 响大于预期和投机 但这并不意味着个别城市房价变动不是由预期和投机决定的

More information

邱 江 吴玉亭 张庆林 西南师范大学心理学院 重庆 选取 个具体内容的条件命题作为实验材料 以小四 初一 高一 大三的学生为被试 探讨了命题内容对青少年条件推理的影响机制及其发展特点 结果表明 对同一年级而言 不同内容的条件命题的相同推理 之间表现出显著的差异 对不同年级而言 相同内容的条件命题的四种推理之间也存在显著的差异 青少年的条件推理过程似乎是一种基于对事件发生概率估计的直觉判断 这一判断过程主要取决于个体知识经验的增长和主体认知水平的提高

More information

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析 电子科学技术电子科学技术第 02 卷第 03 期 Electronic 2015 年 Science 5 月 & Technology Electronic Science & Technology Vol.02 No.03 May.2015 年 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 刘高军, 李丹, 程利伟, 钱程, 段然 ( 北方工业大学计算机学院, 北京,100144)

More information

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用 第 卷 第 期 年 月 交通运输工程学报 曹 源 唐 涛 徐田华 穆建成 为了确保列车运行控制系统设计和开发的正确性 比较了仿真 测试和形式化 种能够验证 系统设计正确性的方式 根据列车运行控制系统对安全的苛求性 提出了 个与系统安全相关的重要特性 即实时性 混成性 分布 并发 性 反应性 并分析了与这些特性相关的具体形式化方法 通 过对每种形式化方法的数学基础和应用范围的分析和归类 给出了各种方法的优势和不足

More information

工程项目进度管理 西北工业大学管理学院 黄柯鑫博士 甘特图 A B C D E F G 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 甘特图的优点 : 直观明了 ( 图形化概要 ); 简单易懂 ( 易于理解 ); 应用广泛 ( 技术通用 ) 甘特图的缺点 : 不能清晰表示活动间的逻辑关系 WBS 责任分配矩阵 ( 负责〇审批

More information

无论中国的传统学术还是西方的大学制度 因 修道 之旨而生 教化 之需的轨迹是颇为相似的 正如中国的 小学 是为 大学 的读经作准备 欧洲中世纪大学的 人文学科 也是要帮助凡人理解神圣的文本 在西方 进一步使语言成为民族国家的根本标志 并通过强势族群与强势语言的共生互动 为后世的殖民扩张提供了基本 原型 中国早期教会大学对于语言的选用 当代西方国家的相关语言政策 也都可以成为语言标准之统治性力量的生动例证

More information

! %! &!! % &

! %! &!! % & 张海峰 姚先国 张俊森 借鉴 的有效教育概念 本文利用 年间的中国省级面板数据估计了平均教育年限 教育数量 和平均师生比率 教育质量 对地区 劳动生产率的影响 本文的实证分析结果表明 以师生比率衡量的教育质量对劳动生产 率有显著且稳健的正效应 在均值处师生比率每上升一个标准差 有助于提高地区劳动生产率约 教育数量对劳动生产率的影响大小部分取决于教育质量的高低 教育质量越高教育数量对劳动生产率的促进效应越大

More information

中国科技论文在线中文稿件模板

中国科技论文在线中文稿件模板 面向领域的新闻话题发现的研究 * 米佳, 苗振江 ( 北京交通大学计算机与信息技术学院信息所, 北京 100044) 5 摘要 : 互联网新媒体产生海量的半结构化新闻数据, 它们具备时效短, 动态性强, 结构不规范 对社会舆论具有导向作用等特点 如何将这些数据归类, 提炼出主题信息, 是本文研究的主要问题 本文主要讨论如何将话题发现与追踪技术应用到新闻领域, 试图从新闻文本集合中, 找到主要的核心话题,

More information

从马克思东方社会理论出发所作的分析 唐永春 苏联法学对中国法学产生过深刻的消极影响 其原因除了社会制度 意识形态 国际环境等直接因素外 还存在着更深层次的历史传统的因素 这就是两国传统政治文化的同质性 基于古代东方亚细亚生产方式而形成的东方专制主义传统 的遗存及其影响 马克思东方社会理论是理解这一同质性的钥匙 认识这种深层原因 对我国今后法学研究及法治建设的发展具有重要意义 苏联法学 中国法学 亚细亚生产方式

More information

胡 鑫 陈兴蜀 王海舟 刘 磊 利用基于协议分析和逆向工程的主动测量方法对 点播系统进行了研究 通过对 点播协议进行分析 获悉该协议的通信格式和语义信息 总结出了 点播系统的工作原理 在此基础上设计并实现了基于分布式网络爬虫的 点播系统主动测量平台 并对该平台获取的用户数据进行统计分析 获得了 点播系统部分用户行为特征 研究结果对 点播系统的监控及优化提供了研究方法 点播 协议分析 爬虫 主动测量

More information

¹

¹ 复仇母题与中外叙事文学 杨经建 彭在钦 复仇是一种特殊的历史文化现象 也是以超常态的 极端性方式为特征的人类自然法则的体现 而在中外叙事文学中以 复仇 为取向的创作大致有三种母题形态 血亲复仇 痴心女子负心汉式复仇 第三类复仇 本文在对这三类复仇叙事模式进行艺术解析的前提下 发掘并阐释了蕴涵其中的不同民族的文化精神和价值指向 复仇母题 叙事文学 创作模式 文化蕴涵 ¹ º » ¼ ½ ¹

More information

外国文学研究 年第 期 º

外国文学研究 年第 期 º 曹 莉 占有 历史的真实与文本的愉悦 曹 莉 本文以分析当代英国女作家拜厄特的长篇小说 占有 的 充盈饱满 为出发 点 探讨小说所表现的历史真实与文学虚构之间的距离和张力 作为文化记忆的文学的历史 内涵以及小说这一特殊的叙事形式 在创作情节和情境以及在进行情节和情境的组合过程中以其特有的较为充分和自由的表达方式所能给予的阅读与写作的愉悦 拜厄特 占有 历史小说 历史叙述 文本的愉悦 ¹ 曹莉 文学博士

More information

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系

第 05 期 董房等 : 一种卫星遥测在线状态监测及分析系统的设计 WEB 1 2 总体功能及组成 2.1 总体功能 1 2 3Web 2.2 结构组成 Web WEB WEB 2.3 系统各模块接口关系 电子科学技术 Electronic Science & Technology 电子科学技术第 02 卷第 05 期 2015 年 9 月 Electronic Science & Technology Vol.02 No.05 Sep.2015 年 一种卫星遥测在线状态监测及分析系统的设计 董房 1,2, 刘洋 2, 王储 2 2, 刘赞 (1. 上海交通大学, 上海,200240; 2. 上海卫星工程研究所,

More information

片 要求小王等同学对这些文物用两种不同的标准进行分类 说出分类标准和结果 其所考查的目标实则是呼应了一般学习能力中的 整理信息 的要求 即从图片材料 中提取历史信息 对所获材料进行归类 开卷的第三题以 古代少数民族问题 为材料主题 体现交往与融合在文明发展 历程中的地位与作用 以探究性学习为主线 集中考查学生在开展探究性活动中对文 献 实物 口传等不同种类史料 材料 的运用水平 包括对有关史实的再现

More information

二 外汇风险溢酬的度量及其时间序列模型

二 外汇风险溢酬的度量及其时间序列模型 外汇风险溢酬理论述评 郑振龙 邓弋威 一 外汇风险溢酬问题的提出 国家自然科学基金项目 非完美信息下基于观点偏差调整的资产定价 福建省自然科 学基金项目 卖空交易对证券市场的影响研究 教育部人文社科一般项目 市场有效性 价格发现与 定价权争夺 基于人民币即期汇率和远期汇率的研究 教育部留学回国人员科研启动基金 人民币 即期与远期汇率关系及外汇市场协同稳定机制研究 郑振龙 男 福建平潭人 厦门大学金融系教授

More information

从美国 加拿大 英国 澳大利亚 韩国和日本图书馆学情报学学院的发展历程入手 介绍并分析国外图书馆学情报学研究生教育的改革与重组 教学目标与教学方法 专业设置与课程体系 师资队伍与学生情况 入学资格与毕业条件 进而对我国的图书馆学情报学研究生教育制度提出一些改进意见 图书馆学 情报学 研究生 教育 作者简介 葛敬民 男 年生 教授 硕士生导师 刘荣华 女 年生 硕士生 王林 男 年生 硕士生

More information

,,, ( ) ( ), %, %,,,,,,,,,,,,,,,,,,, %,,,,,,,, :,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,, :., ( ),,,,,, :,, ( ),,

,,, ( ) ( ), %, %,,,,,,,,,,,,,,,,,,, %,,,,,,,, :,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,, :., ( ),,,,,, :,, ( ),, * ( ) 葛延风 内容提要 : 中国养老保障制度改革的方向是基金预筹积累的个人帐户制度 在向新制度的转轨过程中, 核心的问题是解决老职工的养老金来源 年以来的改 革没有解决这一问题, 以致于陷入困境 作者认为改革的思路是用国有资产存量偿 还对老职工的养老金负债, 在此基础上建立完全的个人帐户制度 医疗和失业保障 改革也应转换思路 医疗保障制度改革应打破城乡分割问题, 建立城乡一体化的保障体系 失业保障不能通过失业保险解决,

More information

摘要 随着 Internet 的迅猛发展和日益普及, 网络文本信息急剧增长, 如何有效的 组织和管理这些海量信息, 并能够快速 准确 全面地获得用户所需要的信息是 当今信息科学技术领域面临的一大挑战 文本分类作为处理和组织大量文本数据 的关键技术, 可以在较大程度上解决信息杂乱现象的问题, 方便用户准确地定位 所需要的信息和分流信息 而且作为信息过滤 信息检索 搜索引擎 文本数据库 数字化图书馆等技术基础,

More information

东南大学硕士学位论文 LCD 显示中灰度控制机理的研究及电路实现姓名 : 曹志香申请学位级别 : 硕士专业 : 微电子学与固体电子学指导教师 : 孙大有 20040327 LCD 显示中灰度控制机理的研究及电路实现 作者 : 曹志香 学位授予单位 : 东南大学 相似文献 (1 条 ) 1.

More information

201902

201902 104 2019,55(2) 文本分类 TF-IDF 算法的改进研究 1,2 1,2 1,2 叶雪梅, 毛雪岷, 夏锦春, 王波 1. 合肥工业大学管理学院, 合肥 230009 Computer Engineering and Applications 2. 合肥工业大学过程优化与智能决策教育部重点实验室, 合肥 230009 1,2 摘要 : 中国互联网环境的发展, 让大量蕴含丰富信息的新词得以普及

More information

Microsoft PowerPoint - 诓敧-8.19

Microsoft PowerPoint - 诓敧-8.19 考研英语二语法与长难句 王丽 关于词的那些事 1 学习目标 什么是词? 什么是语? 英语中的词性有哪些? 每种词性最重要的使用规则是什么? 什么是词? 什么是语? 单词 : persistence [pəˈsistəns] n. 坚持不懈 句子 : Persistence is the key to success. 坚持不懈是成功的关键 句法核心 :XX 词在句中作 XX 语 词 : 词性, 每个单词自然属性

More information

将民族文化认同置于一个多民族交往和对话 互相激荡影响的场域中予以考察 包括对少数民 族网络的官方话语 少数民族知识分子话语 商业诉求 个人表达四类话语形态的分析 在民族文化认知 情感表达等方面 网络都为少数民族文化认同提供了场域 在网络的场域下 少数民族文化认同 地域认同 国家意识形态相互浸润 形成了多层次的民族和国家认同 文化认同 少数民族 电子网络媒介 陈静静 云南大学新闻系讲师 庄晓东 哲学博士

More information

( 一 ) 外来农民进入城市的主要方式, %,,,,,, :., 1,, 2., ;,,,,,, 3.,,,,,, ;,,, ;.,,,,,,,,,,,,,,,,,,,,,, :,??,?? ( 二 ) 浙江村 概况.,,,,,, 1,, 2,, 3

( 一 ) 外来农民进入城市的主要方式, %,,,,,, :., 1,, 2., ;,,,,,, 3.,,,,,, ;,,, ;.,,,,,,,,,,,,,,,,,,,,,, :,??,?? ( 二 ) 浙江村 概况.,,,,,, 1,, 2,, 3 : 王汉生刘世定孙立平项飚 本文从农村人口进入城市的方式这一新的视角, 对北京著名的外来农村人口聚 居区 浙江村 的形成过程和基本状况进行了生动描述和深入分析 指出 : 浙江村的独特之处在于它不同于一般意义上的 劳动力 的流动, 它是带着综合性资源的 经营者的流动 浙江村村民进入城市的过程是不断寻找市场和开拓市场的过程, 并 在城市中形成了一个以聚居为基础的产业加工基地, 作者将这种类型的流动称为产

More information

untitled

untitled 20108 2010 3 4 30 1 07715815238 200816 200422 2 200944 2009 200964 07715815388581523758153815815389 07715815378 1 200823 2 3 设的基本要求 3 广西计算机辅助普通话水平测试考务管理工作的 有关具体要求 4 广西计算机辅助普通话水平测试申请表 5 广西计算机辅助普通话水平测试情况登记表

More information

4.C ( 详细解析见视频课程 绝对值 01 约 21 分 15 秒处 ) 5.E ( 详细解析见视频课程 绝对值 01 约 32 分 05 秒处 ) 6.D ( 详细解析见视频课程 绝对值 02 约 4 分 28 秒处 ) 7.C ( 详细解析见视频课程 绝对值 02 约 14 分 05 秒处 )

4.C ( 详细解析见视频课程 绝对值 01 约 21 分 15 秒处 ) 5.E ( 详细解析见视频课程 绝对值 01 约 32 分 05 秒处 ) 6.D ( 详细解析见视频课程 绝对值 02 约 4 分 28 秒处 ) 7.C ( 详细解析见视频课程 绝对值 02 约 14 分 05 秒处 ) [ 说明 ] 1. 以下所指教材是指朱杰老师的 管理类联考综合能力数学套路化攻略 2. 该文档中所标答案和参见的教材答案, 与视频有冲突的, 以视频答案为准! 基础篇 第 1 章 数 1.2.1 整数例题答案 : 1. A ( 详细解析见教材 P7 例 2) 2. D ( 详细解析见视频课程 数的性质 约 10 分 53 秒处 ) 3. C ( 详细解析见教材 P7 例 3) 4.E ( 详细解析见视频课程

More information

Lecture5-Classification.pptx

Lecture5-Classification.pptx 内容回顾 试解释基于用户反馈的查询扩展 试解释自动查询扩展的工作原理 试计算 acb 和 abd 的编辑距离 (Edit distance) 1 信息检索原理 课程 第五讲文本分类与聚类技术 授课人 : 孙海龙 2016.10.21 1 提纲 文本分类概述 无监督的机器学习算法 有监督的机器学习算法 3 概述 物以类聚 : 对于大量的文档, 如何能够按照某个主题进行搜索 按照共同的主题对文档进行分组

More information

é ê

é ê 廖光洪 朱小华 杨成浩 徐晓华 基于南海 年夏季调查航次诊断计算的流函数场 选取越南以东偶极子发生海域 进行 不同的声层析观测站位设置实验 模拟计算声线传播时间信息 然后应用基函数重建方法进行了 流函数场的模拟反演研究 讨论了不同随机观测误差对反演结果的影响 研究结果表明该方法是 可行的 在所选取的约 海域内 在观测海域外围配置 个声层析观测站位就能够很好地重构原流函数场 空间分辨率约为 可以分辨模拟海域中尺度涡场结构

More information

论高校薪酬制度改革与人才强校战略 三 实施薪酬制度改革的效果 分配制度的改革就是在提高广大职工收入水平的基础上 重点要提高拔 尖人才的工资性收入及各种福利待遇 自从实施薪酬制度改革以来 我校职 工的工资性收入普遍有了大幅度的提高 薪酬改革方案得到了广大教师的支 持和欢迎 根据我们的调查 自 1999 年薪酬制度改革以来我校职工的工资性 收入增长了近 3畅 5 倍 具体增长情况见下图 1 图 1 1999

More information

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,,

,,,,,,,,,,,,, ;,,,, ( ), ; ;,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ( ),,,,,,.,,,,,,,,,,,,,, 刘中荣王平周长城 矿区作为一类特殊的社区, 它的发展所追求的不仅是矿产资源和经济效益的提 高, 而且是一种涉及社会各个方面的整体性进步 这种进步应以经济发展为基础, 以矿区职工和居民素质的提高 生活的改善为核心的经济与非经济方面的均衡发展 作者在对大冶市铜绿山铜铁矿深入调查的基础上, 分析了矿区人口与就业 教育与文 化 工农关系与社会治安 矿区管理体制以及社会保障制度等方面的现状和问题 文 章指出,

More information

本文通过对世界体育运动发展的历史与现实的研究 提出了体能文 化的概念 论述了体能文化的国际化和民族性及其对人类社会政治 经济 文化和社 会生活多方面的影响 文章指出 国际竞技体育运动是 世纪以来人类社会生活全 球化的先导 是当代世界各民族 各国家和平共处 平等参与 公平竞争机制实现程度最高的国际事务 是人类社会国际化进程中民族文化多样性实现整合的范例 是展望 新世纪人类社会文明范式的着眼点 同时提示了进行体育人类学研究的必要性和重

More information

赵燕菁 #!!!

赵燕菁 #!!! 赵燕菁 城市规划在灾后重建中对于工程技术的关注 很容易掩盖城市灾后重建中看不见的制度因素!!! 产权 城市最基本的制度 原型 # 就是公共产品交易的存在 城市 发达 # 与否 取决于公共产品提供的范围和水平 现代城市和传统城市的最大差别 就是可以以信用的方式 抵押未来的收益 获得公共产品建设所需要的原始资本 市场经济与计划经济最大的差别 就在于高度复杂的产权制度 因此 未来灾区规划中 产权的恢复和重建

More information

社会科学版 李雁南 从明治末期到大正年代 随着大日本帝国的建立 日本文学中形成了 东方主义 视角 拥有了一套用来表述其他亚洲国家的霸权话语体系 中国由于悠远的历史 广袤的国土 适度的距离成为大正年代日本作家普遍关注的 东方异国 的主体 他们用经典文本中的幻象取代中国的实体 在中国寻找神秘浪漫的异国情调 同时 中国作为日本的 东方 使日本作家自身的殖民者身份得以确认 中国因此成为日本帝国文化的有效参照系

More information

第 3 期蒋盛益, 等 : 聚类分析研究的挑战性问题 33 本质. 通常, 在处理不同的问题时, 要根据当前问题的具体情况选择合适的聚类算法, 以帮助用户挖掘出潜藏在数据背后的规律或模式 [4]. 所以, 聚类分析方法会因用户需求和使用目的而有所不同, 很难找到一个统一的标准对其进行分类. 目前,

第 3 期蒋盛益, 等 : 聚类分析研究的挑战性问题 33 本质. 通常, 在处理不同的问题时, 要根据当前问题的具体情况选择合适的聚类算法, 以帮助用户挖掘出潜藏在数据背后的规律或模式 [4]. 所以, 聚类分析方法会因用户需求和使用目的而有所不同, 很难找到一个统一的标准对其进行分类. 目前, 第 31 卷第 3 期 2014 年 9 月 广东工业大学学报 JournalofGuangdongUniversityofTechnology Vol.31No.3 September2014 doi:10.3969/j.isn.1007 7162.2014.03.006 聚类分析研究的挑战性问题 蒋盛益 1 2, 王连喜 ( 广东外语外贸大学 1. 思科信息学院 ;2. 图书馆, 广东广州 510420)

More information

基于文本纹理的情感倾向性分析研究 摘要 随着信息时代互联网技术的不断发展, 互联网上的信息呈指数级增长, 这些海量的信息蕴含着潜在的信息价值亟待人们探索和挖掘, 促使人们寻找一种自动化的方法来分析文本隐藏的价值 自然语言文本情感分析是一个新兴的研究课题, 具有很大的研究价值和应用价值 传统的空间向量

基于文本纹理的情感倾向性分析研究 摘要 随着信息时代互联网技术的不断发展, 互联网上的信息呈指数级增长, 这些海量的信息蕴含着潜在的信息价值亟待人们探索和挖掘, 促使人们寻找一种自动化的方法来分析文本隐藏的价值 自然语言文本情感分析是一个新兴的研究课题, 具有很大的研究价值和应用价值 传统的空间向量 SHANGHAI JIAO TONG UNIVERSITY 学士学位论文 THESIS OF BACHELOR 论文题目 : 基于文本纹理的情感倾向性分析研究 学生姓名 : 任彦斌 学生学号 : 5100369074 专 业 : 信息安全 指导教师 : 刘功申副教授 学院 ( 系 ): 电子信息与电气工程学院 基于文本纹理的情感倾向性分析研究 摘要 随着信息时代互联网技术的不断发展, 互联网上的信息呈指数级增长,

More information

!!

!! 徐二明 陈 茵 以企业资源基础理论为基础 从企业吸收能力这一概念入手 剖析企业吸收能力与企业竞争优势的关系 研究组织管理机制对企业吸收能力构建和发展的影响 依据吸收能力经典文献对吸收能力的前因进行重新梳理和归类 对现有文献中各种思路有一定的整理和明示作用 通过研究两种吸收能力的 类影响因素 辨识出中国企业在吸收能力培养和发展方面的优势和弱势 通过实证方法全面衡量和验证潜在吸收能力与实际吸收能力两者之间以及两能力与企业竞争优势的关系

More information

见图 二 社会主义改造时期 图

见图 二 社会主义改造时期 图 河北师范大学学报 蒋纯焦 通过采用计量研究 比较研究的方法 对 年以来中国东中西部高等教育区域差异的变迁作系统的梳理与分析 探讨形成和影响高等教育的区域差异的原因 揭示高等教育区域差异与社会变迁区域差异之间的互动关系 从而建立地方社会发展与高等教育发展之间的良性互动 实行区域推进策略 这是中国高等教育发展的应然选择 当代中国 东中西部 高等教育 区域差异 实证研究 一 建国初期 见图 见图 二 社会主义改造时期

More information

5 2. 过程与方法 情感 态度与价值观 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排

5 2. 过程与方法 情感 态度与价值观 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排 单元教学综述 一 内容概述 2 IE 5 5 10 11 12 13 14 二 教学目标 1. 知识与技能 1 2 3 4 5 2. 过程与方法 1 2 3 4 3. 情感 态度与价值观 1 2 3 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排 1 10 1 2 11 1 1 2 12 1 2 3 4 1 小学信息技术第 3 册教师用书 续表 课 程 教学要求 课时安排 13

More information

78 上海海事大学学报第 33 卷 0 引言 自进入信息化时代以来, 因特网上的网页数量增长迅猛. 为了提高信息的检索效率, 很有必要对因特网上的一些网页进行分类. 尽管目前有 Google, Yahoo, 搜狐等分类目录式的中文网站目录, 但由于其均为人工编纂, 效率低下, 而且更新速度慢, 无法

78 上海海事大学学报第 33 卷 0 引言 自进入信息化时代以来, 因特网上的网页数量增长迅猛. 为了提高信息的检索效率, 很有必要对因特网上的一些网页进行分类. 尽管目前有 Google, Yahoo, 搜狐等分类目录式的中文网站目录, 但由于其均为人工编纂, 效率低下, 而且更新速度慢, 无法 第 33 卷第 1 期 2012 年 3 月 上海海事大学学报 JournalofShanghaiMaritimeUniversity Vol.33 No.1 Mar.2012 文章编号 :1672-9498(2012)01 0077 05 基于 CFS GA 特征选择算法的中文网页自动分类 喻春萍, 黄晓霞 ( 上海海事大学信息工程学院, 上海 201306) 摘要 : 为在中文网页分类时降低特征向量的维度

More information

考试研究 % 第 卷第 期 # # # # #

考试研究 % 第 卷第 期 # # # # # 张亚群! 北京大学 清华大学自主招生是在高考基础上进行自主选拔 综合评价 降分录取的招生模式 它适应了建设一流大学和培养创新人才的要求 为全面发展或具有特长的考生提供了更多的入学选择机会 两校自主选拔竞争激烈 招生范围逐年扩大 取得了一定的成效 但也存在操作复杂 成本高 忽视弱势阶层考生 特长生优势不显著等不足 需要进一步改革与完善其选拔机制! 北京大学清华大学自主招生考试!!! 张亚群 教授 博士生导师

More information

F515_CS_Book.book

F515_CS_Book.book /USB , ( ) / L R 1 > > > 2, / 3 L 1 > > > 2 + - 3, 4 L 1 了解显示屏上显示的图标 Wap 信箱收到一条 Wap push 信息 ( ) GSM 手机已连接到 GSM 网络 指示条越多, 接收质量越好 2 ...........................4.............................. 4 Micro SD (

More information

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管

数学与应用数学 3 3 物理学 2 2 普通本科 电子信息科学与技术 3 3 俄语 3 3 国际事务与国际关系 3 3 海事管理 4 4 海洋技术 2 2 海洋渔业科学与技术 4 4 海洋资源与环境 2 2 汉语国际教育 3 3 汉语言文学 3 3 化学 2 2 环境工程 3 3 旅游管 海南热带海洋学院 2018 年普通高考招生计划录取数 专业省份 录取数 计划数 本科 4093 4093 安徽 132 132 普通本科 102 102 财务管理 3 3 电子商务 3 3 电子信息科学与技术 3 3 海事管理 3 3 海洋技术 3 3 海洋渔业科学与技术 3 3 海洋资源与环境 2 2 汉语言文学 3 3 化学 2 2 环境工程 4 4 会展经济与管理 3 3 计算机科学与技术 3

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

! #!! #!! #!! # %! # %!! #!!! #! # %& ()

! #!! #!! #!! # %! # %!! #!!! #! # %& () 中国人民大学文学院 北京 在将多神教的 女神 索菲亚 圣灵 圣母 大地母亲 俄罗斯祖国 等概念融会贯通的基础上 俄罗斯文化孕育出对女性和母性的广泛崇拜 这成为俄罗斯民族意识的重要组成部分 并导致文学中对尘世爱情的圣化 女性形象蕴涵了更多的圣洁 神秘和深沉 俄国象征主义文学以及后来的 世纪俄罗斯文学对 永恒女性 都表现出一种深刻的情感认同 很多女性形象都是对这一原型的改写和翻新 俄罗斯文学 女性崇拜

More information

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例 帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例 这篇文章主要介绍了帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例, 本文还详细介绍了帝国 CMS 数据库类中的一些常用方法, 需要的朋友可以参考下 例 1: 连接 MYSQL 数据库例子 (a.php)

More information

» ¼ ½ ¾ À Á» ¼ ½ ¾ À Á ½ À À À À À À À

» ¼ ½ ¾ À Á» ¼ ½ ¾ À Á ½ À À À À À À À 徐国栋 最早的宪法用语是基于希腊人的经验确立的 它代表了一种 主体际关系 的宪法观 往后的宪法用语一直循着希腊思想的线索演变 西塞罗把拉丁化 同时把相应的宪法观念客观化为对公共事务的处理规则 西塞罗还基于当时的修辞学和医学的成就打造了 和 两个表示宪法的词汇 并把它们的配词设定为可以互换 托马斯 阿奎那用 诠释了亚里士多德的宪法观念 把 主体际关系 的含义缩减为阶级关系的含义 进入民族国家时代后 产生了基本法

More information

Mechanical Science and Technology for Aerospace Engineering March Vol No. 3 赵海新, 刘夫云, 杨运泽, 许 坤 参数的传递在装配件变型设计中非常重要, 而构造尺寸约束

Mechanical Science and Technology for Aerospace Engineering March Vol No. 3 赵海新, 刘夫云, 杨运泽, 许 坤 参数的传递在装配件变型设计中非常重要, 而构造尺寸约束 2013 3 32 3 Mechaical Sciece a Techology for Aerospace Egieerig March Vol. 32 2013 No. 3 赵海新, 刘夫云, 杨运泽, 许 坤 541004 参数的传递在装配件变型设计中非常重要, 而构造尺寸约束方程式是实现参数传递的有效方法通过分析装配约束的特点, 阐明了装配约束语义的表达和装配约束关系的定义构造了基 于装配语义和约束关系的装配约束库在装配语义表达和装配约束关系定义的基础上,

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 Fregata: 轻量级大规模机器学习算法库 Chief Data Scientist, TalkingData 大纲 大规模机器学习的挑战 Fregata 的优点 GSA 算法介绍 GSA 算法在 Spark 上的并行化与 MLLib 的对比如何使用 Fregata Fregata 的发展目标 大规模机器学习两个挑战 计算瓶颈 调参困难 经典算法的计算瓶颈 计算复杂度随数据规模超线性增长 Cheng

More information

猫腻的做法 无用的伎俩 中国异教徒尤其擅长 如下文将讨论到的 阿辛 西岩

猫腻的做法 无用的伎俩 中国异教徒尤其擅长 如下文将讨论到的 阿辛 西岩 年第 期 第 期 秦立彦 北京大学中文系比较文学与比较文化研究所 北京 布莱特 哈特 华人形象 美国西部 世纪美国作家布莱特 哈特在很多作品中都写到在美国西部的中国人 这些中国人形象复杂多样 彼此 交织 对进行单一道德评价的形象研究提出一种矫正 包括诗歌 小说 戏剧 收稿日期 作者简介 秦立彦 男 黑龙江人 北京大学政治学系学士 英语系硕士 美国圣地亚哥加州大学文学博士 现为北京大学中文系比较文学与文化研究所教师

More information

非营利组织专职人员专业化问题研究

非营利组织专职人员专业化问题研究 湖南师范大学硕士学位论文非营利组织专职人员专业化问题研究姓名 : 罗拾平申请学位级别 : 硕士专业 : 社会学指导教师 : 陈成文 20080501 非营利组织专职人员专业化问题研究 作者 : 罗拾平 学位授予单位 : 湖南师范大学 相似文献 (1 条

More information

, ( ) :,, :,, ( )., ( ) ' ( ),, :,,, :,, ;,,,,,, :,,,, :( ) ;( ) ;( ),,.,,,,,, ( ), %,. %,, ( ),,. %;,

, ( ) :,, :,, ( )., ( ) ' ( ),, :,,, :,, ;,,,,,, :,,,, :( ) ;( ) ;( ),,.,,,,,, ( ), %,. %,, ( ),,. %;, :?? * 张军高远傅勇张弘 : 本文在中国的政治经济体制的框架内解释了改革以来, 尤其是上世纪 年代以来中国在建设和改善物质基础设施上所取得的显著成就 文章依据现有的文献和 省级面板数据, 不仅度量了改革以来中国的基础设施的存量变化和地区差距, 而且运用 方法检验了可解释基础设施投资支出变动模式的重要变量 本文发现, 在控制了经 济发展水平 金融深化改革以及其他因素之后, 地方政府之间在 招商引资

More information

山东师范大学硕士学位论文数据挖掘中聚类分析算法的研究姓名 : 王鑫申请学位级别 : 硕士专业 : 计算机软件与理论指导教师 : 刘希玉 ; 王洪国 20060419 数据挖掘中聚类分析算法的研究 作者 : 王鑫 学位授予单位 : 山东师范大学 相似文献 (10 条 ) 1. 学位论文许存兴聚类分析在数据挖掘中的应用

More information

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作 * 夏传玲 : 本文简要回顾了国内外定性研究在最近 多年的发展概况, 总结 了定性研究的六个发展趋势和分析策略上的三种流派 在上述两种背景下, 本文探讨了计算机辅助的定性分析给定性研究带来的机遇和挑战, 特别是它和手工操作对比时的优势和劣势, 以及应用这种定性分析技术所可能面临的困难 : 定性研究定性分析 文化差异,, (, ),,,, ( - ) ( - ) ( - ) ( - ) ( - ) (

More information

目录 基于聚类的图像分割算法 k-means 算法 mean-shift 算法 基于图的图像分割算法

目录 基于聚类的图像分割算法 k-means 算法 mean-shift 算法 基于图的图像分割算法 图像处理与分析 图像分割 授课教师 : 孙剑 jiansun@mail.xjtu.edu.cn http://jiansun.gr.xjtu.edu.cn 西安交通大学数学与统计学院 目录 基于聚类的图像分割算法 k-means 算法 mean-shift 算法 基于图的图像分割算法 图像分割问题 图像分割 : 将图像区域分割为颜色 纹理或语义一致的区域 底层分割 : 将图像分割为颜色或纹理一致的区域,

More information

<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA>

<4D F736F F F696E74202D20BCC6CBE3CBF9B6E0D3EFD1D4B4A6C0EDBACDBBFAC6F7B7ADD2EBD1D0BEBFBDF8D5B92D DC9EEDBDA> 中科院计算所多语言处理和机器翻译 研究进展 姜文斌 中国科学院计算技术研究所自然语言处理研究组 第九届全国自然语言处理青年学者研讨会深圳,2012 年 8 月 大纲 研究背景 问题与挑战 研究进展 翻译评测 2 中国的多语言环境 少数民族语言众多 维吾尔语 哈萨克语 柯尔克孜语 蒙古语 藏语 朝鲜语 周边语言环境复杂 语言种类多 : 英语 日语 韩语 泰语 越南语 俄语 很多语言与国内少数民族语言相通

More information

一 补助边疆民族地区义务教育

一 补助边疆民族地区义务教育 中英庚款与民国时期的边疆教育 田正平 张建中 依据 中英庚款息金用途支配标准 的规定 年至 年间 管理中英庚款董事会拨款资助了边疆教育 虽然资助的时间较短 资助的文教机构相对较少 但在推动边疆地区义务教育 考察教育实际状况 培训西北地区师资 创办边疆中学及倡导科学教育等方面都作出了较大的贡献 这些举措直接推动了民国时期边疆省份的教育进步 在一定程度上缩小了教育发展的区域差距 当时的某些举措或做法 对今天发展西部地区的教育仍具有一定的借鉴意义

More information

浙江师范大学2018年招生计划表( 定稿)

浙江师范大学2018年招生计划表( 定稿) 浙江师范大学 2018 年省外招生计划表 省份 专业名称 科类 录取批次 招生计划 合计 8 工商管理类 文史 本科二批 2 学前教育 ( 师范 ) 文史 本科二批 2 北京 文史小计 4 物理学类 理工 本科二批 2 地理科学 ( 师范 ) 理工 本科二批 2 理工小计 4 合计 35 工商管理类 文史 本科 A 阶段 4 公共管理类 文史 本科 A 阶段 3 学前教育 ( 师范 ) 文史 本科

More information

吉林大学学报 工学版 244 第 4 卷 复杂 鉴于本文篇幅所限 具体公式可详见参考文 献 7 每帧的动力学方程建立及其解算方法如图 3 所示 图4 滚转角速度与输入量 η 随时间的变化波形 Fig 4 Waveform of roll rate and input η with time changing 图5 Fig 5 滚转角随时间的变化波形 Waveform of roll angle with

More information

东南大学博士学位论文面向蛋白质结构预测的计算生物学技术研究姓名 : 何洁月申请学位级别 : 博士专业 : 计算机应用技术指导教师 : 董逸生 20061001 面向蛋白质结构预测的计算生物学技术研究 作者 : 何洁月

More information

» ¼ ½ ¾» ¼ ½ ¾

» ¼ ½ ¾» ¼ ½ ¾ 黄 韬 在我国 部分金融法律争议案件因为司法政策的原因而不是基本法律的规定 没有机会进入到法 院 或在进入法院的过程中被施加了某些限制 这一金融司法现象是与当下中国的金融市场和司法体制运行的 某些特点紧密相关的 但这样的司法筛选机制也会给金融市场带来不可避免的消极影响 金融争议 案件筛选 司法体制 作者黄韬 法学博士 上海交通大学凯原法学院讲师 ¹ º ¹ º » ¼ ½ ¾» ¼ ½ ¾ Á À

More information

无类继承.key

无类继承.key 无类继承 JavaScript 面向对象的根基 周爱 民 / aimingoo aiming@gmail.com https://aimingoo.github.io https://github.com/aimingoo rand = new Person("Rand McKinnon",... https://docs.oracle.com/cd/e19957-01/816-6408-10/object.htm#1193255

More information

ChinaBI企业会员服务- BI企业

ChinaBI企业会员服务- BI企业 商业智能 (BI) 开源工具 Pentaho BisDemo 介绍及操作说明 联系人 : 杜号权苏州百咨信息技术有限公司电话 : 0512-62861389 手机 :18616571230 QQ:37971343 E-mail:du.haoquan@bizintelsolutions.com 权限控制管理 : 权限控制管理包括 : 浏览权限和数据权限 ( 权限部分两个角色 :ceo,usa; 两个用户

More information

OOP with Java 通知 Project 4: 4 月 19 日晚 9 点

OOP with Java 通知 Project 4: 4 月 19 日晚 9 点 OOP with Java Yuanbin Wu cs@ecnu OOP with Java 通知 Project 4: 4 月 19 日晚 9 点 复习 类的复用 组合 (composition): has-a 关系 class MyType { public int i; public double d; public char c; public void set(double x) { d

More information

第 卷 第 期 / 3 678/48/ 3 9 " / 6 / ! /36 8 /34678/ /6 838/6 98 /36 6 * 8/ 3!1/7/7 36 /3 6 8/34 6 8/ * 677 / 81 41

第 卷 第 期 / 3 678/48/ 3 9  / 6 / ! /36 8 /34678/ /6 838/6 98 /36 6 * 8/ 3!1/7/7 36 /3 6 8/34 6 8/ * 677 / 81 41 年 月第 卷 第 期 推 进 技 术!" ( 3 /34*1 / 34* 6/ 8/ 3 A6 8 9 /63 63!6 13 4 3 6 *"34/367@ 1 9"36 43 6 "34/366 /34 6/ /34 3/ 6 7/8 9 6 3 8/ 73 78 3 8/ 7 6/ /34+ 1/3 3 6 8 7677816696 87 9788 * 8 /8 / 76 /349 3 8166

More information

第 卷 第 期李 平 戴月明 王 艳 基于混合卡方统计量与逻辑回归的文本情感分析 8 互信息 +%'$%+' 等 文献 通过实验对比 8 方法 '7 方法 +' 方法和 ' 方法后 得出 '7 和 ' 方法有较好的分类质量 文献 针对低文档特征不可靠和特征项在指定类出现频率低的问题 提出将频度 集中

第 卷 第 期李 平 戴月明 王 艳 基于混合卡方统计量与逻辑回归的文本情感分析 8 互信息 +%'$%+' 等 文献 通过实验对比 8 方法 '7 方法 +' 方法和 ' 方法后 得出 '7 和 ' 方法有较好的分类质量 文献 针对低文档特征不可靠和特征项在指定类出现频率低的问题 提出将频度 集中 第 卷 第 期 计算机工程 年 月! 人工智能及识别技术 文章编号 文献标志码 中图分类号 基于混合卡方统计量与逻辑回归的文本情感分析 李 平 戴月明 王 艳 江南大学物联网工程学院 江苏无锡 摘 要 针对文本情感分析中基于卡方统计量的特征提取方法容易忽略单个文本词频 导致文本分类准确率较低的问题 提出一种基于混合卡方统计量的特征提取方法 通过增加特征频率 逆文档频率和负相关性指标 选出集中在某个特定类别中的特征词

More information

Microsoft Word 詹春霞_new_.doc

Microsoft Word 詹春霞_new_.doc 应用论文 基于改进 CFSFDP 算法的文本聚类方法 * 及其应用 詹春霞王荣波黄孝喜谌志群 ( 杭州电子科技大学计算机学院杭州 310018) 摘要 : 目的 针对 CFSFDP(Clustering by Fast Search and Find of Density Peaks) 算法利用局部密度和距离的乘积选择聚类中心而导致聚类结果不理想的问题进行改进 方法 提出一种基于粒子群算法的 CFSFDP

More information

任春平 邹志利 在坡度为 的平面斜坡上进行了单向不规则波的沿岸流不稳定运动实验 观测到了沿 岸流的周期性波动 波动周期约为 利用最大熵方法和三角函数回归法求得这种波动的主 频率以及幅值 分析了波动幅值在垂直岸线方向的变化 结果表明该变化与沿岸流变化类似 即在 沿岸流最大值附近这种波动强度最大 为了分析波动的机理 利用线性沿岸流不稳定模型对模型实验结果进行了分析 求得了不稳定运动增长模式和波动周期 并与对应实测结果进行了比较

More information

信息检索与数据挖掘

信息检索与数据挖掘 信息检索与数据挖掘 2015/5/15 1 信息检索与数据挖掘 第 11 章文本聚类 5 月 18 日周一第 12 章 Web 搜索 5 月 22 日周五图像分类的算法思想 第 13 章多媒体信息检索 & 第 14 章其他应用简介 5 月 25 日周一总复习 5 月 28 日周四晚答疑 不讲课 6 月 1 日周一考试 信息检索与数据挖掘 2015/5/15 2 5 月 18 日周一第 12 章 Web

More information

第 期 丘志力等 从传世及出土翡翠玉器看我国清代翡翠玉料的使用

第 期 丘志力等 从传世及出土翡翠玉器看我国清代翡翠玉料的使用 第 卷 第 期 年 月 宝石和宝石学杂志 丘志力 吴 沫 谷娴子 杨 萍 李榴芬 根据最新发现的广州海关清代同治 光绪年间玉石的进口记录以及其它翡翠资源开发的资料 通 过分析中国主流博物馆清代传世及出土的翡翠玉器 国际著名拍卖公司专场拍卖的清代翡翠玉器以及云南 等九省 市出土的清代翡翠玉器 统计分析了中国清代翡翠玉器的来源与材质特征 指出该时期进入中国市场 的翡翠玉料数量可能相当巨大 广州是翡翠玉料最重要的进关口岸之一

More information

穆迎春 王 芳 董双林 董少帅 朱长波 研究了盐度波动幅度对中国明对虾稚虾 蜕皮和生长的影响 实验 在水族箱内进行 实验对虾的初始体重为 投喂人工配合饲料 实验结果表 明 不同盐度波动幅度对中国明对虾稚虾的蜕皮周期有显著的影响 其中 能明 显抑制对虾的蜕皮 则能促进对虾的蜕皮 前者较后者蜕皮周期延长 不同盐度波动幅度对中国明对虾的特定生长率有显著影响 其中 和 两组对虾的特定生长率最 大 分别大于

More information

年 月

年 月 摘 要 关键词 分类号 基础理论 之一 本文系教育部人文社科基金项目 网络引文的相关规律及其应用研究 编号 的研究成果 总第三七卷 第一九三期 年 月 引用动机 总第三七卷 第一九三期 年 月 引文分析方法 引文数据库 总第三七卷 第一九三期 分析工具 科学评价方面 年 月 总第三七卷 第一九三期 科学交流方面 年 月 总第三七卷 第一九三期 杨思洛湘潭大学公共管理学院知识资源管理 系讲师 年 月

More information

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,,

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, 吴亦明 : '. ',,, -,,, -,., -..., -. - -.,, ( ),,,,,,,,,,,,,,,, :,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,, ,,,,,,,,,,,,,.

More information

材料导报 研究篇 年 月 下 第 卷第 期 种球的制备 单步溶胀法制备分子印迹聚合物微球 洗脱处理 种子溶胀聚合机理 种球用量的影响

材料导报 研究篇 年 月 下 第 卷第 期 种球的制备 单步溶胀法制备分子印迹聚合物微球 洗脱处理 种子溶胀聚合机理 种球用量的影响 水相中 组氨酸单分散分子印迹聚合物微球的合成 表征及其识别性能研究 李思平等 李思平 徐伟箭 较佳工艺条件下 在水性体系中选用无皂乳液聚合法制得的单分散微米级聚苯乙烯微球为种球 分别以组氨酸 甲基丙烯酸 或丙烯酸胺 乙二醇二甲基丙烯酸酯 为模板分子 功能单体和交联剂 合成了 组氨酸分子印迹聚合物微球 研究了形貌 粒径及其分布以及模板分子与功能单体之间的相互作用 分别以 激光粒度分析仪紫外分光光度法和红外光谱表征功能单体与交联剂之间的共聚情况

More information

骨头的故事

骨头的故事 头 1 图 206 33 7 12 5 5 4 12 2 54 10 200-400 3 500 图 类 图 图 动 节 4 5 图 发 图 节 180 Youtube 180 [1] 7 2 7 6 9 270 6 图 树懒 块颈 13-25 14 17 25 7 图 扭头 头鹰 鹅 8 图 红 为 关节 绿 为 关节 9 图 类 10 图 类 11 图 盘 动 类 图 阴 犸 艺 你可能会以为图

More information

98

98 / / 河北师范大学学报 // / /... 人本与物本 翻译 与 语义谱系分析比较 牛云平, 杨秀敏 (., ;., ) : 翻译 与 的语义谱系有着根本不同之处 : 前者的本义是语官及其解释活动, 具有明显的人文特征 ; 后者的本义则是物体搬移行为, 具有明显的物化特征 两词的语义谱系不同, 决定了各自理论发展形态有别, 证明了中西翻译学自然而然地有着不同的研究重心和研究取向 因此, 中国学人强求与西人苟同乃是不智之举,

More information

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 第 1 页共 32 页 crm Mobile V1.0 for IOS 用户手册 一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 二 crm Mobile 界面介绍 : 第 3 页共 32 页 三 新建 (New) 功能使用说明 1 选择产品 第 4 页共 32 页 2 填写问题的简要描述和详细描述 第 5 页共

More information

天津大学硕士学位论文网络数控切管系统关键技术研究姓名 : 谢新房申请学位级别 : 硕士专业 : 机械电子工程指导教师 : 王国栋 20070101 网络数控切管系统关键技术研究 作者 : 谢新房 学位授予单位 : 天津大学 本文读者也读过 (10 条 ) 1. 王颖博导管架节点计算机绘图数学模型及程序设计

More information

张成思 本文运用向量系统下的协整分析方法 针对 年不同生产和消 费阶段的上中下游价格的动态传导特征以及货币因素对不同价格的驱动机制进行分析 研究结果表明 我国上中下游价格存在长期均衡关系 并且上中游价格对下游价格具有显 著动态传递效应 而下游价格对中游价格以及中游价格对上游价格分别存在反向传导的 倒逼机制 另外 货币因素对上游价格的动态驱动效果最为显著 但并没有直接作用于下 游价格 因此 虽然货币政策的现时变化可能在一段时间内不会直接反映在下游居民消费价格的变化上

More information

器之 间 向一致时为正 相反时则为负 ③大量电荷的定向移动形成电 流 单个电荷的定向移动同样形成电流 3 电势与电势差 1 陈述概念 电场中某点处 电荷的电势能 E p 与电荷量 q Ep 的比值叫做该点处的电势 表达式为 V 电场中两点之间的 q 电势之差叫做电势差 表达式为 UAB V A VB 2 理解概念 电势差是电场中任意两点之间的电势之差 与参考点的选择无关 电势是反映电场能的性质的物理量

More information