Lecture5-Classification.pptx
|
|
- 亥弩 熊
- 7 years ago
- Views:
Transcription
1 内容回顾 试解释基于用户反馈的查询扩展 试解释自动查询扩展的工作原理 试计算 acb 和 abd 的编辑距离 (Edit distance) 1 信息检索原理 课程 第五讲文本分类与聚类技术 授课人 : 孙海龙
2 提纲 文本分类概述 无监督的机器学习算法 有监督的机器学习算法 3 概述 物以类聚 : 对于大量的文档, 如何能够按照某个主题进行搜索 按照共同的主题对文档进行分组 (grouping) 对分组进行标注 (labeling) 每一个这样的分组称为一个类别 (class) 文本分类 将文档与所属类别关联的过程 Classification/categorization 相关的问题 - 文本聚类 (Clustering) 只分组, 不进行标注 可看作分类的一种特殊情况 4 2
3 基本方法 : 机器学习 机器学习 从数据中学习特定模式 通过得到的模式可以对新数据进行预测 三种类型算法 有监督的学习 : 有训练数据 无监督的学习 : 无训练数据 半监督的学习 : 训练数据很少 5 文本分类问题的定义 文本分类器 D: 文档集合 C={c 1,c 2,,c L }: L 个类别, 每个类别通过 label 进行描述 二元分类函数 F=D X C {0,1}, 即 <d j,c p >= 1, 如果 d j 是类 c p 的成员 0, 如果 d j 不是类 c p 的成员 多元分类函数 :multi-label 问题 6 3
4 无监督的分类算法 7 有监督的分类方法 8 4
5 有监督的算法 依赖于训练数据集 训练文档及分别所属的类别信息 训练过程需要人工进行干预 训练数据集主要用于学习分类函数 训练实例的数量越大, 分类器越准确 避免 Overfitting: 分类器过度适应训练实例 9 提纲 文本分类概述 无监督的机器学习算法 有监督的机器学习算法 10 5
6 无监督的分类算法 11 聚类概述 文本聚类 : 在没有学习的条件下对文本集合进行组织或划分的过程, 基本思想是将相似文本划分到同一类 ; 无监督的机器学习方法, 不需要训练过程, 且不需预先对文档手工标注类别, 因此具有一定灵活性和较高的自动化处理能力 ; 一般分为层次聚类和非层次聚类 12 6
7 Clustering 示例 : 夏威夷酒店的网页 13 类别 : 给 cluster 加上标注 类别的标注可以自动生成, 但通常效果不佳 14 7
8 K-Means: 基于划分的聚类算法 目标 : 把文档集划分成 K 个不相交的子集, 使每一个子集中的点尽可能同质 基于划分的聚类方法是从指定数量的聚类开始搜索可能的点分配方案, 来寻找使某个聚类评分函数最优的分配方法 15 K-means 算法 从 D 中随机选择 k 个初始参照点 以此参照点作为质心, 对 D 进行划分 然后重新计算 Cluster 的质心 对 D 重新划分 重复以上过程, 直到质心不再改变 16 8
9 K Means 举例 (K=2) Pick seeds Reassign clusters Compute centroids Reasssign clusters x x x x Compute centroids Reassign clusters Converged! 17 K-means 的两种模式 批处理模式 : 在重新计算质心之前, 所有文档都已经进行了分类 在线模式 : 每个文档分类之后, 重新计算质心 通常, 在线模式的效果要优于批处理模式 18 9
10 Bisecting K-Means K=2 (1) 所有文档归为一个 cluster, 并将其用 k -means 算法划分成两个聚类 (2) 选择当前误差平方和 (SSE) 最大的 cluster, 利用 2-means 对其进行划分 (3) 如果当前所有的 cluster 中文档的数量 <=s, s 为指定的阈值, 算法结束 ; 否则, 转到第 (2) 步继续处理 19 K-MEANS 算法种子的选择 聚类结果与初始种子节点的选择是相关的 随机选择的种子可能会导致收敛很慢或者收敛到局部最优 采用启发式方法或其他方法选择好的种子 20 10
11 层次聚类 在无标注的样本集合中建立树状层次分类结构 animal vertebrate fish reptile amphib. mammal invertebrate worm insect crustacean 层次聚类一般分为 自底向上 (bottom-up): agglomerative clustering 自顶向下 (bottom-up): divisive clustering 21 自底向上 (bottom-up) 的层次聚类方法 自底向上 ( 融合 ) 的层次聚类方法从每个单个对象出发, 先将一个对象看成单独一类 然后反复合并两个或多个合适的类别 直至满足停止条件 ( 通常为类别个数 K ) 22 11
12 自顶向下 (top-down) 的层次聚类方法 从对象的全集出发, 一步一步的将其划分为更多的类别 例如 : 在相似图上构造一个最小生成树 : 点代表文档, 边代表距离 然后每一步选择生成树中相似度最小 ( 或距离最远 ) 的边, 将其删除 每删除一条边, 就产生一个新的类别, 当最小的相似度达到某个阈值时算法就可以停止 23 分析 优点 简单, 能灵活处理多粒度的聚类问题, 可使用多种形式的相似性度量或距离度量, 可用于处理多种属性类型 缺点 算法终止条件不易确定, 选择合并或分裂点比较困难 24 12
13 类别间的相似度 在层次聚类中, 涉及到计算两个类别的相似度, 相似度函数的不同, 聚类效果也不一样 最短距离法 :single-link 最长距离法 : complete-link 中间距离法 : average-link 重心法 类平均法 离差平方和法 25 其他聚类算法 基于密度的聚类算法 DBSCAN 算法 : 一个簇中除了边界点以外, 每个点在给定半径区域内必须包含不少于一定数量的邻接点 DENCLUE 算法 : 每个数据点和其他相邻的数据点之间存在一定的影响关系, 基于该影响关系进行簇的划分及合并 自组织映射 (Self-Organizing Map) : 基于神经网络的方法 26 13
14 文本聚类评价方法 聚类结果效果评价 : 分离度 / 紧致度 内部评价 : 只利用数据集本身进行结果比较 外部评价 : 利用标准的分类测试集 最常用的外部评价方法 :F-measure 27 无监督的分类算法 28 14
15 Naïve 文本分类方法 类和类的标注作为已知输入给出 Naïve Classification 输入 : 文档集 D 文档类别 C 以及类别标注 表示 : 每个文档用向量 d j 表示 ; 每个类别的标注 c p 也用向量表示 分类 : 计算向量 d j 和类别 c p 的相似度 : 夹角余弦 29 提纲 文本分类概述 无监督的机器学习算法 有监督的机器学习算法 30 15
16 分类的概述 定义 : 给定分类体系, 将文本分到某个或者某几个类别中 分类模式 : 二类问题 (binary): 一篇文本属于或不属于某一类 ; 多类问题 (multi-class) : 一篇文本属于多个类别中的其中一个类别, 多类问题可拆分成两类问题 ; 一个文本可以属于多类 (multi-label) 很多分类体系 : Reuters 分类体系 中图分类 31 文本分类过程 32 16
17 分类器的评估过程 33 有监督的分类方法 34 17
18 决策树 -Decision Tree 决策树是一种多级分类法, 利用树把一个复杂的分类问题转换成若干个简单的分类问题来解决 决策树最大的特点是采用分级方法通过对训练数据的学习, 总结出一般化的规则, 然后再利用这些规则来逐步分级地解决分类问题 35 Decision Tree: 数据库示例 预测 Play 属性的决策树 预测 36 18
19 通过分割构建 DT 37 DT 用于文档分类 38 19
20 决策分类树的特点 构造好的决策树的关键在于如何选择好的逻辑判断或属性 对于同样一组例子, 可以有很多决策树能符合这组例子 一般情况下, 树越小则树的预测能力越强 要构造尽可能小的决策树, 关键在于选择恰当的逻辑判断或属性 在选择划分节点的特征项和特征取值中, 一般采用信息增益作为选择的标准 39 分类算法 -KNN 方法 KNN 分类算法由 Cover 和 Hart 于 1968 年提出 最近邻法计算待分类样本到所有代表点的距离, 将其归入距离最近的代表点所属的类别 为了克服最近邻法错判率较高的缺陷, 将最近邻推广到 k 近邻, 它选取离待分类样本最近的 k 个代表点, 看这 k 个代表点多数属于那一类, 就把测试样本归于该类 KNN 中的决策规则 y(x,c j ) = di KNN Y(d i,c j )=0 或 1,b j 为阈值 sim ( x, d ) y( d, C ) b i i j j 40 20
21 knn 举例 分类算法 -KNN 方法 新文本 k=1, A 类 k=5,b 类 k=10,b 类 41 分析 KNN 的方法的优点是非常直观便于理解和应用, 实际应用中也非常有效, 是目前应用最为广泛的文本分类算法之一 但是 KNN 方法的缺点也非常明显, 那就是计算代价很高, 每一个测试文本需要和所有的训练样本进行距离计算 采用 KNN 方法需要合理选择 k,k 的选择很大程度上决定了分类性能的好坏 42 21
22 Rocchio 分类 基于 Rocchio 相关反馈的原理 训练样本作为反馈信息 :negative, positive 文本分类 : 计算 d j 与 c p 质心 的距离 43 分类算法 : 贝叶斯分类 贝叶斯决策理论是统计模式分类中的一个最基本的方法 基于贝叶斯假设, 假定文档中词汇在判别文本所属类别时的作用是相互独立的 朴素贝叶斯分类方法独立性假设 给定一个实例的类标签, 实例中每个属性的出现独立于实例中其他属性的出现 朴素分类器可表述为 c naive = arg max P( c c ) n j ci i= 1 P( ω i c j ) 44 22
23 分类算法 - 贝叶斯分类 要对一个新文档分类, 就要从训练集中估计出两组概率值 P(C j ) 和 P(w i C j ) P( c c j的文档个数 ) = = j 总文档个数 N( c ) 1+ N( ) j c j N( c ) k c + N( c k k k ) P( ω i c j ωi 在 c j的文档中出现的次数 1+ Nij ) = c j的文档中出现所有词的次数特征词的个数 + N k kj 45 分析 优点是简单易于理解, 且性能一般比较好, 分类的过程直接而快速 缺点是对稀有词比较敏感, 受类别大小的影响也非常大, 对特征集合过大和噪声数据都比较敏感 46 23
24 支持向量机 Support Vector Machines (SVMs) 用于二元分类的向量空间方法 文档表示为 n 维向量空间 目标 : 在训练样本中找到一个决策面 (hyperplane), 能够将两个类进行最佳的划分 分类 : 基于新文档与 hyperplane 的位置关系 47 分类算法 - 支持向量机 由 V.Vapnik 和其领导的贝尔实验室的小组一起开发出来的一种机器学习的算法 其理论来源自 V.Vapnik 等提出的统计学习理论 目前公认的针对文本分类最有效的机器学习算法 与维度无关 将低维空间中的非线性问题转换为高维空间中的线性问题 如何解决多类的问题? 48 24
25 Ensemble 方法 Bagging/Stacking 方法 训练 R 个分类器 f i, 分类器的参数不同 其中 f i 是通过从训练集合中 (N 篇文档 ) 随机取 ( 取后放回 )N 次文档构成的训练集合训练得到的 对于新文档 d, 用这 R 个分类器去分类, 得到的最多的那个类别作为 d 的最终类别 49 Stacking 方法 - 训练样本 50 25
26 Stacking 方法 - 分类 51 Boosting 方法 类似 Bagging 方法, 但是训练是串行进行的, 第 k 个分类器训练时关注对前 k-1 分类器中错分的文档, 即不是随机取, 而是加大取这些文档的概率 使用同一种机器学习方法 52 26
27 文本维度过高的问题 基本方法 文本高维度问题 选择特征子集 减少 overfitting 问题 降低文本表示的维度 53 文本表示 - 降维技术 特征重构 : 对原始特征进行重新构造, 并映射到低维空间 隐性语义索引 (Latent Semantic Index,LSI) 隐性语义索引根据词条的共现信息探查词条之间内在的语义联系 隐性语义空间实际上是把共现的词条映射到同一维空间上, 而非共现的词条映射到不同的空间上, 这样使得隐性语义空间相比原来的空间维数要小的多, 达到降维的目的 54 27
28 解决高维问题 特征选择 : 依照某一准则从众多原始特征中选择部分最能反映模式类别的统计特性的相关特征, 去除在所有文档中都普遍存在的 对类别区分作用有限的特征 词频函数 : 去除低频词和高频词 信息增益 : 计算词语的类别区别能力 相对熵 : 计算词对类别之间概率分布的影响 CHI 平方 : 计算词与类别之间的相关关系 互信息 : 计算词和类别共同出现的关系 55 文本分类的评估指标 在文本分类中, 一般用准确率 P (Precision) 和召回率 R (Recall) 以及 F1 值来衡量分类系统的性能 对于第 i 个类别 准确率 召回率 F 值 li Pi = m i i 100% li Ri = 100% n Pi Ri 2 F1i = P + R i i 56 28
29 多类分类问题的评价 宏平均 (macro-averaging) 先对每个分类器计算上述量度, 再对所有分类器求平均 关于类别的均值 微平均 (micro-averaging) 先合并所有分类器的偶然事件表中的各元素, 得到一个总的偶然事件表, 再由此表计算各种量度 关于文本的均值 57 Q&A 58 29
摘要 随着 Internet 的迅猛发展和日益普及, 网络文本信息急剧增长, 如何有效的 组织和管理这些海量信息, 并能够快速 准确 全面地获得用户所需要的信息是 当今信息科学技术领域面临的一大挑战 文本分类作为处理和组织大量文本数据 的关键技术, 可以在较大程度上解决信息杂乱现象的问题, 方便用户准确地定位 所需要的信息和分流信息 而且作为信息过滤 信息检索 搜索引擎 文本数据库 数字化图书馆等技术基础,
More information! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $ %% " $ "--/
"##$ "% "##& " "##( )$ "##%! ) "##$ * "##( "##$ "##(!!!!!!!!! ! " # " " $ % " " # # " $ " # " #! " $ "!" # "# # #! &$! ( % "!!! )$ % " (!!!! *$ ( % " (!!!! +$ % " #! $!, $ $ $ $ $ $ $, $ $ "--. %/ % $
More information信息检索与数据挖掘
期中考试 :4 月 20 日 ( 周五 ), 闭卷考试范围 : 上次课 (SVD LSI) 之前的内容 第 10 章文本分类 part1: 文本分类及朴素贝叶斯方法 part2: 基于向量空间的文本分类 part3: 支持向量机及机器学习方法 回顾 : 什么是文本分类 Taxonomies and Classification 文本分类中, 给定文档 d X 和一个固定的类别集合 C= {c 1,
More information目录 决策树 Adaptive Boosting (AdaBoost) Gradient Boost Decision Tree (GBDT) TreeBoost XGBoost 总结
树模型的进化之路 颜发才 facaiyan@gmailcom facaiygithubio 新浪微博算法平台 2017 年 3 月 11 日 目录 决策树 Adaptive Boosting (AdaBoost) Gradient Boost Decision Tree (GBDT) TreeBoost XGBoost 总结 决策树 决策树直观印象进化分支 决策树 直观印象 petal length
More information许丽花 等 应用 3 种遗传分析方法分析养殖鲤与天然群体的遗传差异 第4期 图2 Fig 2 397 图中不同颜色表示不同的聚类 K 值 6 个鲤群体的贝叶斯遗传聚类分析图 Bayesian genetic cluster analysis of t he six populations of com mon carps 表 2 贝叶斯遗传聚类分析中每个群体分属 4 个聚类时的比例 T able 2
More informationK-means
zwp@ustc.edu.cn Office: 1006 Phone: 63600565 http://staff.ustc.edu.cn/~zwp/ http://fisher.stat.ustc.edu.cn 1.1....................... 1 1.2............... 6 1.3.................... 11 1.3.1...............
More informationMicrosoft PowerPoint - 4-朴素贝叶斯.pptx
机器学习 4. 朴素贝叶斯 主要内容 贝叶斯分类器 NB 基本原理 MLE vs. MAP 垃圾邮件分类 Bag of Words 字符识别 主要内容 贝叶斯分类器 NB 基本原理 MLE vs. MAP 垃圾邮件分类 Bag of Words 字符识别 贝叶斯分类器 分类问题目标 : 学习预测函数, 使得某个风险函数 ( 表现度量 ) R(f) 在某个学习机器上达到最小 X 概率误差 : 体育娱乐科学
More informationOverview of MathWorks
MATLAB 机器学习和深度学习技术 卓金武 MathWorks 中国 steven.zhuo@mathworks.cn 2015 The MathWorks, Inc. 1 内容提要 机器学习 何为机器学习 机器学习的常见问题 MATLAB 机器学习技术 Example 1: 设备测试式维护的实现 Example 2: 量化投资 深度学习 深度学习 Vs. 机器学习 深度学习的技术实现 Example
More information第四章 102 图 4唱16 基于图像渲染的理论基础 三张拍摄图像以及它们投影到球面上生成的球面图像 拼图的圆心是相同的 而拼图是由球面图像上的弧线图像组成的 因此我 们称之为同心球拼图 如图 4唱18 所示 这些拼图中半径最大的是圆 Ck 最小的是圆 C0 设圆 Ck 的半径为 r 虚拟相机水平视域为 θ 有 r R sin θ 2 4畅11 由此可见 构造同心球拼图的过程实际上就是对投影图像中的弧线图像
More information<4D6963726F736F667420576F7264202D20313034B0EABB79A4E5B8D5C344BBBCB065AAA9>
嘉 義 縣 104 年 新 港 溪 北 六 興 宮 正 黑 麵 三 媽 盃 小 六 學 藝 競 試 國 文 試 卷 一 一 般 選 擇 題 : 1. 下 列 選 項 中, 哪 一 組 字 的 讀 音 是 相 同 的?(A) 躡 足 / 攝 影 (B) 淒 慘 / 妻 兒 (C) 漠 不 關 心 / 眼 角 膜 (D) 韋 編 / 偉 人 2. 下 列 內 的 部 首, 何 者 正 確?(A) 黎 明
More information凡 例 一 高 淳 县 历 史 悠 久, 文 物 古 迹 颇 丰, 为 全 面 系 统 地 保 存 各 类 文 物 资 料, 介 绍 文 物 工 作 情 况, 达 到 教 育 后 人, 提 供 专 业 研 究 的 目 的, 特 编 纂 本 志 二 本 志 采 用 记 志 述 图 表 等 多 种 体 裁, 翔 实 记 载 高 淳 县 自 旧 石 器 时 代 至 民 国 年 间 的 文 化 遗 存 文
More information康體藝術
320 321 0.12% (340 ) 3.44% (1.001 ) 0.30% (860 ) 5.93% (7.542 ) 7.83% (2.277 ) ( 7,960 1,810 ) 3.36% (9,770 ) 9.08% (2.642 ) 20.27% (5.898 ) ( ) 29.67% (8.63 ) 322 π 323 324 325 326 327 328 329 330 331
More information论文
语义计算与知识检索 研究生课程 语义计算概述与基础漫谈 万小军 北京大学语言计算与互联网挖掘组 http://www.icst.pku.edu.cn/lcwm 2016 年 2 月 24 日 2 自然语言处理回顾 Let s talk! This model shows what a man's body would look like if each part grew in proportion
More information工程项目进度管理 西北工业大学管理学院 黄柯鑫博士 甘特图 A B C D E F G 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 甘特图的优点 : 直观明了 ( 图形化概要 ); 简单易懂 ( 易于理解 ); 应用广泛 ( 技术通用 ) 甘特图的缺点 : 不能清晰表示活动间的逻辑关系 WBS 责任分配矩阵 ( 负责〇审批
More information2013 年 大 陸 書 市 觀 察 2013 年, 新 笑 傲 江 湖 也 引 起 熱 烈 討 論, 首 播 當 晚 已 居 黃 金 檔 電 視 劇 收 視 冠 軍, 進 而 帶 動 了 該 作 品 的 圖 書 銷 量, 之 後 隋 唐 英 雄 傳 精 忠 嶽 飛 等 也 紛 紛 改 編 成 電
2013 年 大 陸 書 市 觀 察 閩 南 師 範 大 學 教 師 萬 麗 慧 2014 年 1 月 9 日 北 京 圖 書 訂 貨 會 上, 北 京 開 卷 公 司 發 佈 了 2013 年 中 國 圖 書 零 售 市 場 報 告 報 告 顯 示,2013 年 中 國 圖 書 零 售 市 場 同 比 增 長 -1.39%, 這 是 繼 2012 年 後 再 次 出 現 的 負 增 長, 且 負
More information201902
104 2019,55(2) 文本分类 TF-IDF 算法的改进研究 1,2 1,2 1,2 叶雪梅, 毛雪岷, 夏锦春, 王波 1. 合肥工业大学管理学院, 合肥 230009 Computer Engineering and Applications 2. 合肥工业大学过程优化与智能决策教育部重点实验室, 合肥 230009 1,2 摘要 : 中国互联网环境的发展, 让大量蕴含丰富信息的新词得以普及
More information(Microsoft Word - 3\271\375\246\321\257R.doc)
東 野 圭 吾 短 篇 集 3 一 徹 老 爹 得 知 母 親 生 下 的 是 男 寶 寶 時, 我 打 從 心 底 感 到 開 心, 因 為 這 代 表 我 終 於 能 夠 逃 離 那 悲 慘 的 生 活 了 而 父 親 的 喜 悅 肯 定 是 遠 勝 於 我 的 母 親 在 產 房 時, 父 親 和 我 在 家 中 等 候 當 我 轉 告 他 醫 院 來 電 報 喜, 他 立 刻 如 健 美 選
More information大 台 北 與 桃 竹 苗 地 區 北 得 拉 曼 巨 木 步 道 新 竹 縣 尖 石 鄉 鎮 西 堡 巨 木 群 步 道 新 竹 縣 尖 石 鄉 鳥 嘴 山 登 山 步 道 苗 栗 縣 泰 安 鄉 加 里 山 登 山 步 道 苗 栗 縣 南 庄 鄉
地 區 步 道 名 稱 蘇 花 古 道 : 大 南 澳 越 嶺 段 困 難 度 分 級 長 度 ( 公 里 ) 2 4.1 宜 蘭 縣 南 澳 鄉 南 澳 古 道 1 3.0 宜 蘭 縣 南 澳 鄉 拳 頭 姆 自 然 步 道 1 1.3 宜 蘭 縣 三 星 鄉 林 務 局 台 灣 百 條 推 薦 步 道 交 通 與 路 況 位 置 交 通 指 南 路 況 註 記 管 理 單 位 步 道 口 位 於
More information信息检索与数据挖掘
信息检索与数据挖掘 2015/5/15 1 信息检索与数据挖掘 第 11 章文本聚类 5 月 18 日周一第 12 章 Web 搜索 5 月 22 日周五图像分类的算法思想 第 13 章多媒体信息检索 & 第 14 章其他应用简介 5 月 25 日周一总复习 5 月 28 日周四晚答疑 不讲课 6 月 1 日周一考试 信息检索与数据挖掘 2015/5/15 2 5 月 18 日周一第 12 章 Web
More information! %! &!! % &
张海峰 姚先国 张俊森 借鉴 的有效教育概念 本文利用 年间的中国省级面板数据估计了平均教育年限 教育数量 和平均师生比率 教育质量 对地区 劳动生产率的影响 本文的实证分析结果表明 以师生比率衡量的教育质量对劳动生产 率有显著且稳健的正效应 在均值处师生比率每上升一个标准差 有助于提高地区劳动生产率约 教育数量对劳动生产率的影响大小部分取决于教育质量的高低 教育质量越高教育数量对劳动生产率的促进效应越大
More information工程教育专业认证准备工作指导手册目录_1.CDR
一 认 证 时 间 节 点 工 作 流 程 与 组 织 体 系 ( 一 ) 工 程 教 育 认 证 工 作 时 间 节 点 ( 参 考 ) 时 间 工 作 内 容 10 月 31 日 前 申 请 11 月 专 业 类 认 证 委 员 会 审 核 申 请, 向 秘 书 处 提 出 是 否 受 理 建 议 12 月 认 证 协 会 下 发 受 理 认 证 申 请 的 通 知 次 年 1 月 3 月 中
More informationPowerPoint Presentation
用 SPSS 作聚类分析 一 聚类分析 (Cluster Aalyss) 简介 聚类分析是直接比较各事物之间的性质, 将性质相近的归为一类, 将性质差别较大的归入不同的类的分析技术 常言道 : 物以类聚, 对事物分门别类进行研究, 有利于我们做出正确的判断 日常生活中, 我们不自觉地用定性方法将人分为 好人 坏人 ; 按熟悉程度分为 朋友 熟人 陌生人 等等 数理统计中的数值分类有两种问题 : 判别分析
More informationPs22Pdf
( ) 1 1 1 6 8 11 16 16 19 21 23 26 26 28 29 31 44 1 2 47 47 49 52 58 64 64 67 70 73 76 76 78 80 90 93 93 94 96 99 102 102 104 105 107 111 111 113 116 119 119 121 124 126 128 128 130 137 140 145 145 148
More informationMicrosoft Word - __日程_定__[1]
西 南 大 学 2009 全 国 博 士 生 学 术 论 坛 ( 出 土 文 献 语 言 文 字 研 究 与 比 较 文 字 学 研 究 领 域 ) 会 议 指 南 2009-10 重 庆 西 南 大 学 简 介 西 南 大 学 是 教 育 部 直 属 重 点 综 合 大 学,211 工 程 重 点 建 设 学 校 由 原 西 南 师 范 大 学 原 西 南 农 业 大 学 2005 年 7 月 合
More informationPs22Pdf
( ) 1 1 6 13 16 29 45 54 73 101 124 1 154 179 196 217 247 268 305 324 347 367 385 2 ( ),,,,,, 1., : 1958 11,, :?,,,,,,, 1 2,,,, :,,, : 1959 2 25, :!,,,,, ( ),,,,,,,,,, : ( ), ( ) ( ),,,,,,,,,,, :,, ;
More information000
出 國 報 告 ( 出 國 類 別 : 其 他 ---- 兩 岸 青 年 交 流 ) 2013 年 臺 灣 大 學 院 校 青 年 赴 大 陸 民 族 院 校 參 訪 交 流 活 動 出 國 報 告 服 務 機 關 : 蒙 藏 委 員 會 姓 名 職 稱 : 娥 舟 文 茂 簡 任 秘 書 兼 副 處 長 韓 慈 穎 科 長 派 赴 國 家 : 中 國 大 陸 出 國 期 間 :102. 8. 25
More information北京大学学报 ( 自然科学版 ) 个不同的层次, 其中第一层有 24 类, 第二层有 340 类 图 1 给出中文新闻信息分类体系中 电子信息产业 这一类别所处的位置 在解决实际的多层文本分类问题时, 要想取得较优的分类性能, 构建一个适度规模的 样本分布合理的训练样本集合是非常关键的, 同时也是非
http://www.cnki.net/kcms/doi/10.13209/j.0479-8023.2015.050.html 北京大学学报 ( 自然科学版 ) Acta Scientiarum Naturalium Universitatis Pekinensis doi: 10.13209/j.0479-8023.2015.050 基于类别层次结构的多层文本分类样本扩展策略 李保利 河南工业大学计算机科学系,
More information表 决, 审 议 程 序 符 合 有 关 法 律 法 规 和 本 公 司 章 程 的 规 定 3 本 议 案 尚 需 提 交 股 东 大 会 审 议, 与 该 等 交 易 有 利 害 关 系 的 关 联 股 东 将 放 弃 在 股 东 大 会 上 对 相 关 议 案 的 投 票 权 ( 二 ) 公
证 券 代 码 :600850 证 券 简 称 : 华 东 电 脑 编 号 : 临 2016-014 上 海 华 东 电 脑 股 份 有 限 公 司 关 于 预 计 2016 年 日 常 关 联 交 易 的 公 告 本 公 司 董 事 会 及 全 体 董 事 保 证 本 公 告 内 容 不 存 在 任 何 虚 假 记 载 误 导 性 陈 述 或 者 重 大 遗 漏, 并 对 其 内 容 的 真 实
More information<4D6963726F736F667420576F7264202D20B9F0D5FEB0ECB7A2A3A832303136A3A93532BAC52E646F63>
广 西 壮 族 自 治 区 人 民 政 府 办 公 厅 文 件 桂 政 办 发 2016 52 号 广 西 壮 族 自 治 区 人 民 政 府 办 公 厅 关 于 印 发 广 西 医 疗 卫 生 服 务 体 系 规 划 (2016 2020 年 ) 的 通 知 各 市 县 人 民 政 府, 自 治 区 人 民 政 府 各 组 成 部 门 各 直 属 机 构 : 广 西 医 疗 卫 生 服 务 体 系
More information103_02.xls
103 學 年 度 大 學 考 試 入 學 分 發 各 系 組 最 低 錄 取 分 數 及 錄 取 人 數 一 覽 表 0001 國 立 臺 灣 大 學 中 國 文 學 系 國 文 x1.50 英 文 x1.25 數 學 乙 x1.00 歷 史 x1.25 地 理 x1.00 32 493.40 **** ----- ----- ----- 0002 國 立 臺 灣 大 學 外 國 語 文 學 系
More information<313032A655A874B2D5B3CCA743BFFDA8FABCD0B7C7AAED2E786C73>
102 學 年 度 大 學 考 試 入 學 分 發 各 系 組 最 低 錄 取 分 數 及 錄 取 人 數 一 覽 表 校 系 0001 國 立 臺 灣 大 學 中 國 文 學 系 國 文 x1.50 英 文 x1.25 數 學 乙 x1.00 歷 史 x1.25 地 理 x1.00 30 491.85 **** 614.02 ----- ----- 0002 國 立 臺 灣 大 學 外 國 語 文
More information柳州历史上的今天内文改版式.FIT)
1 月 1 日 1 月 1 月 1 日 1929 年 1 月 1 日 广 西 省 第 一 次 建 设 会 议 在 柳 召 开 新 年 伊 始, 新 桂 系 执 政 后 召 开 第 一 次 全 省 建 设 会 议, 开 幕 式 在 柳 州 羊 角 山 广 西 实 业 院 内 举 行, 会 期 10 天 省 政 府 各 部 门 负 责 人 名 流 专 家 学 者 等 93 人 参 加 会 议 国 内 著
More information生 產 準 備 您 接 近 生 產 之 注 意 事 項 : 備 妥 住 院 用 物, 勿 遠 行 ( 生 產 用 物 包 ) 最 好 有 人 在 家 陪 伴, 或 和 陪 產 者 保 持 連 繫, 有 任 何 狀 況 可 立 即 趕 到 可 做 家 事 散 步 蹲 下 等 運 動, 以 不 太 累
主題 主題 (1)準媽咪之待產準備及產後保養 (1)準媽咪之待產準備及產後保養 (2)產後如何確保奶水充足 (2)產後如何確保奶水充足 產後病房護理師: 產後病房護理師:黃皖寧 生 產 準 備 您 接 近 生 產 之 注 意 事 項 : 備 妥 住 院 用 物, 勿 遠 行 ( 生 產 用 物 包 ) 最 好 有 人 在 家 陪 伴, 或 和 陪 產 者 保 持 連 繫, 有 任 何 狀 況 可 立
More information省十二届人大常委会
省 十 二 届 人 大 常 委 会 第 二 十 六 次 会 议 文 件 (4) 关 于 中 国 ( 广 东 ) 自 由 贸 易 试 验 区 条 例 ( 试 行 草 案 ) 审 议 结 果 的 报 告 2016 年 5 月 24 日 在 广 东 省 第 十 二 届 人 民 代 表 大 会 常 务 委 员 会 第 二 十 六 次 会 议 上 广 东 省 人 大 法 制 委 员 会 副 主 任 委 员 刘
More informationQ8. 公 營 事 業 機 構 之 公 務 員 兼 具 勞 工 身 分 者, 於 97 年 3 月 19 日 以 前, 原 選 擇 參 加 勞 保, 調 任 其 他 公 營 事 業 機 構 時, 應 改 參 加 公 保 所 謂 調 任 其 他 公 營 事 業 機 構 之 判 別 依 據 ( 或 標
承 保 業 務 常 見 問 題 加 保 Q1. 公 教 人 員 可 否 依 個 人 意 願 選 擇 參 加 公 保? 否 公 保 係 政 府 為 保 障 公 教 人 員 生 活 而 辦 理 之 社 會 保 險, 屬 強 制 性 保 險, 凡 法 定 機 關 或 公 私 立 學 校 編 制 內 之 有 給 專 任 人 員 應 一 律 參 加 保 險 為 被 保 險 人 Q2. 被 保 險 人 同 時
More informationuntitled
1 08 00 11 30 2 08 00 11 30 14 30 17 30 3 4 5 6 100 10 7 12 83339749 8 9 20 10 87766668 31310 87667731 7 5 15 6 15 8 00 11 30 2 30 5 30 12 83337716 11 12 13 14 15 16 17 18 2002 1 1 2 3 4 1 2 3 4 19 08
More information学生工作部处2010年工作总结
夯 实 基 础, 凝 聚 特 色, 打 造 德 学 理 工 学 生 工 作 部 ( 处 ) 武 装 部 2010 年 工 作 总 结 2010 年 是 实 施 十 一 五 规 划 的 收 官 之 年, 是 我 校 建 校 70 周 年 的 庆 祝 之 年, 是 我 校 圆 满 完 成 工 信 部 组 织 的 高 校 党 建 创 优 工 程 评 估 和 北 京 普 通 高 等 学 校 党 建 和 思
More information決議、附帶決議及注意事項
一 通 案 決 議 部 分 : ( 一 ) 104 年 度 中 央 政 府 總 預 算 釋 股 收 入 380 億 元 不 予 保 留 105 非 本 局 職 掌 業 務 年 度 中 央 政 府 總 預 算 釋 股 收 入 288 億 元 如 下 表, 倘 財 政 狀 況 良 好, 原 則 不 予 出 售 ; 釋 股 對 象 以 政 府 四 大 基 金 為 限, 釋 股 費 用 併 同 調 整 預
More information天人炁功行入與感應經驗分享
天 人 炁 功 行 入 與 感 應 經 驗 分 享 天 人 炁 功 行 入 與 感 應 經 驗 分 享 天 人 炁 功 指 導 院 黃 淑 惠 ( 凝 本 ) 劉 建 功 ( 顯 翼 ) 林 瑛 佩 ( 素 擎 ) 黃 淑 惠 : 道 名 凝 本, 隸 屬 天 極 行 宮 劉 建 功 : 道 名 顯 翼, 隸 屬 新 竹 市 初 院 林 瑛 佩 : 道 名 素 擎, 隸 屬 新 竹 市 初 院 497
More informationYYW1.nps
第三章 事务文书 事务文书是党政机关 社会团体 企事业单位办理日常事务时广泛使用的一类文书 包括计划 总结 调查报告 工作研究 规章制度 公示等 事务文书的主要特点是行文主体灵活 行文格式无 法定要求 但相对固定 事务文书的种类很多 本章着重介绍计划 总结 调查报告 工作研究和 公示 第一节 计 划 一 例文阅示 例文一 教育部 2008 年工作要点 2008 年教育工作的总体要求是 认真学习贯彻党的十七大精神
More information穨邱秀玲綜合展望報告.PDF
91-1 1 86 91 86 91 91 8,214 1 86 91 \ 86 87 88 89 90 91 812 842 901 1,082 1,281 1,576 4,071 4,196 4,465 4,646 5,068 5,276 1,309 1,410 1,533 1,585 1,744 1,796 997 961 1,160 1,339 1,529 1,739 4,613 4,928
More informationChinaBI企业会员服务- BI企业
商业智能 (BI) 开源工具 Pentaho BisDemo 介绍及操作说明 联系人 : 杜号权苏州百咨信息技术有限公司电话 : 0512-62861389 手机 :18616571230 QQ:37971343 E-mail:du.haoquan@bizintelsolutions.com 权限控制管理 : 权限控制管理包括 : 浏览权限和数据权限 ( 权限部分两个角色 :ceo,usa; 两个用户
More informationEM算法及其应用
EM 算法原理及其应用 罗维 大纲 基础知识 EM 算法应用举例 EM 算法及其证明 EM 算法的变种 2 EM 算法的名字由来 E 步 M 步 Expectation 期望 Maximization 最大化 EM(Expectation Maximization, 期望最大化 ) 算法 3 笼统的 EM 算法描述 Loop { E 步 : 求期望 (expectation) } M 步 : 求极大
More informationMicrosoft Word - 100-05-23--養生與保健_中山大學_講義
高 雄 市 立 中 醫 醫 院 張 志 浩 醫 師 皮 膚 失 去 彈 性, 變 粗 變 乾 燥, 頭 髮 變 白, 毛 髮 稀 落, 老 人 班, 魚 尾 紋, 眼 袋 突 出 視 力 模 糊, 老 花 眼, 白 內 障 鈣 質 流 失, 腰 酸 背 痛, 骨 質 疏 鬆, 易 骨 折 記 憶 力 降 低, 精 神 不 集 中, 易 怒, 神 經 質, 焦 慮 不 安, 難 入 睡 嗅 覺 改 變
More information1931 9 18,, 4 1933 1 1, 2 21, 1937 7 7,,,, 14, 3500, 2000 1235, 913,,,,,,, 1500, 293. 6 1946,,, 376. 6,, 895714, 3%, 1610883, 5 %, 126,,,,,, 3176123,, 153800, 484899, 354468, 976125, 895714, 239387, 71730,
More information萬里社區老人健康照護手冊
萬 里 社 區 老 人 健 康 照 護 手 冊 1. 心 肺 功 能 的 照 護 a. 每 日 運 動 至 少 30 分 鐘 ( 包 括 熱 身 運 動 ), 運 動 強 度 是 呼 吸 輕 微 增 加, 但 仍 可 互 相 交 談 不 會 有 胸 痛 氣 喘 等 狀 況 發 生, 運 動 有 流 汗 的 情 況 即 表 示 達 到 功 效, 比 較 適 當 的 運 動 包 括 打 太 極 拳 步
More informationMicrosoft Word - 強制汽車責任保險承保及理賠作業處理辦法1000830.doc
法 規 名 稱 : 強 制 汽 車 責 任 保 險 承 保 及 理 賠 作 業 處 理 辦 法 修 正 日 期 : 民 國 100 年 08 月 30 日 第 一 章 總 則 第 1 條 本 辦 法 依 強 制 汽 車 責 任 保 險 法 ( 以 下 簡 稱 本 法 ) 第 四 十 六 條 規 定 訂 之 第 2 條 強 制 汽 車 責 任 保 險 證 有 關 被 保 險 汽 車 之 記 載 事 項,
More informationMicrosoft Word - 06.Understanding of Pregnancy and Birth.doc
大 家 好 今 天 很 高 兴 有 机 会 跟 各 位 探 讨 一 个 题 目 叫 做 认 识 怀 孕 与 生 产 孩 子 是 上 天 赏 赐 给 我 们 的 一 个 礼 物 现 在 怀 孕 的 妈 妈 都 已 经 拿 到 这 个 礼 物 了 而 且 可 能 都 感 觉 到 里 面 活 蹦 乱 跳 每 一 个 妈 妈 在 怀 孕 的 时 候 都 希 望 他 的 孩 子 像 图 片 上 一 样 的 是
More information(➂)11. 炎 炎 夏 日, 即 使 下 起 滂 沱 大 雨, 都 消 除 不 了 令 人 心 煩 的 暑 氣 這 句 話 主 要 想 表 達 什 麼? ➀ 夏 日 裡 經 常 下 著 滂 沱 大 雨, 令 人 心 煩 ➁ 下 著 滂 沱 大 雨 的 日 子, 可 以 消 除 暑 氣 ➂ 夏 日
新 北 市 102 學 年 度 五 年 級 國 語 文 能 力 檢 測 試 卷 五 年 班 座 號 : 姓 名 : 小 朋 友, 這 份 試 卷 共 有 兩 部 分 一 選 擇 題 : 共 32 題 請 依 照 題 意 選 出 答 案, 再 畫 記 在 答 案 卡 上 二 問 答 題 : 共 2 題 請 依 照 題 意 將 回 答 完 整 的 寫 在 答 案 紙 上 (➃)1. 下 列 選 項 中
More information附 件 一 : 办 理 集 中 式 银 期 转 账 业 务 网 点 名 单 序 号 地 区 网 点 名 称 地 址 联 系 人 电 话 23 工 商 银 行 安 徽 省 铜 陵 百 大 支 行 铜 陵 市 长 江 东 路 50 号 鲁 桂 珍 0562-2833893 24 工 商 银 行 安 徽
附 件 一 : 办 理 集 中 式 银 期 转 账 业 务 网 点 名 单 序 号 地 区 网 点 名 称 地 址 联 系 人 电 话 1 安 徽 工 商 银 行 安 徽 省 合 肥 包 河 支 行 合 肥 市 宣 城 路 158 号 关 萌 萌 0551-2868032 2 工 商 银 行 安 徽 省 合 肥 宿 州 路 支 行 合 肥 市 宿 州 路 6 号 张 虎 0551-2676596 3
More information2. 二 年 級 吳 毓 秀 老 師 : 感 謝 午 餐 公 司 平 時 均 能 準 時 送 餐, 但 希 望 能 不 要 使 用 加 工 品, 且 學 生 反 映 希 望 能 多 加 蛋 品 的 食 物 3. 三 年 級 柯 阿 青 老 師 : 雞 肉 有 血 水 味, 請 午 餐 公 司 能 調
新 北 市 土 城 區 土 城 國 民 小 學 100 學 年 度 午 餐 督 導 第 一 次 會 議 會 議 紀 錄 表 時 間 :100 年 9 月 29 日 中 午 12:40 地 點 : 土 城 國 小 第 二 會 議 室 主 席 : 陳 雨 水 校 長 會 議 紀 錄 : 鍾 君 儀 出 席 人 員 : 陳 雨 水 校 長 林 芥 佑 組 長 蘇 昭 宏 主 任 王 文 姬 主 任 陳 原
More information高雄市立五福國民中學九十四學年度第一學期第三次段考二年級本國語文學習領域試題卷
五 福 二 國 P1 高 雄 市 立 五 福 國 民 中 學 102 學 年 度 第 2 學 期 2 年 級 第 三 次 段 考 本 國 語 文 學 習 領 域 試 題 卷 ㄧ 國 字 注 音 :( 每 題 一 分, 共 十 二 分 ) 二 年 級 班 座 號 姓 名 1. ㄔ 梟 2. 萬 惡 淵 ㄙㄡˇ 3. 不 容 置 ㄏㄨㄟˋ 4. 口 ㄓㄨ 筆 伐 5. 鬼 迷 心 ㄑㄧㄠˋ 6. ㄅㄛˊ
More information人 物 春 秋 杨 永 泰 将 其 削 藩 策 略 概 括 为 : 以 经 济 方 法 瓦 解 冯 玉 祥 的 第 二 集 团 军, 以 政 治 方 法 解 决 阎 锡 山 的 第 3 集 团 军, 以 军 事 方 法 解 决 李 宗 仁 的 第 四 集 团 军, 以 外 交 方 法 对 付 张 学
和录像带 希望他能看到家乡的新面貌 还经常托回 选都要家属自行设法邀请 此事招致薛岳昔日部属 乐昌探亲的台胞把亲人的问候与祝福转达 这一切 大感不平 薛岳大半生追随孙中山蒋介石 在北伐 让客居他乡的薛岳异常感动 家乡政府也没有忘记 时期曾与毛泽东周恩来有革命情谊 蒋经国犹是他 这位抗日英雄 专门拨款对他在九峰的故居进行修 的后生晚辈 这位走过波涛壮阔的人生历程 与中 葺 他的祖祠文物及 伯陵堂等建筑物都得到了妥
More information台北老爺校外實地參訪結案報告
產 學 合 作 案 結 案 報 告 書 華 餐 飲 96 產 學 字 第 04 號 中 華 技 術 學 院 餐 飲 系 參 與 國 際 型 宴 會 之 餐 飲 廚 務 及 服 務 技 術 之 研 究 計 畫 甲 方 : 台 北 老 爺 大 酒 店 股 份 有 限 公 司 乙 方 : 中 華 技 術 學 院 餐 飲 管 理 系 計 劃 主 持 人 : 李 沛 溱 / 共 同 主 持 人 : 林 玉 梅
More information2 34 2 41 2 3937 1955 64 14 1957 4 2 1972 3 1 138 7 20 79 8 7 28 66 14 60 25 2 9 79 17 12 189 190 6 43 1 138 1 2 166 174 145 163 468 31 34 358 1118 131 132 513 514 865 58 292 37 21 1 142 232 244
More information,,,,,,, (,, ),,,,,,,,,,,,,,, ,,, 4 11,, ( ),,,, ( ), :, ( ),,, 1995, 66 ; ( ),, 1996, , 3-4,,
,,,,, ( ),,,,, 1936,,, : ( ),,, 146 ,,,,,,, (,, ),,,,,,,,,,,,,,, 1936 4 9,,, 4 11,, ( ),,,, ( ), :, 1936 12 23 7 (1936 4 11 ),,, 1995, 66 ; ( ),, 1996, 990 33, 3-4,, 10 147 2000 3,,,,,,,,, :,,,,,,,,,,,,
More information2 34 2 41 2 3937 1955 64 14 1957 4 2 1972 3 1 138 7 20 79 8 7 28 66 14 60 25 2 9 79 17 12 189 190 6 43 1 138 1 2 166 174 145 163 468 31 34 358 1118 131 132 513 514 865 58 292 37 21 1 142 232 244
More information2002 4,,, 1941,,,,,,,,,,,,,,,,,, : ;:, 1991,
,,,1941 1,,,,,,,,, 1937,,,,,,,,,,,,,,,, 1 2002 4,,, 1941,,,,,,,,,,,,,,,,,, : 1992 4 ;:, 1991,302-351 2 ,,,,,,,,, 1937 2,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, : (1937 2 21 ) ; (1937 2 21 ), (), 1985,252-253,255
More information範本檔
1 保 健 強 身 多 吃 香 蕉 雖 然 香 蕉 有 某 些 食 用 方 面 的 限 制, 但 其 豐 富 的 營 養, 在 食 物 治 療 方 面 亦 有 重 要 的 價 值, 以 下 是 香 蕉 食 療 偏 方, 提 供 給 大 家 做 參 考 : 一 治 胃 潰 瘍 : 飯 前 吃 一 根 香 蕉, 一 日 一 次 即 可, 持 續 食 用, 會 有 不 錯 的 功 效 二 防 治 動 脈
More information糖尿病食譜
1700 ( ) ( ) 344 15 8 53 60 2 420 1 1 50 2 35 3 1 100 ( ) ( ) 120 8 4 12 1 25 2 220cc ( ) ( ) 517 23 21 59 1 60 2 90 4 50 2 35 3 1 4 2 30 2 20 3 20 4 30 5 1 1 2 100 2 1 30 ( ) ( ) 60 15 140 ( ) ( ) 480
More information1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 / /4.5 18 1/4.8 ~1/5.2 1/4.5 ~1/4.2 1/4.76 1/4.76 19 / /4.5 g g g g 3. g g g g 4.1 2 / /4. 5 20 / / 21 g 0.4g 40 2.2~2.3 1/4.6~1/4.3 2.0.2g 0.4g 60 3.2 1/4.60.1g
More information应用监督式学习
何时考虑监督式学习 监督式学习算法接受已知的输入数据集合 ( 训练集 ) 和已知的对数据的响应 ( 输出 ), 然后训练一个模型, 为新输入数据的响应生成合理的预测 如果您尝试去预测现有数据的输出, 则使用监督式学习 所有的 监督式学习 改成 监督学习 技术 监督学习技术可分成分类或者回归的形式 分类技术预测离散的响应 例如, 电子邮件是真正邮件还是垃圾邮件, 肿瘤是小块 中等还是大块 分类模型经过训练后,
More informationOOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数
OOP with Java Yuanbin Wu cs@ecnu OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数 复习 类的复用 组合 (composition): has-a 关系 class MyType { public int i; public double d; public char c; public void set(double
More informationMicrosoft Word - 2015-12-25箕æ−¥ï¼‹å®ı稿;
名 词 工 作 简 报 第 4 期 ( 总 第 240 期 ) 全 国 科 学 技 术 名 词 审 定 委 员 会 事 务 中 心 编 印 2015 年 12 月 25 日 医 学 美 学 与 美 容 医 学 名 词 正 式 公 布 测 绘 学 名 词 ( 第 四 版 ) 等 8 种 科 技 名 词 预 公 布 中 国 社 科 院 秘 书 长 高 翔 出 席 审 定 工 作 会 议 并 讲 话 两
More information98年度即測即評學科測試與即測即評即發證技術士技能檢定簡章
簡 章 103 年 度 即 測 即 評 學 科 測 試 與 即 測 即 評 及 發 證 技 術 士 技 能 檢 定 簡 章 報 名 書 表 勘 誤 表 日 期 103 年 6 月 12 日 封 面 封 面 10302A 10303A 報 檢 人 重 點 摘 要 提 示 1 6. 大 陸 地 區 人 民 ( 大 陸 配 偶 大 陸 學 位 生 ( 陸 生 就 學 ) 及 專 案 許 可 取 得 長 期
More information帝国CMS下在PHP文件中调用数据库类执行SQL语句实例
帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例 这篇文章主要介绍了帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例, 本文还详细介绍了帝国 CMS 数据库类中的一些常用方法, 需要的朋友可以参考下 例 1: 连接 MYSQL 数据库例子 (a.php)
More information谷 德军 等 对 流边 界层 中 公 路 线 源 扩 散的 期 扩 散 的模 拟 式 大 气扩 散 的 方 法 是 把 污 染物 在 大 气 中 的 扩 散 看 成 标 记 粒 子 在 平 均 风 场 约束 下 的 随机 运 动 假 定 粒 子 的运 动 是 相 互独 立 的 向上 的 坐 标 为
谷 德军 等 对 流边 界层 中 公 路 线 源 扩 散的 期 扩 散 的模 拟 式 大 气扩 散 的 方 法 是 把 污 染物 在 大 气 中 的 扩 散 看 成 标 记 粒 子 在 平 均 风 场 约束 下 的 随机 运 动 假 定 粒 子 的运 动 是 相 互独 立 的 向上 的 坐 标 为 时间 步长 的 脉 动速 度 可 以 用 小 匡 每 个 粒 子 的运 动 为 小 分别 代表粒子 在
More information第期 陈功平等!基于内容的短信分类技术 短 信 的 主 体 内 容 由 文 本 组 成因 此 可 以 把 短 信 的分类转化为对短 信 文 本 的 分 类本 文 将 短 信 分 为 和垃圾 短 信 在 文 本 分 类 算 法 中贝 叶 斯 方法拥有很多的优 势并 且 在 垃 圾 邮 件 过 滤 方
华 东 理 工 大 学 学 报 自 然 科 学 版!!!!!! ^ F! O Y 6 M J F 6 M S!! 文章编号 基于内容的短信分类技术 陈功平!!! 沈明玉!! 王! 红!!! 张燕平 合肥工业大学计算机与信息学院!合肥 安徽大学计算机科学与技术学院! 合肥 六安职业技术学院信息工程系!安徽 六安!! 摘要研究了 一 种 基 于 改 进 贝 叶 斯 算 法 的 短 信 分 类 方 法 对
More information张付志.tpf
第卷第期燕山大学学报年月文章编号 :1007-791X (2009) 01-0047-06 基于贝叶斯算法的垃圾邮件过滤技术的研究与改进 张付志, 伍朝辉, 姚 芳 ( 燕山大学信息科学与工程学院, 河北秦皇岛 ) 摘要 : 随着电子邮件的应用与普及, 垃圾邮件的泛滥也越来越多地受到人们的关注 本文对基于贝叶斯的垃圾邮件过滤器的原理及其关键技术进行了详细的描述 针对朴素贝叶斯模型对分类信息过度简化和准确率低等缺点,
More information长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示
More information人和人工智能 狼来了
机器学习基础 赵永红 四川师范大学物理系 人和人工智能 狼来了 李开复 困难 人工 机器 深度 智能 学习 学习 机器如何学习 人类如何学习 机器学习 The Niche for Machine Learning:1997 数据挖掘 从过去的数据预言未来 处理难以手动编程的事情 新闻过滤 TF-IDF 为什么需要 学习 程序员是否万能 人脸识别 物体识别和语言理解均难以通过手动编 程实现 机器学习程序
More informationMicrosoft Word 新_朱靖波_.doc
ISSN 1000-9825, CODEN RUXUEW E-mail: os@iscas.ac.cn Journal of Software, Vol.19, No.3, March 2008, pp.6 639 http://www.os.org.cn DOI: 10.3724/SP.J.1001.2008.006 Tel/Fax: +86-10-62562563 2008 by Journal
More information7)23$$3 ; 1$ 计算机工程与科学 % 此 如何对少数民族语种大量据进行自动归类 已成为包括维吾尔文在内的新疆少数民族自然语言处理领域中的重要研究课题 文本自动归类有分类和聚类两种方法 其中聚类是一种无监督的归类方法 其实质就是对事先不了解的数据集通过计算机自动进行分组 使得同一组内的数据尽
- 11-%& 计算机工程与科学 7)23$$3 ; 1$ 第 卷第 % 期 年 % 月 /-%,/ 文章编号 %&%% 一种结合 和 的维吾尔文文本聚类算法 吐尔地 托合提 艾海麦提江 阿布来提 米也塞 艾尼玩 艾斯卡尔 艾木都拉 新疆大学信息科学与工程学院 新疆乌鲁木齐 摘 要 介绍了 和 聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响 在较大规模文本语料库基础上 分别用 和
More information高 雄 市 政 府 工 務 局 ( 建 管 處 ) 高 雄 市 政 府 法 制 局 高 雄 市 政 府 海 洋 局 高 雄 市 大 寮 區 公 所 台 灣 糖 業 股 份 有 限 公 司 高 雄 區 處 林 廖 嘉 宏 涂 展 晟 莊 烈 權 黃 維 裕 陳 立 民 李 正 方 台 灣 電 力 股
高 雄 市 都 市 計 畫 委 員 會 104 年 3 月 27 日 第 44 次 會 議 紀 錄 一 時 間 : 民 國 104 年 3 月 27 日 ( 星 期 五 ) 下 午 2 時 30 分 二 地 點 : 高 雄 市 政 府 第 四 會 議 室 三 主 席 : 記 錄 : 蒲 茗 慧 四 出 席 委 員 : 陳 主 任 委 員 金 德 劉 副 主 任 委 員 曜 華 詹 委 員 達 穎 賴
More informationMicrosoft Word - 机器学习中的目标函数总结.docx
www.sga.c 机器学习中的目标函数总结 几乎所有的机器学习算法最后都归结为求解最优化问题, 以达到我们想让算法达到的目 标 为了完成某一目标, 需要构造出一个 目标函数 来, 然后让该函数取极大值或极小值, 从而得到机器学习算法的模型参数 如何构造出一个合理的目标函数, 是建立机器学习算法 的关键, 一旦目标函数确定, 接下来就是求解最优化问题, 这在数学上一般有现成的方案 如果你对最优化算法感兴趣,
More information/'*$$ 22 计算机工程与科学!- 服务 :*" 服务等纷纷出现 为了便于用户使用这些软件服务 先后出现了一些软件服务管理平台 如 355!#/#!4!='#2'42 1# 42 $#''# 等 其中较有影响力的 $#''# 已经搜集了 多个! 和 多个 # 信息 随着服务数量的飞速增加 依靠人
/;&"!&( 计算机工程与科学 /'*$$ 22 第 卷第 期 年 月
More informationwhitepaper.dvi
π + π ϕ ϕ ϕ ϕ = ) cos( ) cos( cos cos sin sin cos 3 3 0 1 1 1 3 θ θ θ 3 3 V V q d ϕ ϕ ϕ ϕ ŵϕ ST 1+ ST n n s s + ω ςω + T m p / V K m p T V K (z - 1) ) - z(z α V 1 1 X X C LC L di d dt di q dt 1 1 R sl
More information中国科技论文在线中文稿件模板
面向领域的新闻话题发现的研究 * 米佳, 苗振江 ( 北京交通大学计算机与信息技术学院信息所, 北京 100044) 5 摘要 : 互联网新媒体产生海量的半结构化新闻数据, 它们具备时效短, 动态性强, 结构不规范 对社会舆论具有导向作用等特点 如何将这些数据归类, 提炼出主题信息, 是本文研究的主要问题 本文主要讨论如何将话题发现与追踪技术应用到新闻领域, 试图从新闻文本集合中, 找到主要的核心话题,
More information数据和方法 研究区概况 机载高光谱数据收集 样地冠层光谱数据收集
刘丽娟 庞 勇 范文义 李增元 李明泽 东北林业大学林学院 黑龙江哈尔滨 中国林业科学研究院资源信息研究所 北京 杭州师范大学遥感与地球科学研究院 浙江杭州 将机载 和 高光谱数据整合 既可以获取可见光 近红外 短波红外区间连续的窄波段地物光谱 又能得到很高的空间分辨率 为高覆盖度的森林树种识别又增加了一种新方法 但是由于两种传感器的光谱响应不同 接收到的辐射值差异较大 如何将两种数据有效整合目前仍
More information2
2 3 02 03 04 1 劳 动 者 画 像 性 别 与 年 龄 分 布 涉 诉 劳 动 者 中, 男 性 人 数 为 女 性 人 数 的 近 两 倍, 明 显 多 于 女 性 ; 男 性 劳 动 者 中 40-50 岁 年 龄 段 的 占 比 最 高, 女 性 劳 动 者 中 30-40 岁 年 龄 段 的 占 比 最 高 * 40% 36% 65% 23% 35% 15% 24% 13% 38%
More information--- --- ----,, 2
1 2 3 Brand 19 --- AMA --- 1 --- --- ----,, 2 ,,,, 1 2 3 Product Class 3 1 2 3 4 5 6 7 8 9 4 5 1 50 60 2 6 7 CI CI CI CI CI 8 9 1 2 3 10 11 1 2 1 2 3 4 5 3 12 1 2 3 13 1 2 3 4 5 14 1 2 20-55 3 4 1 2 3
More informationspss.doc
SPSS 8 8.1 K-Means Cluster [ 8-1] 1962 1988 8-1 2 5 31 3 7 20 F2-F3 2 3 F3-F4 3 4 109 8 8-1 2 3 2 3 F2-F3 F3-F4 1962 344 3333 29 9 9.69 1.91 1963 121 1497 27 19 12.37 1.34 1964 187 1813 32 18 9.70 1.06
More information三坐标重复性和再现性分析
四 绘制极差图 五 绘制均值图 六 评价原则测量系统可接受性的通用比例原则 : %GRR 低于 10% 的误差 可接受的测量系统 %GRR 在 10% 到 30% 的误差 根据应用的重要性 测量装置的成本 维修费用等, 可能是可接受的 %GRR 大于 30% 的误差 不可接受, 应尽各种力量以改进这测量系统 区别分类数 (ndc) 要大于或等于 5 极差图评价 : 若所有的极差均受控, 则说明所有评价人都进行了相同的工作
More information吴畏 等 基于 ( 神经网络的人脸识别研究 82#""#6! 2" ("23"!; 其中 为平均人脸 即所有训练样本的均值 为所有样本与平均脸的差构成的矩阵 2 计算矩阵 3 的特征向量 和特征值 则 的特征向量为 3. 特征值仍为 2
文章编号 &%&&%&%& 基于 389 神经网络的人脸识别研究 吴畏 肖南峰 摘要针对人脸识别技术中存在的高维问题 小样本问题和非线性问题展开研究 围绕人脸特征提取 采用基于主成分分析和 (-" 线性鉴别来克服在人脸识别中的小样本问题 同时将人脸图像从高维空间映射到低维空间从而解决了高维问题 在分类识别方面 采用具有很强的非线性映射功能的 ( 神经网络进行模式分类 能够解决人脸识别中的非线性问题
More informationMicrosoft Word docx
证 券 代 码 :300379 证 券 简 称 : 东 方 通 北 京 东 方 通 科 技 股 份 有 限 公 司 投 资 者 关 系 活 动 记 录 表 编 号 :2015-001 投 资 者 关 系 活 动 类 别 特 定 对 象 调 研 媒 体 采 访 新 闻 发 布 会 现 场 参 观 分 析 师 会 议 业 绩 说 明 会 路 演 活 动 其 他 ( 请 文 字 说 明 其 他 活 动 内
More informationNature Inspired Computa-on and Applica-ons Laboratory School of Computer Science and Technology University of Science and Technology of China 任课教师 姓名
Nature Inspired Computa-on and Applica-ons Laboratory School of Computer Science and Technology University of Science and Technology of China Pa#ern Recogni-on Lecture 1 Introduc-on Nature Inspired Computa-on
More information胡 鑫 陈兴蜀 王海舟 刘 磊 利用基于协议分析和逆向工程的主动测量方法对 点播系统进行了研究 通过对 点播协议进行分析 获悉该协议的通信格式和语义信息 总结出了 点播系统的工作原理 在此基础上设计并实现了基于分布式网络爬虫的 点播系统主动测量平台 并对该平台获取的用户数据进行统计分析 获得了 点播系统部分用户行为特征 研究结果对 点播系统的监控及优化提供了研究方法 点播 协议分析 爬虫 主动测量
More information网络民族主义 市民社会与中国外交 & 一 中国网络民族主义所涉及的公共领域 特征与性质 ( & (!! # # ) #
世界政治 年第 期 网络民族主义 市民社会与中国外交 王 军 近年来 网络空间下中国大众民族主义逐渐成为影响中国社会和中国外交的新因素 从中国网络民族主义的政治社会属性和作用上看 它正拓展着中国的公共领域 以国家民族主义和族裔民族主义为核心议题 催生着中国市民社会的新构造 反映着中国的民族主义思潮 推动着网络内外中国大众的民族主义行动 作为一种社会思潮与社会运动 中国大众的网络民族主义因其信息获取能力增强
More informationMicrosoft Word - 2p01
本 章 内 容 比 较 基 础, 主 要 是 为 以 后 章 节 的 学 习 打 好 基 础, 重 点 掌 握 基 本 概 念 考 点 年 份 1. 实 质 重 于 形 式 2006 年 多 项 选 择 题 2. 会 计 要 素 的 确 认 与 计 量 2009 年 单 项 选 择 题 2012 年 判 断 题 3. 谨 慎 性 要 求 2011 年 判 断 题 4. 计 量 属 性 2014 年
More informationDavid
第一部分基础技术 第二章推荐系统中的数据挖掘方法 Xavier Amatriain, Alejandro Jaimes, Nuria Oliver, and Josep M. Pujol i 摘要 : 本章概述了推荐系统中用到的一些重要的数据挖掘技术 首先描述的是常见的数据预 处理方法, 如抽样和降维 其次, 回顾推荐系统中最重要的分类技术, 包括贝叶斯网络和支持向量 机 我们对 K-means 聚类算法进行描述并讨论其几个替代算法
More information一 概要 MLlib 是一个可扩展的 Spark 机器学习库, 由通用的学习算法和工具组成, 包括二元分类 线性回归 聚类 协同过滤 降维 特征提取和转换以及底层优化原语 借助 Spark 分布式计算框架和弹性分布式数据集 (RDD), 能够高效完成机器学习工作 MLlib 提供 scala,jav
Spark MLlib 研究 使用 目录 一 概要... 2 二 数据类型... 2 2.1 本地向量 (Local vector)... 2 2.2 标记点 (Labeled point)... 2 2.3 本地矩阵 (Local matrix)... 3 2.4 分布式矩阵 (Distributed matrix)... 3 三 基本统计分析... 5 3.1 概要统计量 (Summary statistics)...
More informationMicrosoft Word - DCS系统的实践应用与工作经验
DCS 系 统 的 实 践 应 用 与 工 作 经 验 北 京 远 东 仪 表 有 限 公 司 张 洪 垠 摘 要 : 本 文 着 重 介 绍 了 有 关 DCS 系 统 的 选 型 配 置 使 用 与 考 核 等 方 面 要 求, 作 者 介 绍 了 多 年 从 事 DCS 的 工 作 实 践 体 会 和 感 受, 可 作 为 从 事 DCS 系 统 方 面 工 作 的 有 关 人 员 参 考 关
More information1989 1990 1988 1988 1986 p156 1986 p156 1 =10-2 1 =2.8 102 1988 2000 1991 2000 1991 1 =1.6 65 1 =9.3 10-2 1 =9.3 10-2 19901989
More informationFig1 Theforceappliedtothetrainwhenrunning :w = w j +w q (3) :w = w = w 0 +w j (4) w i 121 基本阻力 w r = 600 R ( N/kN) (8) :R : [2] w s [3] w s =0
31 4 2012 8 JournalofLanzhouJiaotongUniversity Vol31No4 Aug2012 :1001-4373(2012)04-0097-07 * 张友兵 张 波 ( 100073) : 分析了列车运行过程中的受力情况 给出了制动过程中减速度的计算方法 并采用正向 反向两种迭代方式计算列车制动曲线 两种方式计算出的制动曲线一致 证明了计算制动曲线的方法是正确的
More information