信息素养教育计划 读者篇 运用 CiteSpace 构建学科知识图谱 分析学科热点和趋势 熊海强 xhqtom@sjtu.edu.cn 2012 年 05 月 10 日
信息素养教育计划 读者篇2 提纲 1. 软件的简单介绍 2. 概念介绍 3. 软件的主界面 4. 软件的操作步骤 5. 案例分析 6. 特殊功能
信息素养教育计划 读者篇3 学科分析的意义 误区 Google 百度打遍天下 利用非全文文献 总之 : 信息重复率高 可信度差 学科定位不准确 学科分析 提高研究起点 提供研究思路 节约研究时间
信息素养教育计划 读者篇4 Citespace 的特点 Citespace 通过引文网络分析, 找出学科领域演进的关键路径 找出学科领域演进的关键文献 ( 知识拐点 ) 分析学科演进的潜在动力机制 分析学科热点和前沿 结合 GoogleEarth 生成地理网络合作图 国外科研人员使用较多的文献计量工具 国内中科院等机构普遍学习和使用的工具 利用 citespace 进行学科分析, 可以科学把握研究领域的核心, 可指导论文开题 文献综述和科研进展
信息素养教育计划 读者篇5 1. 软件的简单介绍 Citespace 美国德雷塞尔大学 (Drexel University, Philadelphia, PA, USA) 信息科学与技术学院教授陈超美博士开发 科学图谱及知识可视化软件, 采用谱聚类的方法对共被引网络进行聚类 显示一个学科或知识域在一定时期发展的趋势与动向 显示若干研究前沿领域的演进历程 本次讲座应用 Citespace Version 3.0.R5 (01/02/2012)
信息素养教育计划 读者篇6 1. 软件的简单介绍 Citespace 的处理流程
信息素养教育计划 读者篇7 1. 软件的简单介绍 Citespace 的安装 开机 是否安装 JAVA 否下载 JAVA 并安装 是 http://www.java.com/zh_cn/ 进入网站 : http://cluster.cis.drexel.edu/~cchen/citespace/ OR 离线开启可直接 webstart
信息素养教育计划 读者篇8 1. 软件的简单介绍 指南文件 CiteSpace 则有详细的百科资料 https://cluster.ischool.drexel.edu:8443/cswiki/index.php/user_ Guide 费用情况 CiteSpace 是完全免费的 许多其它的文献计量软件属于付费软件, 例如 RefViz 扩展性 相关的版本更新必须到指定网站下载, 否则无法及时更新
信息素养教育计划 读者篇9 2. 概念介绍 2.1 共词分析 通过对能够表达某一学科领域研究主题或研究方向的专业术语共同出现在一篇文献中的现象的分析, 判断学科领域中主题间的关系 例如, 在某领域内 A, B, C 三个术语共同出现次数很高, 那么在此领域内 A, B, C 三个词的相关程度很高 术语 A:innovations 术语 B:Competitive advantage Knowledge Management 术语 C:organizational learning 展现该学科的研究结构, 这种研究结构所代表的研究内容就是该学科的约定或重要约定, 分析出这样的学科约定, 也就找到了该学科的学科范式
信息素养教育计划 读者篇10 2. 概念介绍 2.2 共被引分析 共被引分析包括作者共被引和文献共被引 这两种方法虽然选取的分析对象不同, 但二者的原理是一致的 : 当两篇文献 ( 作者 ) 同时被第三篇文献 ( 作者 ) 引用时, 这两篇文献 ( 作者 ) 之间就存在共被引关系 例如 : 文献 A,B,C, 文献 B 和 C 同时引用了文献 A, 则 A 称为 B 和 C 的共被引文献 引用 文献 B: 基于遗传算法的图像跟踪研究 A 称为 B 和 C 的共被引文献 文献 A: 基于自适应模板的图像跟踪算法 B 和 C 称为 A 的共引文献 引用 文献 C: 球面全景图像的拼接算法研究
信息素养教育计划 读者篇11 2. 概念介绍 2.2 共被引分析 共引文献 ( 作者 ) 表明它 ( 他 ) 们在研究主题的概念 理论或方法上是相关的 如果文献 ( 作者 ) 的共被引次数越高, 共被引强度越大, 则证明二者之间的相关度越高 同传统的学者个人归纳 访谈调研等主观方法相比, 共被引分析最大的优势是它数据的客观性 分类的科学性和有效性 引用 文献 B: 基于遗传算法的图像跟踪研究 A 称为 B 和 C 的共被引文献 文献 A: 基于自适应模板的图像跟踪算法 B 和 C 称为 A 的共引文献 引用 文献 C: 球面全景图像的拼接算法研究
信息素养教育计划 读者篇12 2. 概念介绍 2.3 TF-IDF 是一种用于信息检索与信息探勘的常用加权聚类技术 TF-IDF 是一种统计方法, 用以评估一个字或者词对于一个文件集或一个语料库中的其中一份文件的重要程度 基本思想 : 如果某个词或短语在一篇文章中出现的频率 TF 高, 并且在其他文章中很少出现, 则认为此词或者短语具有很好的类别区分能力, 适合用来分类
信息素养教育计划 读者篇13 2. 概念介绍 2.4 互信息 (Mutual Information) 信息论里一种有用的信息度量, 描述两个事件集合之间的相关性 基本思想 : 互信息用来测量一个随机变量包含另一个随机变量的信息量的总和或者是两个随机变量间的统计相关性 2.5 对数似然比 (Log-Likelihood Ratio) 是一种有效的测量两个词之间结合紧密程度的统计模型 基本思想 : 两词 X 和 Y,a b c d 分别代表 X Y 同时出现,X 出现 Y 不出现,X 不出现 Y 出现,X 和 Y 均不出现的次数,N 表示词表中所有的词的个数
信息素养教育计划 读者篇14 3. 软件的主界面 1 2 3 12 4 5 6 7 8 9 10 11 1. 项目 2. 空间状态 3. 运行过程 4. 时间切割 5. 术语来源 6. 术语类型 7. 节点类型 8. 连线 9. 阈值 10. 剪裁 11. 可视化 12. 菜单栏
信息素养教育计划 读者篇15 4. 软件的操作步骤 Citespace
信息素养教育计划 读者篇16 4. 软件的操作步骤 4.1 数据收集
信息素养教育计划 读者篇17 4. 软件的操作步骤 4.1 数据收集 目前每次只能输出 500 篇 保存为纯文本 必须全记录 + 参考文献
信息素养教育计划 读者篇18 4. 软件的操作步骤 4.1 数据收集 ( 特别注意 ) Citespace 文件命名 : download_xxx.txt
信息素养教育计划 读者篇19 4. 软件的操作步骤 4.2 创建项目 1. 创建新项目 2. 项目数据文件夹 3. 下载数据文件夹
信息素养教育计划 读者篇20 4. 软件的操作步骤 4.3 参数设置 1. 时区分割 2. 术语来源 3. 术语类型 对时间进行分割一般默认为 1 年
信息素养教育计划 读者篇21 4. 软件的操作步骤 4.3 参数设置 标题摘要叙词自由词名词短语膨胀词术语 ( 常用 ) 自由词 : 文章的关键词和作者自己标引的词 ( 不够规范 )
信息素养教育计划 读者篇22 4. 软件的操作步骤 4.3 参数设置 共引机构共引术语共引领域共引作者共引国别共引关键词共被引文献 (DCA) 共被引杂志共被引作者资助基金 (JCA) (ACA) 相关文献
信息素养教育计划 读者篇23 4. 软件的操作步骤 4.3 参数设置 CCV( 共被引系数 ) CC( 共被引数量 ) 连线 C( 引文数量 ) 节点
信息素养教育计划 读者篇24 4. 软件的操作步骤 4.3 参数设置 路径寻找最小生成树静态聚类图动态聚类图由于文献较多, 因此需要对复杂的网络进行剪裁 修剪片段网络修剪合并网络以时间片段显示网络显示合并网络
信息素养教育计划 读者篇25 4. 软件的操作步骤 4.3 参数设置 年段内连线数年段内聚类点阈值调谐数年段内引文数
信息素养教育计划 读者篇26 4. 软件的操作步骤 4.4 图谱分析 背景色设置寻找聚类聚类标记 聚类算法 控制面板 术语标记文章标记聚类标记图谱选项
信息素养教育计划 读者篇27 4. 软件的操作步骤 4.4 图谱分析
信息素养教育计划 读者篇28 4. 软件的操作步骤 4.4 图谱分析 时区区分 出版年代 某单个时区内的引文 首次共被引的年份
信息素养教育计划 读者篇29 4. 软件的操作步骤 4.4 图谱表示含义分析 引文年环代表这篇文章的引文历史 ; 引文年轮的颜色代表相应的引文时间 ; 一个年轮的厚度与某个时间分区内引文数量成比例 ; 点击节点中心, 显示数字代表整个时间跨度内的被引次数 ; 两个节点之间连线的颜色表示节点首次共被引的时间 ; 两个节点之间连线的粗细表示节点共被引的次数, 线条越粗表示共被引次数越多 ;
信息素养教育计划 4.软件的操作步骤 读 者篇 左图 热点词汇图 右图 研究前沿视图 其中每个圆形节点代表一个关键词 节点越大表明该关键词在研究领域内 出现的频次越高 是高频关键词 带有紫红色光圈的节点具有较高的中心性 与其它节点之间也联系紧密 30
信息素养教育计划 读者篇31 5. 案例分析 5.1 外文数据案例 5.2 中文数据案例 举例 :image tracking and algorithm 图像跟踪算法
信息素养教育计划 读者篇32 5.1.1 检索策略 检索公式 主题 =image tracking and algorithm 精炼依据 Web of Science; 类别 =computer science information systems; computer science software engineering 检索年限 出版时间 =2007-2012 检索结果 433 篇文献
信息素养教育计划 读者篇33 5.1.2 数据收集 主题词 时间范围
信息素养教育计划 读者篇34 5.1.2 数据收集 精炼
信息素养教育计划 读者篇35 5.1.2 数据收集
信息素养教育计划 读者篇36 5.1.2 数据收集 保存格式
信息素养教育计划 读者篇37 5.1.2 数据收集 命名 download_xxx
信息素养教育计划 读者篇38 5.1.3 创建项目 选择项目目录选择数据目录
信息素养教育计划 读者篇39 5.1.4 参数设置
信息素养教育计划 读者篇40 5.1.5 图谱分析 研究热点
信息素养教育计划 读者篇41 5.1.5 图谱分析 网络汇总表
信息素养教育计划 读者篇42 5.1.5 图谱分析 热点词汇 高频关键词 高中心性关键词 排名 关键词名称 频次 关键词名称 中心性 1 Segmentation 30 Segmentation 0.29 2 Object tracking 18 Color-model 0.13 3 Image process 17 Visual tracking 0.11 4 Motion 16 Model 0.10 5 Particle filter 15 Attention 0.10 6 Visual tracking 14 Particle filter 0.09 7 Augmented reality 12 Linear-discriminant 0.09 8 Tracking-system 12 Pose-estimation 0.07 9 Mean-shift 10 Object tracking 0.06 10 Background-subtraction 8 Contrast-media 0.06
信息素养教育计划 读者篇43 5.1.5 图谱分析 聚类分析
信息素养教育计划 读者篇44 5.1.5 图谱分析 研究前沿
信息素养教育计划 读者45 5.1.5 前沿术语分布 ( 部分 ) 年份术语 ( 频次 ) segmentation(12) 篇2007 Tracking(90),Segmentation(30),images(27) 2008 Model(18),image processing(17),motion(16),vision(13),image 2009 Object tracking(18),particle filter(15),visual tracking(14),augmented reality(12),real-time tracking(12) 2010 Experimentation(8),attention(3) 2011 Kalman-filter(1),Deliberative agents(1) 2012 Mean-shift(6),framework(6),human detection(3),head pose tracking(2),design(2)
信息素养教育计划 读者篇46 5.2.1 检索策略 检索公式 主题 = 中英文扩展 ( 图像跟踪 ) 并且主题 = 中英文扩展 ( 算法 ) 精炼依据 CNKI; 类别 = 计算机软件及计算机应用 检索年限 出版时间 =2000-2012 检索结果 244 篇文献
信息素养教育计划 读者篇47 5.2.2 数据收集 时间范围 主题词
信息素养教育计划 读者篇48 5.2.2 数据收集 精炼
信息素养教育计划 读者篇49 5.2.2 数据收集 保存为 Refworks 此处对文件名称没有要求
5.2.3 信数据转换菜单栏息素养教育计划 读者篇- 数据 - 导入 / 导出 50
信息素养教育计划 读者篇51 5.2.3 数据转换 选择数据库格式转换转换成功 选择源数据目录 选择转换数据存储目录
信息素养教育计划 读者篇52 5.2.4 创建项目 选择项目目录 选择转换数据目录
信息素养教育计划 读者篇53 5.2.5 参数设置
5.2.6 图谱分析 网络汇总表 信息素养教育计划 读者篇54
信息素养教育计划 读者篇55 5.2.6 图谱分析 研究热点
信息素养教育计划 读者篇56 5.2.6 图谱分析 热点词汇 高频关键词 高中心性关键词 排名 关键词名称 频次 关键词名称 中心性 1 目标跟踪 49 图像跟踪 0.55 2 图像跟踪 43 图像分割 0.3 3 粒子滤波 20 目标跟踪 0.29 4 图像处理 19 图像处理 0.23 5 图像分割 15 dsp 0.22 6 图像匹配 12 粒子滤波 0.17 7 模板匹配 11 波门 0.17 8 dsp 10 模板匹配 0.16 9 相关跟踪 10 目标识别 0.13 10 fpga 8 图像跟踪系统 0.1
信息素养教育计划 读者篇57 5.2.6 图谱分析 热点词汇 与图像跟踪相关领域的研究 图像跟踪 目标跟踪 相关跟踪 图像跟踪算法 概率跟踪算法的研究 粒子滤波 模板匹配 确定性跟踪算法的研究 图像处理 图像分割 与图像跟踪系统相关的算法 Dsp 等
信息素养教育计划 读者篇58 5.2.6 图谱分析 聚类分析
信息素养教育计划 读者篇59 5.2.6 图谱分析 研究前沿 时区图
信息素养教育计划 读者60 5.2.6 前沿术语分布 ( 部分 ) 年份术语 ( 频次 ) 标跟踪 (3), 算法 (3), 神经网络 (3) 2001 图像跟踪 (43), 图像匹配 (12) 篇2000 图像处理 (19), 相关跟踪 (10), 特征点 (6), 数字图像处理 (4), 运动目 2002 目标跟踪 (49), 图像分割 (15),dsp(10), 特征提取 (7), 波门 (3) 2003 图像识别 (6), 边缘检测 (6), 人脸跟踪 (5), 卡尔曼滤波 (4), 关节图像 (3), 人脸检测 (3), 红外图像 (3), 相似性度量 (3) 2004 fgpa(8), 中值滤波 (4), 序列图像 (3) 2005 形心跟踪算法 (5), 跟踪算法 (5),mean shift(5), 图像配准 (3), 电子稳 像 (3) 2006 跟踪 (7),kalman 滤波 (4), 识别 (3)
信息素养教育计划 读者61 年份术语 ( 频次 ) 2007 模板匹配 (11), 模板更新 (5), 实时跟踪 (4), 机动目标 (3) 2008 粒子滤波 (20), 背景估计 (3), 焊缝跟踪 (2), 改进卡尔曼滤波 (2), 点目标 (2), 形态滤波 (2), 加权算法 (2) 2009 Mean-shift(6), 目标检测 (5), 尺度空间 (4),camshift(4), 图像检测 (3), 阈值分割 (3), 小波变换 (3), 加权颜色概率分布 (2), 多变量核密度估计 (2),dm642(2) 篇5.2.6 前沿术语分布 ( 部分 ) 2010 均值漂移 (5), 数字视频 (3), 嵌入式系统 (2), 鱼眼镜头 (2), 图像修复 (2), 图像制导 (2), 机器视觉 (2), 智能编辑 (2) 2011 目标识别 (4), 双目视觉 (3),m 估计算法 (1), 区处理 (1), 仿真实验 (1) 2012 红外图像序列 (2), 多核程序设计 (1),sse 指令 (1), 颜色传递 (1), 纹理特征 (1), 弱点动目标 (1), 几何变形 (1), 李群 (1)
信息素养教育计划 读者篇62 5.2.6 图谱分析 研究前沿 图像跟踪算法研究的繁荣期 (2000-2003) 大量高频词汇都聚集在这个时期 目标跟踪 (49) 图像跟踪(43) 图像处理(19) 等 对于传统算法和理论的研究集中 : 特征点 算法 数字图像处理等 图像跟踪算法研究的稳定期 (2004-2009) 保持了对传统算法的研究 : 跟踪 实时跟踪等 出现了少量对新算法的研究 : 形心跟踪算法 改进卡尔曼滤波等 图像跟踪算法研究的创新期 (2010 至今 ) 研究热点出现了很多改变 大量新算法研究 : 均值漂移 嵌入式系统 双目视觉 红外图像序列等
信息素养教育计划 读者篇63 5.2.7 Timeline 视图 选择 Timeline 视图连线对应聚类跨越的时间区域线越宽, 则聚类内部的紧密度越高 聚类名称
信息素养教育计划 读者篇64 6.Citespace 的特殊功能
信息素养教育计划 读者篇65 6.Citespace 的特殊功能
信息素养教育计划 读者篇66 6.Citespace 的特殊功能
信息素养教育计划 读者篇67 6.Citespace 的特殊功能
信息素养教育计划 读者篇68 示例操作 请大家自己尝试一下
信息素养教育计划 读者篇69
信息素养教育计划 读者篇 Thank You!