微 博 信 息 质 量 评 价 模 型 构 建 研 究 莫 祖 英 马 费 成 罗 毅 ( 武 汉 大 学 信 息 资 源 研 究 中 心, 武 汉,430072) [ 摘 要 ] 微 博 信 息 具 有 碎 片 化 特 征, 其 信 息 冗 余 问 题 令 人 担 忧 如 何 对 微 博 信 息 质 量 进 行 评 价 实 现 信 息 过 滤 是 微 博 发 展 中 亟 待 解 决 的 问 题 本 文 从 微 博 信 息 量 信 息 内 容 质 量 信 息 来 源 质 量 和 信 息 利 用 情 况 4 个 方 面 构 建 了 微 博 信 息 质 量 评 价 的 指 标 体 系, 并 通 过 问 卷 调 查, 采 用 层 次 分 析 法 对 指 标 权 重 进 行 设 置, 形 成 了 微 博 信 息 质 量 评 价 模 型, 为 信 息 质 量 评 价 的 实 施 提 供 了 理 论 框 架 [ 关 键 词 ] 微 博 客 信 息 质 量 评 价 指 标 层 次 分 析 法 [ 中 图 分 类 号 ] G203 [ 文 献 标 识 码 ] A [ 文 章 编 号 ] 2095-2171(2013)02-0012-07 (CenterfortheStudiesofInformationResourcesofWuhanUniversity, Wuhan430072) [Abstract] Micro-bloginformationhasacharacteristicoffragmentation, andtheproblemofitsinformation ResearchontheConstructionofQualityEvaluation ModelofMicro-blogInformation MoZuying MaFeicheng LuoYi redundancyisworying.howtoevaluatethequalityofmicro-bloginformationandfiltertheinferiorqualityin- formationisaproblemurgentlytobesolvedinthedevelopmentofmicro-blog.thisarticleconstructsthee- valuationindexsystemofthequalityofmicro-bloginformationfromthequantityofinformation, qualityofinformationcontent, qualityofinformationsourceandinformationutilization.itsetstheindexweightbasedon analytichierarchyprocessandquestionnairesurvey, andconstructsthequalityevaluationmodelofmicrobloginformation.thisresearchprovidesatheoreticalframeworkfortheimplementationofqualityevaluation ofmicro-bloginformation. [Keywords] Micro-blog Qualityofinformation Evaluationindex Analytichierarchyprocess 1 引 言 微 博 (micro-blog ) 是 近 年 来 兴 起 的 一 种 基 于 用 户 关 系 的 信 息 分 享 和 信 息 交 流 平 台 它 集 成 了 手 机 短 信 社 交 网 络 和 BBS 论 坛 的 优 势, 具 有 内 容 简 洁 使 用 便 利 快 捷 易 于 传 播 和 交 互 性 强 的 特 点 微 博 的 发 布 具 有 严 格 的 字 数 控 制, 一 般 控 制 在 140 个 汉 字 以 内, 这 一 特 点 造 成 了 微 博 信 息 的 碎 片 化 特 征 同 时, 由 于 用 户 可 以 更 加 简 短 快 捷 随 性 地 发 布 信 息, 带 来 的 微 博 信 息 冗 余 问 题 令 人 担 忧 在 每 天 [ 基 金 项 目 ] 本 文 为 教 育 部 人 文 社 会 科 学 重 点 研 究 基 地 重 大 项 目 数 字 信 息 资 源 的 质 量 控 制 与 管 理 研 究 (12JJD820008), 中 国 科 学 技 术 信 息 研 究 所 项 目 数 字 信 息 资 源 的 质 量 评 价 研 究 (1108325) 的 研 究 成 果 之 一 [ 作 者 简 介 ] 莫 祖 英, 武 汉 大 学 信 息 资 源 研 究 中 心 博 士 研 究 生, 郑 州 航 空 工 业 管 理 学 院 讲 师, 研 究 方 向 为 信 息 资 源 管 理 ; 马 费 成, 教 授, 博 士 生 导 师, 研 究 方 向 为 信 息 资 源 规 划 与 管 理 情 报 学 理 论 方 法 ; 罗 毅, 硕 士 研 究 生, 研 究 方 向 为 信 息 资 源 管 理 12
快 速 更 新 的 大 量 微 博 信 息 中, 用 户 如 何 更 好 地 获 取 高 质 量 高 价 值 的 微 博 信 息 是 亟 待 解 决 的 问 题 本 文 拟 从 信 息 质 量 角 度 出 发, 通 过 构 建 微 博 信 息 的 质 量 评 价 模 型, 识 别 出 高 质 量 信 息, 为 用 户 判 断 信 息 质 量 提 供 依 据 目 前 国 外 学 者 对 微 博 的 研 究 主 要 以 twitter 为 例, 内 容 集 中 在 对 twiter 用 户 和 tweets 信 息 的 研 究 上 HuaxiaRui 和 Andrew Whinston [1] 通 过 监 测 521 个 活 跃 的 twiter 用 户, 分 析 了 用 户 对 twiter 的 贡 献 率 MarcCheong 及 VincentC.S.Lee [2] 将 微 博 用 于 恐 怖 信 息 的 研 究, 根 据 2009 年 孟 买 恐 怖 袭 击 事 件, 观 察 市 民 在 twiter 中 的 反 应, 并 通 过 智 能 数 据 挖 掘 与 可 视 化, 揭 露 市 民 对 恐 怖 威 胁 的 潜 在 反 应 Andreas C.Sonnenbichler 同 Christopher Bazant [3] 通 过 实 证 研 究 构 建 了 twiter 中 虚 拟 社 区 成 员 的 生 命 周 期 模 型, 研 究 了 虚 拟 社 区 的 整 个 生 存 期 内 各 成 员 角 色 的 发 展 与 变 化 Alex HaiWang [4] 以 twiter 为 例 研 究 垃 圾 信 息 的 行 为, 构 建 了 基 于 用 户 间 关 注 与 朋 友 关 系 的 有 向 社 会 网 络 图 模 型, 以 通 过 机 器 学 习 方 法 实 现 自 [5] 动 识 别 垃 圾 账 号 JanVosecky 等 以 twiter 为 例, 提 出 了 一 种 新 的 基 于 质 量 的 过 滤 与 排 序 tweets 的 方 法 ; 在 tweets 质 量 建 模 中, 不 仅 包 含 内 容 特 征, 还 设 计 了 一 组 新 的 基 于 链 接 的 特 征, 最 后 通 过 机 器 学 习 数 据 训 练 与 测 试 实 现 对 tweets 的 自 动 排 序 与 过 滤 这 些 研 究 多 以 实 证 为 主, 通 过 大 量 数 据 及 模 型 的 建 立 发 现 其 中 的 演 化 规 律 和 对 微 博 信 息 的 过 滤 机 制 国 内 学 者 对 微 博 的 研 究 始 于 2007 年, 逐 年 呈 上 升 趋 势, 并 在 2012 年 达 到 高 峰 研 究 内 容 主 要 集 中 在 4 个 方 面 : 一 是 微 博 的 社 会 网 络 特 征 分 析 [6-9], 包 括 基 于 用 户 网 络 和 消 息 网 络 的 特 征 分 析 ; 二 是 微 博 信 息 的 传 播 模 式 及 影 响 力 研 究 [10-13], 即 把 微 博 看 作 一 种 传 播 媒 介, 基 于 传 播 学 角 度 研 究 微 博 信 息 ; 三 是 微 博 用 户 的 使 用 动 机 及 行 为 研 究 [14-16] ; 四 是 舆 情 分 析 与 预 测 研 究 [17-18], 即 通 过 对 微 博 内 容 的 语 义 分 析 情 感 分 析 进 行 舆 情 监 测 在 微 博 信 息 质 量 [19] 方 面 的 研 究 并 不 多, 帕 尔 哈 提 尼 加 提 等 分 析 研 究 了 企 业 微 博 中 包 含 的 竞 争 性 信 息 构 成 及 其 质 量 评 价 文 中 首 先 将 竞 争 性 信 息 分 为 14 个 类 别, 并 基 于 微 博 内 容 和 用 户 评 论 分 析 其 信 息 形 式, 基 于 用 户 点 击 关 注 等 信 息 分 析 其 行 为 形 式, 最 后 提 出 了 从 信 息 的 相 关 性 可 靠 性 新 颖 性 和 成 本 效 益 等 方 面 对 微 博 [20] 中 的 竞 争 性 信 息 质 量 进 行 评 价 韩 朝 阳 等 基 于 信 度 和 效 度 两 个 维 度, 分 析 研 究 了 面 向 旅 游 应 用 的 微 博 信 息, 发 现 不 同 旅 游 主 题 信 息 的 时 效 性 不 同, 精 确 度 较 低, 微 博 难 以 单 独 承 担 [21] 旅 游 决 策 的 工 具 齐 娜 等 通 过 问 卷 调 研 统 计 分 析 等 方 法 研 究 了 微 博 中 医 疗 健 康 领 域 信 息 的 质 量 问 题, 发 现 微 博 信 息 质 量 不 高 的 原 因 在 于 其 灰 色 信 息 属 性 和 缺 乏 完 善 的 制 度 法 [22] 规 约 束 张 豪 锋 等 通 过 引 入 影 响 因 子 的 概 念, 分 析 研 究 了 教 育 微 博 社 群 中 的 首 贴 质 量, 并 提 出 了 改 进 教 育 微 博 社 群 质 量 的 对 策 总 之, 这 些 研 究 大 多 针 对 微 博 中 某 一 领 域 信 息, 具 有 较 强 的 针 对 性 本 文 以 微 博 信 息 这 一 整 体 概 念 为 对 象, 通 过 构 建 质 量 评 价 指 标 体 系 及 权 重 设 置, 为 微 博 信 息 质 量 评 价 提 供 理 论 框 架 2 微 博 信 息 质 量 评 价 指 标 体 系 目 前 对 于 信 息 质 量 的 定 义, 多 从 两 个 方 面 来 认 识 : 一 是 基 于 用 户 角 度, 由 朱 兰 博 士 的 Fit touse 的 质 量 概 念 引 申 而 来, 认 为 信 息 质 量 是 满 足 用 户 需 求 达 到 用 户 满 意 的 程 度 二 是 基 于 产 品 角 度, 从 信 息 产 品 的 客 观 属 性 方 面 来 考 察 信 息 质 量, 如 信 息 的 及 时 性 完 整 性 真 实 性 可 获 取 性 等 等 本 文 综 合 上 述 两 个 角 度, 分 别 从 信 息 量 信 息 内 容 质 量 信 息 来 源 质 量 和 信 息 利 用 情 况 4 个 方 面 来 评 价 微 博 信 息 的 质 量 2.1 微 博 信 息 量 (A1) 微 博 中 的 信 息 量 大 小 反 映 了 其 所 传 递 信 息 的 多 少, 反 映 了 微 博 信 息 质 量 中 量 的 概 念 本 文 主 要 从 5 个 方 面 来 反 映 信 息 量 特 征 (1) 微 博 中 文 本 信 息 量 (A11), 用 文 本 长 度 L 表 示 :L= N/140,N 表 示 一 条 微 博 信 息 正 文 的 字 数 通 常 规 定 微 博 信 息 字 数 限 制 在 140 字 以 内, 当 L=1 时, 该 微 博 的 信 息 量 达 到 最 大,L 取 值 范 围 为 (0,1] 该 指 标 值 越 大 越 好 (2) 图 片 信 息 量 P(A12): 微 博 中 的 图 片 通 常 是 为 了 更 直 观 地 表 达 文 本 内 容, 表 现 其 真 实 13
性 根 据 后 期 的 调 研 数 据, 我 们 设 定 微 博 中 一 张 图 片 的 信 息 量 P 相 当 于 2 倍 的 文 本 信 息 量 L, 即 P=2L 微 博 中 大 多 只 存 在 一 张 图 片, 若 存 在 两 张, 则 设 P= (2+2/2) *L; 若 存 在 n 张, 则 P=(2+2/2+2/3+ +2/n)*L (3) 视 频 信 息 量 V(A13): 通 常 视 频 信 息 所 表 达 的 内 容 远 大 于 140 个 文 字 所 表 达 的 信 息 量, 且 生 动 直 观, 如 临 现 场 结 合 后 期 的 调 研 数 据, 我 们 设 定 微 博 中 一 个 视 频 的 信 息 量 相 当 于 3 倍 的 文 本 信 息 量, 即 V=3L (4) 超 链 接 信 息 量 S(A14): 通 常 超 链 接 的 网 页 中 包 含 该 微 博 信 息 的 详 细 深 入 报 道, 但 由 于 文 字 信 息 不 如 视 频 信 息 直 观, 且 用 户 使 用 率 较 低, 故 设 定 一 个 超 链 接 的 信 息 量 相 当 于 1/2 的 文 本 信 息 量, 即 S=(1/2)L (5) 长 微 博 信 息 量 L w (A15): 长 微 博 是 微 博 信 息 的 一 种 特 殊 类 型, 通 常 由 专 门 的 转 换 工 具 生 成 即 将 超 过 140 的 文 字 转 换 成 图 片, 然 后 以 图 片 的 形 式 发 表, 以 突 破 微 博 140 字 的 限 [23] 制 转 换 后 的 图 片 中 文 字 清 晰, 不 影 响 用 户 阅 读 长 微 博 最 多 可 支 持 1 万 字, 其 信 息 量 明 显 高 于 普 通 的 微 博 文 本 信 息 根 据 调 研 数 据 设 定 长 微 博 的 信 息 量 L w=3l 2.2 信 息 内 容 质 量 (A2) 信 息 内 容 质 量 反 映 了 微 博 页 面 信 息 中 的 内 容 质 量 特 征, 是 微 博 信 息 质 量 中 质 的 概 念 本 文 主 要 从 5 个 方 面 来 考 察 (1) 微 博 信 息 内 容 的 类 型 (A21): 根 据 微 博 中 经 常 出 现 的 信 息 内 容, 我 们 将 其 分 为 5 种 类 型 :A 新 闻 类 ( 事 实 报 道, 舆 论 监 督 等 ),B 工 作 生 活 感 悟 类,C 百 科 常 识 类 ( 生 活 小 常 识, 人 物 或 内 容 推 介 等 ),D 励 志 类 ( 名 人 名 言 等 ),E 娱 乐 类 ( 冷 笑 话, 趣 事 轶 闻 等 ) 不 同 类 型 的 信 息 内 容 质 量 不 同, 如 我 们 通 常 认 为 新 闻 类 信 息 的 质 量 高 于 娱 乐 类 信 息 (2) 信 息 内 容 的 新 颖 性 (A22): 主 要 体 现 在 微 博 发 布 时 间 上, 发 布 时 间 越 早, 信 息 的 新 颖 性 越 高 这 一 指 标 主 要 体 现 在 新 闻 类 微 博 信 息 中 (3) 信 息 内 容 的 真 实 性 (A23): 主 要 通 过 与 他 人 互 动 来 体 现 互 动 性 越 强 的 信 息, 其 虚 假 的 概 率 越 低 微 博 中 用 户 之 间 的 互 动, 通 过 @ *** 来 实 现 因 此 微 博 中 出 现 @ 且 次 数 越 高, 表 明 该 用 户 与 好 友 之 间 的 互 动 越 强, 在 一 定 程 度 上 说 明 了 该 信 息 及 用 户 具 有 真 实 性 通 常 僵 尸 用 户 的 好 友 很 少, 且 几 乎 不 互 动, 其 发 布 的 信 息 难 以 确 定 真 实 性 (4) 信 息 的 讨 论 热 度 (A24): 有 的 微 博 信 息 中 会 包 含 话 题 ( 用 # 表 示 ), 说 明 该 微 博 参 与 了 某 一 话 题 的 讨 论, 尤 其 是 热 门 话 题 的 讨 论, 在 一 定 程 度 上 反 映 了 该 微 博 内 容 具 有 一 定 的 热 点 关 注 度 (5) 信 息 编 辑 的 正 规 化 (A25): 主 要 通 过 微 博 中 是 否 包 含 标 题 ( ) 来 体 现 通 常 媒 体 微 博 机 构 微 博 发 布 的 信 息 中 会 包 含 标 题, 反 映 了 专 业 媒 体 发 布 信 息 的 正 规 性 标 题 的 包 含 与 否 在 一 定 程 度 上 反 映 了 微 博 信 息 的 编 辑 专 业 化 程 度, 它 能 帮 助 读 者 快 速 了 解 信 息 内 容 2.3 信 息 来 源 质 量 (A3) 微 博 的 信 息 来 源 会 直 接 影 响 其 所 发 布 信 息 的 可 信 度 和 权 威 性 故 信 息 来 源 质 量 是 评 价 与 衡 量 信 息 质 量 的 一 个 重 要 因 素 本 文 拟 从 4 个 方 面 来 考 察 微 博 信 息 来 源 的 质 量 (1) 信 息 发 布 者 类 型 (Ty(u))(A31): 根 据 新 浪 微 博 中 对 信 息 用 户 类 型 的 划 分, 我 们 将 信 息 发 布 者 类 型 分 为 :A 普 通 个 人 用 户 B 微 博 达 人 ( 未 申 请 新 浪 V 认 证 的 真 实 个 人 活 跃 用 户 ) C 认 证 的 名 人 用 户 D 认 证 的 机 构 用 户 ( 学 校 政 府 企 业 等 ) 和 E 认 证 的 媒 体 用 户 通 常 认 为 经 过 认 证 的 用 户 发 布 的 微 博 信 息 可 信 度 较 高 (2) 信 息 发 布 者 的 影 响 力 In(u) (A32): 主 要 由 两 个 指 标 来 反 映, 一 是 信 息 发 布 者 的 粉 丝 数 量 (N 1 (u)) 粉 丝 数 量 反 映 了 发 布 者 的 受 关 注 程 度, 其 粉 丝 数 量 越 大, 发 布 微 博 所 产 生 的 影 响 力 越 大 二 是 信 息 发 布 者 的 粉 丝 质 量 及 等 级 (Q 1 (u)) 粉 丝 质 量 及 等 级 越 高, 发 布 者 的 微 博 传 播 速 度 及 影 响 力 越 强, 易 形 成 优 势 累 积 效 应 二 者 共 同 决 定 信 息 发 布 者 的 影 响 力 为 了 更 好 地 反 映 这 两 个 指 标 与 发 布 者 影 响 力 之 间 的 线 性 变 化 关 系, 我 们 对 自 变 量 取 对 数, 故 假 设 信 息 发 布 者 的 影 响 力 In(u) =log10(n 1 (u))+log10(q 1 (u)) 其 他 测 度 指 标 的 处 理 同 此 14
(3) 信 息 发 布 者 的 活 跃 度 Ac(u) (A33): 由 两 个 指 标 来 反 映, 一 是 发 布 者 单 位 时 间 内 发 布 的 平 均 微 博 数 量 (Mn(u)) Mn 值 越 高, 发 布 者 活 跃 度 越 高 二 是 信 息 发 布 者 所 关 注 的 用 户 数 量 (N 2 (u)) 及 其 质 量 与 等 级 (Q 2 (u)), 它 决 定 了 发 布 者 的 微 博 信 息 来 源 这 一 指 标 反 映 了 发 布 者 获 取 高 质 量 信 息 的 积 极 性, 为 发 布 微 博 信 息 做 储 备, 它 从 另 一 个 方 面 反 映 了 信 息 发 布 者 的 活 跃 度 故 本 文 假 设 信 息 发 布 者 的 活 跃 度 Ac(u) =log10 (Mn(u)) +log10 (N 2 (u)) + log10(q 2 (u)) (4) 信 息 发 布 者 的 可 信 度 (A34): 由 两 个 指 标 来 反 映, 一 是 信 息 发 布 者 的 级 别 (level), 表 示 其 开 通 微 博 时 间 的 长 短 级 别 越 高, 使 用 微 博 时 间 越 长, 其 可 信 度 越 高 二 是 信 息 发 布 者 的 个 人 资 料 完 备 程 度 个 人 信 息 的 完 备 度 越 高, 其 可 信 度 越 高 2.4 信 息 利 用 指 标 (A4) 信 息 利 用 情 况 是 基 于 用 户 对 微 博 信 息 的 利 用 ( 收 藏 转 发 评 论 等 ) 来 考 察 微 博 信 息 质 量 信 息 的 使 用 率 在 一 定 程 度 上 反 映 了 用 户 对 该 信 息 质 量 的 评 价 本 文 主 要 从 3 个 方 面 来 考 察 (1) 微 博 信 息 价 值 的 用 户 认 可 度 (Va(a)) (A41): 通 常 微 博 用 户 在 认 可 某 一 微 博 信 息 的 价 值 性 和 真 实 性 的 情 况 下 才 会 收 藏 或 转 发 微 博, 因 此, 一 条 微 博 被 用 户 转 发 的 次 数 和 被 收 藏 的 次 数 在 一 定 程 度 上 反 映 了 该 微 博 信 息 的 价 值 我 们 认 为, 转 发 次 数 和 收 藏 次 数 越 高, 该 微 博 的 价 值 越 高, 故 假 定 微 博 信 息 的 价 值 Va(a)=log10(Tr(a))+log10(St(a)),Tr(a) 表 示 微 博 的 转 发 次 数,St(a) 表 示 收 藏 次 数 (2) 微 博 信 息 的 受 关 注 度 (At(a))(A42): 由 用 户 评 论 数 来 反 映 某 一 微 博 的 评 论 数 量 在 一 定 程 度 上 反 映 了 用 户 对 该 微 博 信 息 讨 论 的 热 度, 评 论 数 量 越 多, 该 信 息 的 受 关 注 程 度 越 高, 故 假 定 微 博 信 息 的 受 关 注 度 At(a) = log10(re(a)),re(a) 表 示 用 户 评 论 数 (3) 微 博 信 息 的 好 评 度 (Su(a))(A43): 由 微 博 被 赞 的 次 数 来 反 映 赞 表 示 用 户 同 意 信 息 中 包 含 的 观 点 事 实 等, 是 对 信 息 内 容 正 确 性 的 肯 定 我 们 认 为, 赞 的 次 数 越 高, 则 用 户 的 好 评 度 越 高, 故 假 定 微 博 信 息 的 好 评 度 Su(a)=log10(G(a)),G(a) 表 示 微 博 被 赞 的 次 数 这 四 个 方 面 从 不 同 角 度 反 映 了 微 博 信 息 质 量 的 高 低, 是 进 行 质 量 评 价 的 重 要 组 成 要 素 微 博 中 的 信 息 量 和 信 息 内 容 质 量 主 要 测 评 了 微 博 信 息 的 客 观 质 量, 这 些 指 标 值 在 微 博 信 息 发 布 的 那 一 刻, 由 信 息 发 布 者 决 定, 不 随 时 间 的 变 化 而 变 化 信 息 来 源 质 量 反 映 了 信 息 发 布 者 的 客 观 特 征, 其 指 标 值 变 化 率 较 慢, 在 数 据 采 集 期 不 长 的 情 况 下, 可 取 中 间 的 两 天 来 集 中 采 集 信 息 发 布 者 数 据, 相 当 于 取 平 均 值 而 忽 略 其 变 化 率 信 息 利 用 情 况 是 从 用 户 角 度 来 评 价 微 博 信 息 质 量, 其 指 标 值 随 时 间 不 断 改 变, 因 此 应 注 重 对 其 质 量 变 化 规 律 的 研 究 3 基 于 AHP 方 法 的 指 标 权 重 确 定 在 评 价 指 标 体 系 构 建 的 基 础 上, 本 文 采 用 层 次 分 析 法 (AHP) 来 确 定 各 指 标 权 重 层 次 分 析 法 是 一 种 定 性 与 定 量 相 结 合 的 决 策 方 法, 它 通 过 构 建 判 断 矩 阵, 对 各 层 次 指 标 的 重 要 性 两 两 对 比, 并 采 用 1-9 标 度 法 进 行 打 分, 通 过 计 算 各 矩 阵 的 最 大 特 征 值 和 相 应 的 特 征 向 量 进 行 一 致 性 检 查, 最 终 得 出 各 指 标 权 重 3.1 构 建 判 断 矩 阵 首 先, 根 据 上 述 评 价 指 标 体 系 建 立 5 个 判 断 矩 阵, 它 们 分 别 是 (A1,A2,A3,A4), (A11, A12,A13, A14, A15), (A21, A22, A23, A24, A25),(A31,A32,A33,A34), (A41,A42,A43) 中 指 标 重 要 性 的 两 两 对 比, 以 获 取 指 标 间 的 相 对 重 要 性 其 次, 对 评 价 指 标 的 重 要 性 进 行 小 范 围 调 研 根 据 评 价 指 标 设 计 调 查 问 卷, 调 查 微 博 用 户 对 各 指 标 重 要 性 的 认 知 问 卷 包 括 三 个 部 分 : 微 博 信 息 页 面 的 客 观 指 标 ( 包 括 信 息 量 和 信 息 内 容 质 量 两 方 面 ) 微 博 信 息 的 用 户 利 用 指 标 和 微 博 信 息 发 布 者 指 标, 共 计 25 个 题 项 问 卷 设 置 采 用 Likert5 级 量 表, 来 表 示 重 要 程 度 调 查 对 象 主 要 是 在 校 大 学 生, 包 括 本 科 生 硕 士 和 博 士 研 究 生 这 类 对 象 通 常 使 用 微 博 较 为 频 繁, 它 已 成 为 好 友 交 流 及 时 获 取 信 息 的 重 要 工 具 在 调 查 方 法 上, 采 用 随 机 选 取 的 方 式 进 行 问 卷 发 放, 共 发 放 问 卷 100 份, 收 15
回 98 份 在 收 回 的 问 卷 中, 有 些 问 卷 的 填 写 出 现 连 续 若 干 个 问 题 答 案 相 同 的 现 象, 我 们 将 其 视 为 无 效 问 卷 ; 另 有 2 位 调 查 对 象 几 乎 没 有 登 录 过 微 博, 其 填 写 的 问 卷 也 不 宜 采 纳 剔 除 9 份 无 效 问 卷, 保 留 有 效 问 卷 89 份 从 样 本 数 据 中 调 查 对 象 的 特 征 分 布 来 看, 他 们 的 年 龄 大 多 在 18~26 岁 之 间, 以 本 科 和 硕 士 研 究 生 为 主 其 中,91.2% 的 用 户 使 用 微 博 时 间 超 过 一 年,60.5% 的 用 户 每 天 登 陆 微 博 的 频 率 超 过 2 次, 由 此 可 见 调 查 对 象 对 微 博 较 为 熟 悉, 保 证 了 本 次 调 研 数 据 的 有 效 性 在 数 据 信 度 方 面, 三 组 变 量 的 克 隆 巴 赫 α 系 数 值 分 别 为 0.729 0.756 和 0.764, 均 大 于 0.7 这 一 标 准, 说 明 各 组 变 量 具 有 良 好 的 内 部 一 致 性 为 了 获 取 指 标 间 的 相 对 重 要 度, 先 计 算 其 绝 对 重 要 度 本 文 依 据 调 研 数 据, 计 算 各 指 标 变 量 的 平 均 值, 来 表 示 绝 对 重 要 度 各 指 标 的 绝 对 重 要 度 如 表 1 所 示 表 1 评 价 指 标 的 绝 对 重 要 度 评 价 指 标 极 小 值 极 大 值 均 值 评 价 指 标 极 小 值 极 大 值 均 值 发 布 者 的 权 威 性 与 可 信 度 1 5 4.31 话 题 (#) 1 5 3.38 用 户 的 粉 丝 质 量 及 等 级 1 5 3.91 用 户 的 粉 丝 人 数 1 5 3.34 意 见 领 袖 转 发 1 5 3.89 文 本 字 数 1 5 3.34 发 布 时 间 1 5 3.72 赞 的 次 数 1 5 3.27 用 户 所 属 的 类 别 1 5 3.72 所 关 注 用 户 的 质 量 及 等 级 1 5 3.20 转 发 次 数 1 5 3.70 标 题 ( ) 1 5 3.15 信 息 内 容 类 型 1 5 3.60 超 链 接 信 息 量 1 5 3.11 评 论 次 数 1 5 3.56 @ 他 人 的 次 数 1 5 2.99 长 微 博 2 5 3.55 用 户 发 布 的 微 博 数 量 1 5 2.97 视 频 信 息 量 1 5 3.49 用 户 的 个 人 资 料 完 备 程 度 1 5 2.88 图 片 信 息 量 1 5 3.45 用 户 的 级 别 1 5 2.78 收 藏 的 次 数 1 5 3.38 用 户 的 关 注 人 数 1 5 2.75 将 指 标 的 绝 对 重 要 度 进 行 两 两 对 比, 并 采 用 1-9 标 度 法 进 行 打 分, 得 到 各 判 断 矩 阵 值, 如 表 2-1 2-2 2-3 2-4 2-5 所 示 表 2 表 2-1 横 / 纵 A1 A2 A3 A4 A1 1 1 1 1 A2 1 1 1 A3 1 1/2 A4 1 评 价 指 标 两 两 对 比 判 断 矩 阵 表 2-2 横 / 纵 A11 A12 A13 A14 A15 A11 1 1 1/2 2 1/2 A12 1 1 3 1 A13 1 4 1 A14 1 1/4 A15 1 表 2-3 横 / 纵 A21 A22 A23 A24 A25 A21 1 1/2 6 2 4 A22 1 7 3 5 A23 1 1/4 1/2 A24 1 2 A25 1 表 2-4 横 / 纵 A31 A32 A33 A34 A31 1 1 7 8 A32 1 6 7 A33 1 2 A34 1 表 2-5 横 / 纵 A41 A42 A43 A41 1 1 3 A42 1 3 A43 1 3.2 指 标 权 重 的 确 定 在 构 建 判 断 矩 阵 的 基 础 上, 计 算 各 指 标 权 重, 具 体 步 骤 如 下 : (1) 计 算 判 断 矩 阵 A n*n 中 每 行 的 几 何 平 均 值 [24] :w - i = ( w - 1,w - 2,,w - n ) n n a ij,i=1,2,3,n, 得 到 w - = (2) 归 一 化 处 理 :w i= w- i n w - i i=1,i=1,2,3, 16
n, 得 到 各 指 标 权 重 :w= ( w 1,w 2,,w n ) (3) 一 致 性 检 验 :C.R.= λmax -n ( n-1 ) R.I., 其 中 λ max 为 矩 阵 A 的 最 大 特 征 值,R.I. 为 平 均 随 机 一 致 性 指 标, 可 通 过 查 表 得 到 其 值 当 C.R. 0.10 时, 判 断 矩 阵 具 有 一 致 性 表 2 中 5 个 判 断 矩 阵 的 C.R. 值 分 别 为 0.0226 0.0116 0.0109 0.0152 0.00, 均 小 于 0.1, 故 该 判 断 矩 阵 具 有 一 致 性 根 据 这 三 个 步 骤, 计 算 出 各 指 标 权 重, 以 确 定 指 标 在 评 价 目 标 中 的 相 对 重 要 性 程 度 4 构 建 评 价 模 型 根 据 评 价 指 标 体 系 及 其 权 重 的 计 算, 微 博 信 息 质 量 评 价 模 型 如 图 1 所 示 模 型 中 的 数 字 表 示 指 标 权 重, 其 中 一 级 指 标 权 重 是 相 对 于 总 目 标 ( 微 博 信 息 质 量 评 价 ) 的 权 重, 二 级 指 标 权 重 是 相 对 于 一 级 指 标 的 权 重 在 实 施 评 价 时, 给 出 各 指 标 的 得 分, 即 可 计 算 出 微 博 信 息 的 质 量 得 分, 实 现 了 微 博 信 息 质 量 评 价 的 量 化 根 据 图 1 中 的 评 价 指 标 权 重, 对 指 标 的 相 对 重 要 性 进 行 分 析, 具 体 如 下 : (1) 在 4 个 一 级 指 标 中, 它 们 的 权 重 差 别 不 大, 说 明 重 要 程 度 相 当 其 中 信 息 利 用 指 标 的 权 重 稍 高 (0.2951), 说 明 用 户 在 评 价 微 博 信 息 质 量 时, 较 多 地 参 考 该 信 息 的 利 用 情 况, 注 重 微 博 信 息 的 使 用 率 高 低 图 1 微 博 信 息 质 量 评 价 模 型 (2) 在 信 息 量 指 标 中, 视 频 和 长 微 博 对 微 博 信 息 量 的 影 响 程 度 最 大, 其 次 是 图 片 信 息 量 文 本 信 息 量, 这 在 一 定 程 度 上 反 映 了 不 同 类 型 信 息 所 包 含 的 信 息 量 大 小 不 同 超 链 接 包 含 的 信 息 量 最 小, 其 原 因 可 能 是 微 博 用 户 很 少 打 开 文 本 中 的 超 链 接 来 获 取 信 息 (3) 在 信 息 内 容 质 量 方 面, 信 息 内 容 的 新 颖 性 权 重 明 显 高 于 其 他 指 标, 说 明 微 博 用 户 较 为 重 视 信 息 发 布 的 及 时 性, 充 分 体 现 了 微 博 平 台 的 时 效 性 特 征 信 息 内 容 类 型 也 是 影 响 信 息 内 容 质 量 的 重 要 因 素 通 过 用 户 调 研 发 现, 在 上 述 5 种 信 息 类 型 中, 它 们 的 质 量 高 低 依 次 是 新 闻 类 百 科 常 识 类 工 作 生 活 感 悟 类 励 志 类 和 娱 乐 类 这 是 用 户 基 于 类 型 的 总 体 认 知, 不 能 具 体 到 某 一 条 微 博 中 信 息 讨 论 热 度 和 编 辑 的 正 规 化 对 信 息 内 容 质 量 影 响 较 小 (4) 在 信 息 来 源 质 量 方 面, 发 布 者 类 型 的 权 重 最 高 通 过 调 研 发 现, 在 上 述 5 种 发 布 者 类 型 中, 它 们 的 权 威 性 大 小 依 次 是 认 证 的 机 构 用 户 认 证 的 媒 体 用 户 认 证 的 名 人 用 户 微 博 达 人 和 普 通 个 人 用 户 经 过 认 证 的 信 息 发 布 者 的 权 威 性 明 显 高 于 未 经 过 认 证 的 发 布 者, 由 此 可 见, 发 布 者 是 否 经 过 认 证 是 考 察 信 息 来 源 质 量 的 重 要 因 素 发 布 者 的 影 响 力, 即 发 布 者 的 粉 丝 数 量 粉 丝 质 量 及 等 级, 也 是 影 响 信 息 来 源 质 量 的 重 要 因 素 (5) 在 信 息 利 用 指 标 中, 用 户 认 可 度 和 信 息 受 关 注 度 的 权 重 较 大, 信 息 好 评 度 明 显 较 小 这 说 明 用 户 转 发 次 数 收 藏 次 数 和 评 论 数 对 微 博 信 息 质 量 的 判 断 影 响 较 大, 是 关 键 影 响 因 素 总 之, 微 博 信 息 质 量 的 评 价 是 用 户 获 取 高 17
质 量 信 息 的 前 提 和 基 础, 如 何 客 观 准 确 地 评 价 微 博 信 息 质 量 发 现 影 响 微 博 质 量 的 关 键 要 素, 是 实 现 微 博 质 量 控 制 提 高 微 博 信 息 质 量 的 重 要 基 础 本 文 通 过 构 建 质 量 评 价 指 标 体 系 及 设 置 权 重, 对 微 博 信 息 质 量 评 价 进 行 了 初 步 的 理 论 探 索 与 研 究, 在 以 后 的 研 究 中, 我 们 将 进 一 步 深 化 实 践 研 究, 探 索 如 何 实 施 微 博 信 息 质 量 评 价 参 考 文 献 [1] RuiHX, WhinstonA.Informationoratention? AnempiricalstudyofusercontributiononTwiter[J].InformationSystemE-BusinessManagement, 2012(10):309-324 [2] CheongM, LeeVCS.Amicroblogginḡbasedapproachtoterorisminformatics: Explorationandchroniclingcivilian sentimentandresponsetoterorismeventsviatwiter[j].informationsystemfront,2011(13):45-59 [3] SonnenbichlerAC, BazantC.Applicationofacommunitymembershiplifecyclemodelontaḡbasedcommunitiesin Twiter[A]//Proceedingsofthe34thAnnualConferenceoftheGeselschaftfurKlassifikatione.V[C].Karlsruhe, 2010:301-309 [4] WangAH.MachinelearningforthedetectionofspaminTwiternetworks[A]//ObaidatMS, TsihrintzisGA, Filipe J(eds).e-BusinessandTelecommunications 7thInternationalJointConference,ICETE2010, Athens, Greece, July26-28, 2010, RevisedSelectedPapers[C].CCIS222.SpringerBerlinHeidelberg, 2012:319-333 [5] VoseckyJ, LeungK W, NgW.Searchingforqualitymicroblogposts:filteringandrankingbasedoncontentanalysis andimplicitlinks[a]//leesḡ, PengZ, ZhouX, etal(eds.).databasesystemforadvancedapplications 17thInternationalConference, DASFAA2012, Busan, SouthKorea, April15-19, 2012, Proceedings, PartI[C]. LNCS7238.SpringerBerlinHeidelberg, 2012:397-413 [6] 平 亮, 宗 利 永. 基 于 社 会 网 络 中 心 性 分 析 的 微 博 信 息 传 播 研 究 以 Sina 微 博 为 例 [J]. 图 书 情 报 知 识,2010(6): 92-97 [7] 田 占 伟, 隋 玚. 基 于 复 杂 网 络 理 论 的 微 博 信 息 传 播 实 证 分 析 [J]. 图 书 情 报 工 作,2012(8):42-46 [8] 王 勇, 李 洁. 奥 运 微 博 信 息 传 播 的 实 证 研 究 [J]. 中 国 报 业,2012(11):30-31 [9] 马 捷 等. 微 博 信 息 生 态 链 构 成 要 素 与 形 成 机 理 [J]. 图 书 情 报 工 作,2012(18):73-77 [10] 吴 雨 蓉. 微 博 信 息 传 播 模 式 分 析 [J]. 渤 海 大 学 学 报 ( 哲 学 社 会 科 学 版 ),2012(2):140-143 [11] 陈 远, 袁 艳 红. 微 博 信 息 传 播 效 果 实 证 研 究 [J]. 信 息 资 源 管 理 学 报,2012(3):28-34 [12] 李 畅. 微 博 信 息 传 播 的 把 关 对 策 研 究 [J]. 西 南 科 技 大 学 学 报 ( 哲 学 社 会 科 学 版 ),2012(3):91-96 [13] 刘 海 波. 微 博 信 息 传 播 的 5W 解 读 [J]. 福 建 广 播 电 视 大 学 学 报,2010(6):89-96 [14] 赵 文 兵 等. 微 博 客 用 户 特 性 及 动 机 分 析 以 和 讯 财 经 微 博 为 例 [J]. 现 代 图 书 情 报 技 术,2011(2):69-75 [15] 李 芳, 曲 豫 宾. 大 学 生 微 博 使 用 动 机 模 型 实 证 研 究 [J]. 福 建 论 坛 ( 社 科 教 育 版 ),2010(8):115-118 [16] 王 娟. 微 博 客 用 户 的 使 用 动 机 与 行 为 基 于 技 术 接 受 模 型 的 实 证 研 究 [D]. 济 南 : 山 东 大 学,2010.4 [17] 高 永 梅. 微 博 信 息 监 测 应 用 与 算 法 研 究 [J]. 计 算 机 时 代,2012(6):7-9 [18] 郑 娟, 祝 宁. 基 于 信 息 传 播 模 式 的 微 博 信 息 挖 掘 与 应 用 [J]. 新 闻 世 界,2011(5):91-92 [19] 帕 尔 哈 提 尼 加 提, 黄 晓 斌. 微 博 客 的 竞 争 性 信 息 构 成 与 质 量 评 价 [J]. 情 报 理 论 与 实 践,2012(5):10-14 [20] 韩 朝 阳, 张 仁 军. 面 向 旅 游 应 用 的 微 博 信 息 信 度 和 效 度 评 价 [J]. 重 庆 理 工 大 学 学 报 ( 社 会 科 学 版 ),2011(10):37-40 [21] 齐 娜, 宋 立 荣. 医 疗 健 康 领 域 微 博 信 息 传 播 中 的 信 息 质 量 问 题 [J]. 科 技 导 报,2012,30(17):60-65 [22] 张 豪 锋, 杨 绪 辉. 教 育 微 博 社 群 中 首 贴 质 量 的 分 析 与 对 策 [J]. 远 程 教 育 杂 志,2012(2):98-103 [23] 长 微 博. 百 度 百 科 [EB/OL].[2013-04-27].htp :// baike.baidu.com/view/6194369.htm [24] 郭 亚 军. 综 合 评 价 理 论 与 方 法 [M]. 北 京 : 科 学 出 版 社,2002:30-35 ( 收 稿 日 期 :2013-05-07) 18