第 56 卷 第 5 期 2016 年 5 月 电 讯 技 术 Telecommuicatio Egieerig Vol. 56,No. 5 May,2016 doi:10. 3969 / j. iss. 1001-893x. 2016. 05. 003 引 用 格 式 : 俞 鸿 波. 基 于 关 联 性 的 目 标 动 向 热 点 分 析 [ J]. 电 讯 技 术,2016,56(5):483-489. [ YU Hogbo. Hot spot aalysis based o correlatio of target activity iformatio[ J]. Telecommuicatio Egieerig,2016,56(5):483-489. ] * 基 于 关 联 性 的 目 标 动 向 热 点 分 析 ** 俞 鸿 波 ( 中 国 西 南 电 子 技 术 研 究 所, 成 都 610036) 摘 摇 要 : 为 了 从 海 量 传 感 器 数 据 中 及 时 发 现 重 要 目 标 的 动 向, 提 出 了 一 种 目 标 动 向 信 息 表 征 及 关 联 方 法, 即 从 多 源 异 类 传 感 器 获 取 的 信 息 中 抽 取 出 目 标 关 联 要 素 进 行 动 向 表 征, 利 用 语 义 决 策 树 实 现 动 向 要 素 聚 类, 通 过 知 识 规 则 进 行 关 联 匹 配 扩 展, 从 而 发 现 目 标 动 向 的 热 点, 并 进 一 步 统 计 分 析 目 标 活 动 规 律 与 发 展 趋 势 实 验 表 明 所 提 出 的 基 于 关 联 性 的 目 标 动 向 热 点 分 析 算 法 准 确 率 高, 具 有 实 用 价 值 关 键 词 : 信 息 关 联 ; 目 标 动 向 ; 热 点 分 析 ; 语 义 决 策 树 中 图 分 类 号 :TN971;TP391. 4 摇 摇 文 献 标 志 码 :A 摇 摇 文 章 编 号 :1001-893X(2016)05-0483-07 Hot Spot Aalysis Based o Correlatio of Target Activity Iformatio YU Hogbo ( Southwest Chia Istitute of Electroic Techology,Chegdu 610036,Chia) Abstract:A target activity expressio ad correlatio method is preseted i order to extract importat tar 鄄 get activity from varyig ad massive sesor data. Activity factors are extracted from various iformatio to deote target activity,the,sematicdecisio tree is used to classify activity factors,correlative relatioships betwee sesor data are established usig kowledge ad rules. By extractio of target activity iformatio, it is possible to aalyze hot spot or predict target activity treds by correspodet historical target activities. Experimet shows that the proposed target activity iformatio correlatio algorithm has high precisio, which ca be used i real data set. Key words:iformatio correlatio;target activity;hot spot aalysis;sematic decisio tree 1 摇 引 摇 言 随 着 传 感 器 技 术 的 发 展, 传 感 器 用 户 每 天 可 获 得 大 量 的 数 据, 如 何 从 海 量 信 息 中 及 时 发 现 重 要 目 标 的 动 向 是 用 户 关 注 的 重 点 问 题 传 统 的 信 息 分 析 方 法 主 要 是 采 取 人 工 比 对 与 综 合 的 方 式 进 行, 如 今, 利 用 关 联 分 析 技 术 提 取 出 有 用 信 息, 有 助 于 情 报 人 员 快 速 分 析 并 做 出 决 策 关 联 是 目 前 常 见 的 术 语, 主 要 用 于 关 系 型 数 据 库 语 义 网 Web 数 据 挖 掘 等 应 用 领 域 在 关 系 型 数 据 库 应 用 领 域 中, 关 联 指 的 是 一 种 数 据 的 某 些 特 性 变 化 会 引 起 另 一 种 数 据 对 应 变 化 的 关 系 ; 在 语 义 网 中, 关 联 数 据 是 指 用 以 RDF / XML 格 式 描 述 的 元 数 据 信 息, 且 通 过 链 接 指 向 其 他 RDF 数 据 的 数 据, 即 通 过 网 址 链 接 形 成 富 含 元 数 据 信 息 的 数 据 关 联 ; 在 数 据 挖 掘 领 域, 关 联 分 析 主 要 是 指 关 联 规 则 挖 掘 [1], 即 发 现 数 据 库 的 项 和 属 性 之 间 存 在 的 不 易 察 * ** 收 稿 日 期 :2016-01-29; 修 回 日 期 :2016-03-28 摇 摇 Received date:2016-01-29;revised date:2016-03-28 通 信 作 者 :walkeryhb@ 163. com 摇 摇 Correspodig author:walkeryhb@ 163. com 483
www. teleolie. c 电 讯 技 术 摇 摇 摇 摇 2016 年 觉 的 联 系, 而 这 些 联 系 往 往 预 先 未 知, 且 无 法 通 过 结 构 化 数 据 库 的 简 单 查 询 操 作 获 取 最 著 名 的 关 联 规 则 是 Apriori 算 法 [2], 其 设 计 思 想 是 通 过 多 次 迭 代 运 算 找 出 频 繁 项 集, 从 而 发 现 各 数 据 项 之 间 的 隐 藏 关 联 关 系, 生 成 形 如 X = > Y 的 规 则 在 针 对 目 标 动 向 研 究 领 域, 国 内 外 的 研 究 重 点 主 要 集 中 在 命 名 实 体 识 别 和 突 发 事 件 的 识 别 等 其 中, 命 名 实 体 识 别 技 术 的 主 要 研 究 成 果 包 括 中 科 院 自 动 化 所 的 汉 语 词 法 分 析 系 统 ( Istitute of Compu 鄄 tig Techology,Chiese Lexical Aalysis System,ICT 鄄 CLAS) 等 ; 突 发 事 件 的 识 别 大 多 面 向 特 定 的 领 域, 如 金 融 领 域 网 络 故 障 领 域 灾 难 性 事 件 等, 成 果 包 括 北 京 邮 电 大 学 陈 莉 萍 等 进 行 的 突 发 事 件 识 别 的 研 究 [3] 文 献 [4-5] 针 对 文 本 信 息 中 人 物 目 标 动 向 的 感 知 与 关 联 方 面 进 行 了 相 关 研 究, 在 完 成 文 本 中 命 名 实 体 识 别 后, 再 运 用 句 法 分 析 建 立 人 物 动 向 语 义 信 息, 通 过 本 体 建 模 形 成 的 关 系 模 型 抽 取 人 物 动 向 之 间 的 关 联 关 系 上 述 方 法 在 应 用 中 的 主 要 限 制 在 于 仅 针 对 文 本 信 息 中 的 人 物 动 向 进 行 分 析, 且 前 期 本 体 建 模 工 作 量 巨 大 本 文 主 要 以 海 空 机 动 目 标 为 研 究 对 象, 着 重 研 究 通 过 关 联 分 析 技 术 实 现 该 类 目 标 动 向 识 别 与 聚 类, 并 发 现 目 标 活 动 的 热 点 规 律 与 趋 势, 其 中 热 点 包 括 热 点 平 台 热 点 区 域 及 相 关 的 热 点 行 为 2 摇 目 标 动 向 概 念 模 型 及 动 向 关 联 模 型 目 标 是 指 具 备 行 为 能 力 的 实 体 或 者 物 体, 目 标 动 向 是 指 目 标 的 一 切 行 为 活 动 根 据 所 使 用 传 感 器 的 类 型, 能 够 获 取 到 目 标 动 向 信 息 的 载 体 包 括 文 本 图 像 视 频 格 式 化 数 据 等 经 过 对 相 关 资 料 的 整 理, 目 标 动 向 可 描 述 如 下 : 目 标 动 向 : = { 特 征 < 固 有 特 征 动 态 特 征 感 知 特 征 状 态 特 征 > 要 素 < 发 生 时 间 发 生 地 点 目 标 行 为 人 物 关 联 人 物 平 台 关 联 平 台 关 联 组 织 机 构 > 模 式 < 规 律 异 常 >} 其 中, 目 标 动 向 模 型 由 目 标 自 身 蕴 含 的 特 征 和 目 标 动 向 行 为 等 来 表 征, 如 图 1 所 示 目 标 特 征 包 括 固 有 特 征 动 态 特 征 感 知 特 征 状 态 特 征, 固 有 特 征 是 目 标 独 特 唯 一 具 有 的 不 变 特 征, 例 如 目 标 机 动 能 力 外 形 特 征 等 ; 动 态 特 征 是 目 标 的 行 为 规 律 ; 感 知 特 征 是 目 标 被 传 感 器 捕 获 后 表 现 出 的 特 征, 如 目 标 在 声 光 电 上 表 现 出 的 特 征 ; 状 态 特 征 指 目 标 当 前 具 备 的 状 态, 如 巡 逻 警 戒 等 目 标 动 向 由 动 向 要 素 和 动 向 模 式 组 成, 其 中 动 向 要 素 是 组 成 动 向 的 实 体, 包 括 时 间 地 点 行 为 等, 是 组 成 目 标 动 向 的 主 体 ; 动 向 模 式 包 括 规 律 和 异 常, 是 目 标 动 向 在 时 空 层 面 表 现 出 的 统 计 特 性 图 1 摇 目 标 动 向 概 念 模 型 Fig. 1 Target activity coceptioal model 在 应 用 中, 目 标 动 向 分 析 通 常 以 某 一 事 件 或 目 标 作 为 中 心 或 起 点 进 行 研 究, 其 中 经 常 从 时 空 和 类 别 层 面 对 相 关 本 体 或 事 件 进 行 关 联 组 织, 便 于 更 进 一 步 的 挖 掘 深 层 次 信 息 虽 然 当 前 对 目 标 动 向 关 联 的 研 究 需 求 迫 切, 并 有 一 些 相 关 概 念 的 研 究, 但 在 宏 观 格 局 上 的 认 识 并 未 形 成 体 系, 对 目 标 动 向 间 联 系 的 类 型 划 分 也 缺 乏 专 门 的 探 讨, 导 致 现 有 概 念 之 间 缺 乏 好 的 继 承 和 整 合 因 此, 本 文 基 于 目 标 动 向 模 型 演 化 出 目 标 动 向 关 联 模 型, 试 图 对 概 念 进 行 整 合 和 宏 观 把 握 按 照 目 标 动 向 的 关 联 要 素, 可 将 其 划 分 为 目 标 主 体 型 关 联 背 景 主 题 型 关 联 和 行 为 模 式 型 关 联 其 中, 目 标 主 体 型 关 联 主 要 关 注 目 标 动 向 中 的 相 关 主 体 特 征 及 要 素, 包 括 时 空 主 体 平 台 主 体 人 物 主 体 特 征 主 体 等 ; 目 标 动 向 由 于 显 见 或 潜 在 突 出 或 不 突 出 的 主 体 因 素 也 能 产 生 关 联, 如 某 舰 队 行 为 和 舰 队 指 挥 官 的 行 为 之 间 存 在 潜 在 关 联 性 ; 行 为 模 式 型 关 联 主 要 关 注 目 标 间 活 动 模 式 之 间 的 关 联, 比 如 具 有 相 同 活 动 模 式 与 规 律 的 海 监 巡 航 编 队 ; 主 题 型 关 联 是 指 具 有 相 似 或 者 相 同 背 景 主 题 而 产 生 的 广 义 目 标 或 动 向 事 件 的 关 联, 譬 如 以 东 海 巡 航 为 讨 论 主 题, 关 联 目 标 动 向 包 括 南 海 维 权 事 件 和 建 设 东 海 防 空 识 别 区 等 基 于 上 述 研 究 范 畴, 围 绕 目 标 动 向 的 主 体 事 件 出 现 多 方 面 的 关 联 线 索 与 方 向, 形 成 如 图 2 所 示 的 目 标 动 向 关 联 模 型 由 于 主 题 间 具 有 隐 式 关 联 关 系, 主 题 间 的 关 联 关 系 可 依 据 动 向 要 素 的 核 心 性 共 现 词 语 进 行 关 联 484
第 56 卷 俞 鸿 波 : 基 于 关 联 性 的 目 标 动 向 热 点 分 析 第 5 期 3. 1 摇 目 标 动 向 要 素 抽 取 与 结 构 化 图 2 摇 目 标 动 向 关 联 模 型 Fig. 2 Correlatio model of target activity 3 摇 目 标 动 向 要 素 关 联 分 析 方 法 由 前 文 所 述, 目 标 动 向 信 息 中 既 包 含 了 目 标 的 基 本 特 征 属 性, 又 包 括 了 目 标 动 向 的 基 本 要 素 描 述, 还 包 含 了 目 标 行 为 的 深 层 次 语 义 特 征 和 相 关 知 识 其 中 动 向 要 素 形 成 了 目 标 动 向 的 底 层 描 述, 可 以 从 传 感 器 数 据 中 通 过 统 计 匹 配 识 别 等 方 式 获 取 目 标 动 向 要 素 建 立 了 传 感 器 数 据 和 目 标 动 向 模 式 的 纽 带, 基 于 目 标 动 向 要 素 的 关 联 分 析 可 支 撑 目 标 动 向 模 式 的 深 度 挖 掘 与 分 析 因 此, 本 文 中 目 标 动 向 信 息 分 析 的 主 要 思 路 就 是 从 传 感 器 数 据 中 抽 取 目 标 动 向 要 素, 并 建 立 不 同 源 传 感 器 数 据 中 基 于 目 标 动 向 的 关 联 关 系, 在 目 标 动 向 相 关 性 的 基 础 上 进 一 步 发 现 目 标 活 动 的 热 点 规 律 与 趋 势 如 图 3 所 示, 目 标 动 向 要 素 关 联 分 析 方 法 处 理 流 程 分 为 如 下 步 骤 : (1) 从 多 种 类 多 格 式 多 媒 介 的 海 量 信 息 中 抽 取 目 标 动 向 要 素 ; (2) 构 建 目 标 动 向 要 素 特 征 向 量, 利 用 语 义 决 策 树 对 目 标 动 向 要 素 进 行 关 联 聚 类 ; (3) 对 目 标 动 向 要 素 进 行 知 识 扩 展, 进 一 步 关 联 出 潜 在 的 动 向 主 体 ; (4) 结 合 动 向 背 景, 对 动 向 主 体 进 行 统 计 相 关 排 序 预 测, 发 现 动 向 热 点 图 3 摇 目 标 动 向 要 素 关 联 分 析 方 法 处 理 流 程 Fig. 3 Flowchart of target activity factor correlatio 3. 1. 1 摇 时 空 结 构 化 传 感 器 原 始 数 据 种 类 虽 多, 但 数 据 的 基 本 属 性 一 般 都 包 含 空 间 属 性 和 时 间 属 性 其 中, 空 间 属 性 通 过 经 纬 高 或 者 地 址 名 称 等 方 式 表 达 了 目 标 活 动 的 相 关 区 域 ; 时 间 属 性 则 是 通 过 将 目 标 的 历 史 活 动 轨 迹 投 影 到 时 间 轴 的 方 式, 来 表 达 目 标 动 向 的 时 间 点 或 者 时 间 段 在 实 现 关 联 前, 必 须 对 各 类 数 据 进 行 时 空 化 分 类 处 理 以 统 一 格 式 和 标 准, 如 图 4 所 示 图 4 摇 时 空 化 数 据 分 类 处 理 Fig. 4 Class of temporal ad spacial data 本 文 使 用 ICTCLAS 自 动 分 词 系 统 对 原 始 数 据 进 行 分 词, 在 得 到 分 词 序 列 的 基 础 上 进 行 自 动 词 性 标 注, 然 后 进 行 命 名 实 体 识 别, 提 取 时 空 信 息 其 中, 基 于 863 词 性 标 注 集, 利 用 条 件 随 机 域 CRF 词 性 标 注 器 进 行 词 性 标 注 [6], 使 用 Viterbi 动 态 优 化 方 法, 即 可 求 出 最 佳 词 性 标 注 序 列 (1) 时 间 信 息 抽 取 词 性 标 注 后 的 分 词 序 列 仍 然 是 信 息 量 较 少 语 义 不 完 整 的 单 词, 需 要 通 过 命 名 实 体 识 别, 识 别 出 有 语 义 的 短 语 和 词 组 有 语 义 的 短 语 和 词 组 就 是 要 识 别 的 命 名 实 体, 通 常 通 过 模 板 规 则 来 表 征 实 体 要 素 的 表 达 规 则 依 据 中 文 命 名 实 体 (NE) 识 别 方 法, 即 可 建 立 时 间 表 达 的 实 体 规 则 规 则 包 括 : 数 字 + 年 月 日, 例 如,2012 年,09 年 12 月 ; 数 字 + 年 代 冶 或 世 纪 冶, 例 如,20 世 纪,90 年 代 ; 数 字 + 时 分 秒 点, 例 如, 上 午 09hh:08mm:17ss (2) 空 间 信 息 抽 取 与 同 化 地 理 空 间 的 实 体 之 间 有 包 含 和 非 包 含 的 关 系, 包 含 关 系 的 地 名 实 体 直 接 组 合 成 一 个 实 体, 非 包 含 关 系 的 实 体 合 并 成 集 合 形 式 由 于 命 名 规 则 极 不 规 范, 应 用 时 为 了 快 速 准 确 定 位, 必 须 进 行 规 范 化 操 作 和 地 理 同 化 485
www. teleolie. c 电 讯 技 术 摇 摇 摇 摇 2016 年 方 式 一 : 自 动 匹 配 切 词 技 术 将 地 址 按 照 数 据 库 中 地 址 / 地 名 信 息 自 动 匹 配 切 词, 该 方 式 的 优 点 是 具 有 唯 一 性 和 高 效 性 方 式 二 :GPS 定 位 对 GPS 类 定 位 数 据, 提 取 数 据 的 经 纬 度 位 置 高 度 信 息, 并 转 换 到 统 一 的 椭 球 坐 标 系 下 同 时, 根 据 数 据 的 产 生 以 及 传 感 器 特 点 ( 包 括 传 感 器 的 类 型 特 点 精 度 等 ), 计 算 数 据 定 位 的 误 差 范 围, 进 行 定 位 匹 配 处 理 方 式 三 : 地 址 库 匹 配 即 将 地 址 数 据 与 在 知 识 库 中 存 储 的 地 理 数 据 信 息 进 行 相 关 性 匹 配, 从 而 获 取 相 应 的 地 址 信 息 3. 1. 2 摇 主 体 信 息 结 构 处 理 动 向 要 素 中 主 体 信 息 包 括 人 物 关 联 人 物 平 台 关 联 平 台 目 标 行 为 等 要 素, 对 该 类 信 息 的 抽 取 根 据 传 感 器 数 据 文 件 类 型 的 不 同 而 有 所 区 别 对 于 图 像 类 数 据, 利 用 图 像 解 译 算 法 对 数 据 自 动 或 交 互 式 添 加 语 义 标 签 例 如, 利 用 目 标 检 测 与 识 别 等 算 法 对 数 据 自 动 添 加 语 义 标 签, 并 将 目 标 名 称 及 属 性 对 应 的 语 义 标 签 添 加 到 平 台 要 素 中 对 于 视 频 类 数 据, 则 首 先 进 行 视 频 文 件 的 结 构 化 处 理, 结 构 化 过 程 首 先 通 过 边 界 检 测 方 法 将 视 频 分 割 为 多 个 镜 头, 然 后 提 取 每 个 镜 头 的 关 键 帧 来 代 表 整 个 视 频 的 内 容 在 完 成 了 镜 头 边 界 检 测 和 关 键 帧 提 取 后, 利 用 前 述 的 图 像 解 译 算 法 及 语 音 识 别 算 法 实 现 对 视 频 内 主 体 信 息 的 提 取 对 于 文 字 类 信 息, 通 过 建 立 专 业 领 域 词 典, 提 取 各 要 素, 例 如 : 目 标 行 为 要 素 包 括 巡 逻 侦 察 航 渡 等 具 体 过 程 本 文 不 再 赘 述 3. 2 摇 动 向 要 素 特 征 向 量 的 语 义 决 策 树 关 联 根 据 提 取 出 的 描 述 目 标 动 向 事 件 的 基 本 要 素 构 建 一 个 描 述 动 向 的 特 征 向 量, 假 设 描 述 第 i 项 传 感 器 中 包 含 向 量 X (i) : X (i) = (A (i) 1,A (i) 2,A (i) 3,A (i) 4,,A (i) ) T (1) 式 中 :A (i) 代 表 第 维 的 动 向 要 素 多 源 传 感 器 获 取 目 标 信 息 使 用 基 于 要 素 知 识 模 板 的 向 量 空 间 表 示 后, 成 为 规 则 的 动 向 要 素 描 述 数 据 然 后 利 用 语 义 决 策 树 的 方 法, 依 据 要 素 关 系 进 行 关 联 选 择 语 义 决 策 树 的 主 要 原 因 一 是 特 征 向 量 由 非 数 值 型 的 属 性 组 成, 决 策 树 算 法 在 聚 类 过 程 中 可 比 对 属 性 的 标 称 值, 适 合 于 标 称 属 性 向 量 的 非 数 值 计 算 ; 二 是 多 源 目 标 信 息 关 联 是 一 个 知 识 发 现 的 过 程, 对 于 能 挖 掘 出 多 少 知 识 信 息 不 能 确 定, 很 大 程 486 度 上 与 数 据 隐 藏 了 多 少 潜 在 的 知 识 有 关, 因 此, 不 能 预 计 关 联 聚 类 结 果 的 数 目, 决 策 树 能 够 依 据 属 性 取 值 进 行 自 由 分 裂 和 合 并, 从 而 适 应 聚 类 数 目 不 确 定 的 情 况 在 决 策 树 算 法 应 用 中, 通 过 从 根 结 点 到 叶 子 结 点 的 排 列 来 分 类 样 本 实 例 对 于 目 标 动 向 所 属 的 文 件 来 说, 决 策 树 的 结 点 代 表 了 文 件 中 目 标 动 向 的 所 属 分 类, 而 每 个 叶 结 点 则 对 应 动 向 所 包 含 特 征 向 量 中 要 素 的 对 象 取 值 通 过 选 择 最 有 助 于 分 类 目 标 动 向 实 例 的 属 性 作 为 建 立 决 策 树 的 上 层 结 点, 所 以 根 结 点 一 般 是 特 征 向 量 中 最 优 的 属 性 使 用 信 息 增 益 来 统 计 并 衡 量 属 性 区 分 给 定 训 练 样 例 的 能 力 [7] 为 了 精 确 定 义 信 息 增 益, 使 用 熵 刻 画 任 意 样 例 集 的 纯 度 给 定 包 含 c 个 聚 类 的 样 本 集 合 S, 那 么 S 的 熵 定 义 为 c Etropy(S) 以 移 -p i lbp i (2) i =1 式 中 :p i 为 样 本 集 合 S 中 属 于 类 别 i 的 概 率 此 时, 属 性 A 相 对 于 样 本 集 合 S 的 信 息 增 益 Gai(S,A) 被 定 义 为 Gai(S,A)= Etropy(S) - 移 v 沂 Value(A) S v S Etropy(S v) (3) 式 中 :Value( A) 是 属 性 A 的 取 值 范 围 集 合 ;S v 是 样 本 集 合 中 属 性 值 为 v 的 子 集 合, 即 S v = { s 沂 S A( s) = v} 通 常 具 有 最 高 信 息 增 益 的 属 性 是 最 好 的 属 性, 使 用 最 好 的 属 性 作 为 建 立 决 策 树 的 根 节 点 本 文 使 用 ID3 算 法 训 练,ID3 算 法 增 长 树 的 每 一 步 使 用 属 性 的 信 息 增 益 作 为 选 取 最 佳 属 性 的 度 量 标 准 下 [7] : 由 训 练 集 S 构 造 最 佳 决 策 树 的 算 法 描 述 如 创 建 结 点 N 如 果 S 为 空, 则 返 回 节 点, 标 记 失 败 If S 中 的 元 组 都 在 同 类 C 中,The 返 回 N 作 为 叶 子 结 点, 用 类 C 标 记 结 点 N If 属 性 列 表 为 空,The 返 回 N 作 为 叶 结 点, 用 S 中 的 多 数 类 标 记 结 点 N For splittig_criterio 每 个 输 出 j 设 S j 是 S 中 满 足 输 出 j 的 数 据 元 组 的 集 合 ; If S j 为 空 增 加 叶 结 点 N, 标 记 为 训 练 集 中 的 多 数 类 ; Else 增 加 由 Geerate_decisio_tree( S j,attribute_list) 返 回 的
第 56 卷 俞 鸿 波 : 基 于 关 联 性 的 目 标 动 向 热 点 分 析 第 5 期 结 点 到 N Ed For 返 回 根 节 点 说 明 :Geerate_decisio_tree 函 数 通 过 对 决 策 树 各 分 支 的 子 集 递 归 调 用 的 方 式 建 立 决 策 树 结 点 的 分 支 根 据 动 向 特 征 向 量 中 要 素 构 成 的 假 设 决 策 树 理 论 上 有 很 多, 但 很 多 决 策 结 果 在 实 际 应 用 中 比 较 少 见, 本 文 关 注 的 决 策 树 主 要 是 目 标 在 地 点 的 活 动 行 为, 使 用 Tree( 目 标, 地 点, 行 为, 时 间 ) 表 示 语 义 决 策 树 的 关 联 聚 类 见 图 5 图 5 摇 语 义 决 策 树 关 联 聚 类 处 理 Fig. 5 Correlative classificatio of decisio tree 语 义 决 策 树 的 聚 类 结 果 代 表 目 标 动 向 要 素 属 性 值 合 取 的 析 取 式, 每 一 条 路 径 都 代 表 了 一 类 目 标 动 向 的 聚 类 结 果 例 如,< 目 标 = 中 国 海 监 编 队 夷 地 点 = 某 海 域 夷 时 间 = 2012 年 夷 行 为 = 巡 逻 > 代 表 了 在 某 海 域 冶 主 题 下 搜 索 到 的 信 息 中,2012 年 中 国 海 监 船 编 队 在 某 海 域 活 动 的 行 为 等 情 况 3. 3 摇 扩 展 关 联 查 询 基 于 要 素 的 聚 类 关 联 能 够 发 现 某 个 主 题 下 海 空 机 动 目 标 的 活 动 情 况, 根 据 关 联 知 识 规 则 进 行 关 联 人 物 和 关 联 组 织 机 构 的 扩 展, 能 够 发 现 关 键 人 物 的 活 动 信 息, 并 发 现 潜 在 目 标 关 联 信 息, 如 从 某 舰 船 编 队 的 动 向 扩 展 关 联 出 编 队 指 挥 官 的 相 关 行 为 和 言 论 关 联 要 素 的 扩 展 查 询 需 要 建 立 基 于 目 标 要 素 的 知 识 规 则 库 知 识 规 则 库 是 基 于 要 素 词 典 建 立 的 知 识 扩 展 映 射 表 格, 是 基 于 领 域 知 识 对 要 素 项 的 进 一 步 联 想 与 扩 展 根 据 决 策 树 聚 类 和 扩 展 查 询 的 结 果, 把 传 感 器 数 据 聚 类 成 不 同 的 分 组, 保 存 数 据 之 间 的 分 组 关 系, 作 为 已 知 信 息 用 于 后 续 热 点 分 析 3. 4 摇 动 向 热 点 分 析 动 向 热 点 定 义 为 指 定 时 间 段 内 频 繁 发 生 的 目 标 动 向, 对 海 空 机 动 目 标 来 说, 就 是 某 类 目 标 频 繁 的 行 为 活 动 下 面 介 绍 动 向 热 点 的 分 析 方 法 的 具 体 步 骤 (1) 对 某 类 目 标 的 活 跃 度 进 行 评 估 在 上 述 关 联 聚 类 结 果 中, 对 目 标 名 称 或 者 类 属 进 行 相 似 性 检 测, 经 过 统 计 后 即 可 发 现 目 标 活 动 的 频 率 目 标 热 点 活 动 区 域 目 标 活 动 的 热 点 时 间 段, 并 对 目 标 活 跃 度 进 行 演 化 预 测, 若 演 化 预 测 出 的 目 标 活 跃 度 提 升 达 到 预 警 值, 则 提 示 相 关 部 门 采 取 应 对 措 施 本 文 中, 目 标 动 向 的 趋 向 性 演 化 预 测 采 用 马 尔 科 夫 预 测 模 型 [8], 具 体 描 述 如 下 : 第 t 个 时 期 的 状 态 概 率 向 量 可 表 示 为 S( t) = (S (t) 1,S (t) 2,,S (t) ), 其 中 S (t) i 表 示 第 t 个 时 刻 预 测 系 统 处 于 状 态 i 的 概 率, 所 以 有 S (t) i 逸 0(i = 1,2,,) 和 移 S (t) i = 1 特 别 地, 初 始 化 状 态 概 率 为 S (0) 1,S (0) 2, i =1,S (0), 相 应 的 初 始 状 态 概 率 向 量 为 S(0) 在 进 行 目 标 动 向 趋 向 性 分 析 时, 马 尔 科 夫 预 测 模 型 的 核 心 是 状 态 转 移 方 程, 表 述 如 下 : S(t)= S(t-1)*P = S(t)*P t (4) 式 中 :P 为 初 始 的 概 率 转 移 矩 阵 则 未 来 第 t 个 时 期 概 率 S(t) 可 根 据 初 始 的 概 率 向 量 和 初 始 状 态 转 移 矩 阵 推 测 出 (2) 对 于 关 联 出 的 热 点 目 标 动 向 信 息, 通 过 对 应 传 感 器 信 息 文 件 的 主 题 进 行 相 似 度 计 算, 将 相 似 度 高 的 主 题 提 取 出 来, 作 为 目 标 动 向 对 应 的 热 点 主 题 呈 现 给 用 户 计 算 : 主 题 相 似 度 计 算 采 用 相 似 度 SimF ( c1,c2) 来 ì 0, distace( c1,c2)= 0 1 琢 伊 distace(c1,c2) +1-1, distace(c1,c2) >0 5 SimF( c1,c2)= í 1 茁 伊 distace(c1,c2) - 1, distace(c1,c2) <0 5 î 1, distace( c1,c2)= 邑 (5) 式 中 : 参 数 琢 和 茁 值 的 大 小 决 定 了 主 题 c1 和 c2 间 语 义 相 似 度 的 取 值 在 同 样 的 距 离 下, 琢 和 茁 的 值 越 大 对 应 的 相 似 度 就 越 小, 通 常 语 义 距 离 为 1 时, 琢 和 茁 的 取 值 要 保 证 相 似 度 在 0. 5 以 上 487
www. teleolie. c 电 讯 技 术 摇 摇 摇 摇 2016 年 4 摇 仿 真 结 果 4. 1 摇 数 据 描 述 以 某 海 域 事 件 为 背 景 构 建 仿 真 数 据, 仿 真 某 海 域 事 件 主 题 下 的 3 000 份 文 件, 包 括 文 本 图 像 视 频 和 目 标 数 据, 其 中 涉 及 到 的 主 题 包 括 巡 航 冶 登 岛 维 权 冶 等 共 7 大 类 13 个 小 类 4. 2 摇 测 评 指 标 可 由 热 点 识 别 准 确 率 和 召 回 率 对 热 点 分 析 结 果 进 行 量 化 分 析 热 点 分 析 准 确 率 指 标 定 义 为 R = E d 疑 E b E d (6) 式 中 :E b 表 示 标 示 出 的 热 点 类 别 ;E d 表 示 经 过 关 联 分 析 后 检 索 出 的 热 点 类 别 4. 3 摇 关 联 及 热 点 识 别 结 果 利 用 3. 1 节 方 法, 对 某 海 域 冲 突 事 件 仿 真 数 据 经 过 抽 取 后, 形 成 包 括 海 监 船 编 队 冶 渔 政 船 冶 某 无 人 机 冶 等 平 台 及 对 应 的 时 间 要 素 地 理 空 间 要 素 和 行 为 要 素, 根 据 3. 2 节 和 3. 3 节 介 绍 的 语 义 决 策 树 方 法 完 成 关 联 聚 类 后 进 行 热 点 分 析, 共 形 成 平 台 - 地 理 - 行 为 热 点 17 类, 经 过 交 互 类 属 合 并 后 为 14 类 关 联 出 目 标 动 向 后, 分 析 出 的 热 点 主 题 包 括 巡 航 领 土 安 全 购 岛 中 日 关 系 等 通 过 式 (6) 计 算, 热 点 分 析 准 确 率 达 到 92. 8%, 满 足 了 应 用 中 对 动 向 热 点 准 确 识 别 的 需 求 以 月 度 作 为 统 计 周 期, 统 计 了 半 年 的 传 感 器 数 据, 对 其 中 关 注 的 典 型 目 标 包 括 海 监 船 海 监 飞 机 和 渔 政 船 的 的 活 跃 度 进 行 评 估, 形 成 了 图 6 所 示 结 果, 可 以 看 出 到 2014 年 4 月 形 成 了 动 向 峰 值, 与 主 题 聚 类 的 结 果 形 成 了 互 印 证 图 6 摇 典 型 目 标 动 向 趋 向 性 分 析 Fig. 6 The activity tred aalysis graph of cocered targets 5 摇 结 束 语 本 文 主 要 研 究 了 目 标 动 向 信 息 表 征 及 关 联 方 法, 从 多 源 异 类 传 感 器 获 取 的 信 息 中 抽 取 出 目 标 关 联 要 素 进 行 动 向 表 征, 利 用 语 义 决 策 树 实 现 动 向 要 素 聚 类, 并 通 过 关 联 知 识 规 则 进 行 匹 配 扩 展, 建 立 目 标 动 向 间 的 关 联 关 系, 从 而 发 现 目 标 动 向 的 热 点, 并 进 一 步 统 计 分 析 目 标 活 动 规 律 与 发 展 趋 势 文 中 重 点 描 述 了 目 标 动 向 概 念 模 型 及 动 向 关 联 模 型 的 构 建 及 动 向 要 素 的 关 联 聚 类 方 法 与 传 统 的 方 法 相 比, 本 文 方 法 的 主 要 优 点 在 于 : 首 先, 方 法 针 对 的 数 据 类 型 包 括 多 源 信 息 数 据, 除 了 文 本 之 外, 还 包 括 了 图 像 视 频 格 式 化 传 感 器 数 据 等 ; 其 次, 方 法 综 合 使 用 基 于 规 则 的 命 名 实 体 识 别 技 术 和 模 式 识 别 技 术 解 决 目 标 动 向 的 抽 取 与 聚 类, 避 免 了 采 用 复 杂 的 句 法 分 析, 从 目 标 行 为 宏 观 语 义 的 角 度 实 现 了 目 标 信 息 关 联 ; 此 外, 本 文 的 方 法 区 别 于 关 键 词 检 索 的 不 同 在 于, 关 键 词 检 索 使 用 户 只 能 查 询 哪 些 信 息 文 件 中 出 现 了 用 户 关 注 目 标, 返 回 的 结 果 集 数 据 量 巨 大, 因 此, 还 需 要 结 合 上 下 文 采 用 人 机 交 互 的 方 式, 从 结 果 集 中 综 合 判 定 获 取 目 标 信 息 的 正 确 性 ; 而 本 文 方 法 则 是 在 关 联 过 程 中, 利 用 目 标 动 向 的 背 景 知 识 进 行 主 题 事 件 的 聚 合 与 印 证, 关 联 过 程 不 再 是 仅 用 特 定 词 语 的 检 索, 更 加 具 有 针 对 性 和 智 能 化 的 特 点, 因 此, 关 联 分 析 的 结 果 更 加 精 确 后 续 工 作 重 点 突 破 目 标 行 为 的 语 义 理 解 与 描 述, 从 更 细 粒 度 分 析 动 向 特 征 的 内 涵 与 模 式 参 考 文 献 : [1] 摇 程 舒 通, 徐 从 富. 关 联 规 则 挖 掘 技 术 研 究 进 展 [ J]. 计 算 机 应 用 研 究,2009,26(9):3210-3213. CHENG Shutog,XU Cogfu. State-of-art o associatio rules miig techology [ J ]. Applicatio Research of Computers,2009,26(9):3210-3213. ( i Chiese) [2] 摇 张 冲. Apriori 算 法 在 物 联 网 ( IOT) 数 据 挖 掘 中 的 应 用 [J]. 科 技 通 报,2014,30(11):162-164. ZHANG Chog. Study of IOT data excavatig based o apriori algorithm[ J]. Bulleti of Sciece ad Techolo 鄄 gy,2014,30(11):162-164. ( i Chiese) [3] 摇 陈 莉 萍, 杜 军 平. 突 发 事 件 热 点 话 题 识 别 系 统 及 关 键 问 题 研 究 [J]. 计 算 机 工 程 与 应 用,2011,47(32):19-22. CHEN Lipig,DU Jupig. Study o hot topics idetifi 鄄 catio ad key issues about emergecy evets[ J]. Com 鄄 488
第 56 卷 俞 鸿 波 : 基 于 关 联 性 的 目 标 动 向 热 点 分 析 第 5 期 puter Egieerig ad Applicatios,2011,47 ( 32):19-22. (i Chiese) [4] 摇 陈 天 莹, 苏 智 慧. 基 于 语 义 推 理 的 文 本 信 息 关 联 关 系 分 析 技 术 [J]. 电 讯 技 术,2014,54(1):67-73. CHEN Tiayig,SU Zhihui. Text iformatio relatioship aalysis based o sematic reasoig[ J]. Telecommui 鄄 catio Egieerig,2014,54(1):67-73. ( i Chiese) [5] 摇 陈 天 莹. 文 本 信 息 中 的 目 标 动 向 感 知 技 术 [J]. 电 讯 技 术,2014,54(6):730-734. CHEN Tiayig. Target activity awareess o text ifor 鄄 matio [ J ]. Telecommuicatio Egieerig, 2014, 54(6):730-734. ( i Chiese) [6] 摇 周 晶, 吴 军 华, 陈 佳, 等. 基 于 条 件 随 机 域 CRF 模 型 的 文 本 信 息 抽 取 [ J]. 计 算 机 工 程 与 设 计, 2008, 29 (23):6094-6097. ZHOU Jig, WU Juhua, CHEN Jia, et al. Usig codi 鄄 tioal radom fields model for text iformatio extractio [ J]. Computer Egieerig ad Desig,2008,29(23): 6094-6097. ( i Chiese) [7] 摇 王 小 巍, 蒋 玉 明. 决 策 树 ID3 算 法 的 分 析 与 改 进 [ J]. 计 算 机 工 程 与 设 计,2011,32(9):3069-3076. WANG Xiaowei,JIANG Yumig. Aalysis ad improvemet of ID3 decisio tree algorithm [ J]. Computer Egieerig ad Desig,2011,32(9):3069-3076. (i Chiese) [8] 摇 章 登 义, 欧 阳 黜 霏, 吴 文 李. 针 对 时 间 序 列 多 步 预 测 的 聚 类 隐 马 尔 科 夫 模 型 [ J]. 电 子 学 报,2014,42 (12): 2359-2364. ZHANG Degyi, OUYANG Chufei, WU Weli. Cluster - based hidde Markov model i time series multi-step pre 鄄 dictio[ J]. Acta Electroica Siica,2014,42(12):2359-2364. ( i Chiese) 作 者 简 介 : 俞 鸿 波 (1977 ), 男, 湖 北 人,2005 年 于 西 北 工 业 大 学 获 博 士 学 位, 现 为 高 级 工 程 师, 主 要 研 究 方 向 为 图 像 处 理 与 信 息 融 合 YU Hogbo was bor i Hubei Provice,i 1977. He received the Ph. D. degree from Northwester Polytechical Uiversity i 2005. He is ow a seior egieer. His research co 鄄 cers image processig ad iformatio fusio. Email:walkeryhb@ 163. com 489