软 件 学 报 doi: 10.1338/j.cnki.jos.004931 视 觉 量 子 目 标 跟 踪 方 法 研 究 姜 文 涛 1+, 刘 万 军 1, 袁 姮, 张 海 涛 1 1 ( 辽 宁 工 程 技 术 大 学 软 件 学 院, 辽 宁 葫 芦 岛 15105) ( 辽 宁 工 程 技 术 大 学 研 究 生 院, 辽 宁 葫 芦 岛 15105) Object Tracking Method Based on Vision Quantum * JIANG Wen-Tao 1+, LIU Wan-Jun 1, YUAN Heng, ZHANG Hai-Tao 1 1 (Department of Software, Liaoning Technical University, Huludao 15105, China) (Department of Postgraduate, Liaoning Technical University, Huludao 15105, China) + Corresponding author: Phn +86-049-5310858, Fax +86-049-5310858, E-mail: lntuwulue@163.com, http://www.lntu.edu.cn Abstract: A novel approach to object tracking based on the vision quantum is proposed in this paper in order to solve the high lost-tracking rate in variable structure object tracking. Firstly, the gray information is detected in the image from top to bottom with vision quantum, and the distribution area and gray levels of larger probability density are counted in the vision quantum. Then all the energy frequency of the visual quantum are calculated, of which the weaker energy frequency gradient is removal by filtration and the stronger frequency gradient of vision quantum that the distribution of high frequency information account for half quantum area is reserved. The quantum cluster is composed of vision quantum with the same frequency variation. Finally, we take quantum cluster as candidate object information, the state of moving object is predicted with maximum likelihood estimation and we take the forecast results as moving reference position of vision quantum in the next frame. And a further verification of the visual quantum balance state is made to ensure the effectiveness of object tracking. This method catches the point that the variable structure moving object has the feature of the energy frequency step invariance at the juncture pixels of the foreground and background. It can overcome the shape changing, scale changing and other factors on the influence of the moving object tracking effectively with lower lost-tracking rate and lower computational complexity by using independent and continuous visual quantum to describe the step invariant feature. Experiments show that the proposed approach has good adaptability to variable structure tracking with real-time and robust tracking performance. Key words: vision quantum; frequency step; quantum balance; quantum cluster; object tracking 摘 要 : 为 了 解 决 变 结 构 目 标 跟 踪 过 程 中 目 标 失 跟 率 较 高 的 问 题, 提 出 了 一 种 新 的 基 于 视 觉 量 子 (Vision Quantum, VQ) 的 目 标 跟 踪 方 法. 该 方 法 首 先 在 图 像 内 自 上 而 下 辐 射 视 觉 量 子 采 集 灰 度 信 息, 统 计 量 子 内 部 概 率 Supported by the National Natural Science Foundation of China under Grant No.6117144 ( 国 家 自 然 科 学 基 金 ); the National High-Tech Research and Development Plan of China under Grant Nos.13-05 ( 国 家 高 技 术 研 究 发 展 计 划 子 课 题 (863)); the Science and Technology Foundation of Liaoning Province of China under Grant No. 011606 ( 辽 宁 省 科 技 攻 关 计 划 项 目 ) 收 稿 时 间 : 014-04-7; 修 改 时 间 : 015-06-4, 015-06-30; 采 用 时 间 : 015-10-09; jos 在 线 出 版 时 间 : 015-11-15 CNKI 网 络 优 先 出 版 : 015-11-16 09::3, http://www.cnki.net/kcms/detail/11.560.tp.0151116.09.004.html
Journal of Software 软 件 学 报 密 度 较 大 的 灰 度 级 和 分 布 区 域. 然 后 计 算 视 觉 量 子 的 量 子 频 率, 归 一 化 量 子 频 率 系 数, 滤 除 系 统 噪 音 和 杂 波 干 扰, 利 用 频 率 阶 跃 不 变 性 移 动 视 觉 量 子 至 平 衡 状 态, 将 达 到 量 子 平 衡 状 态 的 视 觉 量 子 组 成 量 子 簇. 最 后 以 该 量 子 簇 作 为 候 选 目 标 信 息, 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 以 预 测 结 果 作 为 下 一 帧 图 像 中 视 觉 量 子 移 动 的 参 考 值, 并 进 一 步 验 证 移 动 后 的 视 觉 量 子 是 否 达 到 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 该 方 法 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 量 子 频 率 阶 跃 不 变 性 的 特 点, 继 而 将 阶 跃 不 变 特 征 采 用 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低. 同 时 由 于 视 觉 量 子 数 据 量 较 小, 计 算 复 杂 度 低, 其 跟 踪 实 时 性 较 高. 大 量 实 验 测 试 表 明, 该 方 法 对 变 结 构 目 标 跟 踪 具 有 很 好 的 适 应 性 实 时 性 和 鲁 棒 性. 关 键 词 : 视 觉 量 子 ; 频 率 阶 跃 ; 量 子 平 衡 ; 量 子 簇 ; 目 标 跟 踪 中 图 法 分 类 号 : TP391 文 献 标 识 码 : A 1 引 言 运 动 目 标 跟 踪 MOT(Moving Object Tracking) 作 为 目 前 国 内 外 计 算 机 视 觉 领 域 的 研 究 热 点 之 一 [1-], 经 过 50 余 年 的 研 究 发 展, 已 经 取 得 了 较 大 的 成 绩. 它 是 一 种 利 用 计 算 机 与 摄 像 机 模 仿 生 物 视 觉 系 统 对 感 兴 趣 目 标 进 行 分 析 识 别 跟 踪 及 测 量 的 技 术, 具 有 无 接 触 隐 蔽 性 强 精 准 性 高 的 技 术 优 点 [3-7]. 目 标 跟 踪 应 用 广 泛, 在 仿 生 机 器 人 无 人 驾 驶 汽 车 智 能 视 频 监 控 等 自 动 感 知 领 域 具 有 重 要 的 研 究 和 应 用 价 值. 目 前, 目 标 跟 踪 技 术 的 研 究 主 要 有 两 大 方 向, 一 种 是 建 立 在 运 动 信 息 分 析 基 础 之 上 的 跟 踪 方 法, 另 一 种 是 基 于 模 型 分 析 的 目 标 跟 踪 方 法. 利 用 运 动 信 息 分 析 的 目 标 跟 踪 方 法 研 究 较 多, 已 形 成 了 众 多 的 算 法 和 标 准. 例 如,Huttenlocher 首 先 利 用 Hausdorff 距 离 的 定 义 与 计 算 方 法 进 行 序 列 图 像 间 的 去 相 关, 然 后 对 残 余 误 差 图 像 采 用 空 间 去 相 关 实 现 了 物 体 的 跟 踪 算 法 [8-9] ; 在 Huttenlocher 的 基 础 上,Haritaoglu 通 过 建 立 双 峰 分 布 的 统 计 背 景 模 型 来 实 现 目 标 检 测, 并 为 目 标 建 立 外 观 模 型, 取 得 更 好 的 效 果 [10] ; 在 进 行 空 间 域 上 去 相 关 的 基 础 上,Stauffer 提 出 了 自 适 应 混 合 高 斯 模 型, 建 立 运 动 目 标 与 前 景 目 标 间 的 对 应 关 系 来 实 现 对 目 标 的 跟 踪 [11] ; 在 自 适 应 模 型 的 基 础 上,Rezaeian 利 用 观 测 模 型 联 合 收 敛 (COMJ) 技 术 对 目 标 进 行 检 测, 然 后 应 用 序 贯 蒙 特 卡 罗 方 法 (SMC) 对 目 标 进 行 拓 展 跟 踪, 获 得 了 较 好 的 效 果 [1] ; 目 标 跟 踪 方 法 也 不 仅 仅 限 于 空 间 域 上 的 去 相 关 方 法, 国 内 的 闫 小 喜 和 韩 崇 昭 提 出 了 基 于 杂 波 强 度 在 线 估 计 的 目 标 跟 踪 方 法 [13] ;Juan 和 Raul 等 人 提 出 了 基 于 视 频 对 象 运 动 的 模 糊 推 理 方 法, 取 得 了 较 好 的 跟 踪 效 果, 但 存 在 目 标 分 割 完 整 性 欠 缺 的 问 题 [14] ; 而 Airouche 和 Bentabet 等 人 对 此 进 行 了 改 进, 采 用 运 动 区 域 增 长 和 先 验 知 识 结 合 的 方 法 使 视 频 对 象 的 提 取 较 为 精 确, 并 具 有 较 好 的 鲁 棒 性 能 [15]. 基 于 运 动 分 析 的 目 标 跟 踪 方 法, 原 理 简 单, 实 现 较 为 方 便, 但 是 对 于 相 似 运 动 目 标 难 以 进 行 区 分, 容 易 粘 连 和 失 跟. 另 一 种 基 于 模 型 的 目 标 跟 踪 方 法 可 以 克 服 相 似 运 动 信 息 的 干 扰. 近 年 来, 基 于 模 型 的 目 标 域 密 度 估 计 方 法 (Mean Shift) 成 为 研 究 的 热 点 [16-1], 目 标 域 密 度 估 计 是 由 Fukunaga 和 Hostetler 在 1975 年 提 出 的 一 种 无 监 督 聚 类 方 法, 它 使 每 一 个 点 漂 移 到 密 度 函 数 的 局 部 极 大 值 点 ;Comaniciu 首 先 将 mean shift 算 法 应 用 到 目 标 跟 踪 领 域 中 来, 他 利 用 Bhattacharyya 系 数 作 为 目 标 模 型 域 候 选 目 标 之 间 的 相 似 性 度 量 标 准, 用 mean shift 算 法 来 搜 索 最 优 候 选 目 标, 获 得 了 很 好 的 跟 踪 效 果 [-3], 但 不 足 之 处 是 计 算 量 较 大, 影 响 了 跟 踪 的 准 确 性 和 实 时 性 ; 为 了 克 服 特 征 信 息 不 足 造 成 的 偏 差,Yang 等 人 提 出 了 空 域 特 征 中 的 相 似 性 度 量 方 法, 允 许 mean shift 跟 踪 更 一 般 的 运 动 目 标 [4], 但 是 对 于 相 似 目 标 的 衔 接 不 能 进 行 有 效 判 别 ; 在 此 基 础 上,Jeong 提 出 了 一 个 鲁 棒 的 实 时 的 高 斯 圆 柱 模 型, 通 过 mean shift 实 现 目 标 跟 踪 以 解 决 不 规 则 光 照 变 化 下 目 标 衔 接 带 来 的 影 响 [5], 但 是 没 有 解 决 形 状 变 化 导 致 的 误 跟 问 题. 高 斯 模 型 的 不 足 是 基 函 数 需 要 计 算 与 原 始 数 据 相 关 的 协 方 差 矩 阵 和 特 征 矢 量, 这 些 计 算 在 应 用 中 通 常 是 较 难 实 现 的. 因 此 人 们 往 往 利 用 目 标 参 数 分 布 模 型 来 代 替 高 斯 模 型 变 换 的 去 相 关, 例 如,Davy 和 Tourneret 通 过 在 高 斯 混 合 模 型 中 引 入 先 验 参 数 的 分 布 模 型, 采 用 混 合 监 督 对 目 标 进 行 分 类, 可 以 同 时 跟 踪 多 种 运 动 目 标, 对 于 一 定 角 度 内 的 外 观 形 变 具 有 鲁 棒 性 [6], 但 稳 定 性 较 低, 容 易 漂 移 ; 为 了 提 高 目 标 检 测 与 跟 踪 的 稳
作 者 名 等 : 题 目 3 定 性,Liam 等 人 提 出 线 性 回 归 和 自 适 应 快 速 同 步 建 模 方 法, 通 过 自 适 应 运 动 目 标 的 外 观 模 型 进 行 目 标 更 新, 增 强 目 标 跟 踪 的 稳 定 性 [7] ;YingLi 和 Andrew 等 人 提 出 对 背 景 变 化 的 运 动 目 标 前 景 信 息 进 行 混 合 高 斯 处 理 [8], 将 多 种 纹 理 直 方 图 和 颜 色 直 方 图 建 立 目 标 运 动 模 型, 选 择 近 似 模 型 进 行 视 频 目 标 跟 踪, 取 得 较 好 跟 踪 效 果 ; 另 外, 不 同 的 图 像 特 征 描 述 方 法 适 合 于 不 同 的 场 合, 因 此 根 据 场 景 来 自 适 应 选 择 特 征 描 述 方 法 是 非 常 重 要 的 研 究 内 容, 例 如 Yi 和 Jongwoo 研 究 了 目 标 跟 踪 中 适 合 于 场 景 变 化 的 在 线 特 征 选 择 机 制, 以 提 高 跟 踪 性 能 [9]. 其 次, 在 目 标 跟 踪 中 引 入 随 机 有 限 集 的 目 标 模 型 是 一 种 行 之 有 效 的 方 法, 对 目 标 模 型 进 行 学 习 后 确 定 相 应 特 征 和 参 数, 可 提 高 对 周 围 杂 波 环 境 的 适 应 性, 例 如 吕 学 斌 等 人 通 过 引 入 概 率 密 度 滤 波 器, 建 立 判 决 门 限 的 跟 踪 策 略, 以 此 提 高 对 周 围 杂 波 环 境 的 适 应 性 [30]. 基 于 模 型 更 新 的 目 标 跟 踪 方 法 是 计 算 机 视 觉 领 域 内 的 主 流 方 法, 例 如 Zdenek Kalal 的 TLD 方 法 [31] Rui Yao 的 OLSL 方 法 [3] Junseok Kwon 的 WLMC 方 法 [33], 对 相 似 运 动 信 息 和 低 速 变 结 构 运 动 具 有 较 强 的 抗 干 扰 性, 可 以 较 好 的 跟 踪 运 动 目 标, 但 是 在 目 标 发 生 快 速 变 结 构 运 动, 例 如 目 标 快 速 旋 转 导 致 目 标 形 状 和 尺 度 变 化 幅 度 较 大 时, 却 不 能 进 行 长 时 间 的 有 效 跟 踪, 容 易 发 生 漂 移 和 误 跟. 与 生 物 的 视 觉 系 统 相 比, 现 有 目 标 跟 踪 方 法 的 普 遍 弱 点 是 缺 乏 与 感 兴 趣 目 标 及 其 周 围 环 境 同 步 调 节 的 能 力, 而 生 物 的 视 觉 系 统 可 以 自 然 的 感 知 目 标 和 环 境 的 变 化, 做 到 协 同 调 节, 以 形 成 对 感 兴 趣 目 标 的 最 大 关 注 度. 蝇 眼 是 一 种 复 眼 结 构, 由 多 个 六 边 形 结 构 的 小 眼 睛 拼 成, 每 个 小 眼 睛 都 可 以 独 立 成 像, 协 同 工 作, 最 后 形 成 一 个 影 像, 而 人 眼 内 部 也 是 由 多 个 分 布 密 集 的 感 光 神 经 单 元 组 成, 由 多 个 感 光 单 元 协 同 完 成 目 标 成 像, 生 物 视 觉 单 元 如 图 1 所 示. 这 种 生 物 视 觉 系 统 可 以 同 时 抓 住 目 标 多 个 局 部 边 缘 信 息 的 变 化, 因 此 对 目 标 整 体 形 状 和 尺 度 的 变 化 感 知 十 分 灵 敏, 对 其 变 化 的 幅 度 也 具 有 很 好 的 鲁 棒 性 [34-35]. Fig.1 Biological "visual unit" photosensitive diagram 图 1 生 物 视 觉 单 元 感 光 示 意 图 [36-37] 在 生 物 视 觉 系 统 的 启 发 下, 张 讲 社 等 人 模 拟 生 物 复 眼 结 构, 提 出 一 种 基 于 方 向 量 子 化 表 示 理 论 的 并 行 数 据 处 理 方 法, 利 用 最 小 矢 量 集 合 模 拟 生 物 视 觉 单 元, 在 机 器 人 运 动 控 制 和 自 适 应 图 像 处 理 领 域 取 得 了 较 好 的 应 用 效 果. 在 计 算 机 视 觉 领 域 中, 如 果 现 有 的 目 标 跟 踪 方 法 具 有 生 物 视 觉 系 统 的 这 种 多 个 视 觉 单 元 的 协 同 工 作 能 力, 将 对 目 标 跟 踪 效 果 的 提 升 起 到 不 可 限 量 的 作 用. 基 于 此, 本 文 在 生 物 视 觉 单 元 协 同 工 作 的 方 向 上, 提 出 了 一 种 视 觉 量 子 (Vision Quantum, VQ) 的 概 念, 并 应 用 到 目 标 跟 踪 中. 视 觉 量 子 目 标 跟 踪 方 法 是 建 立 在 目 标 子 空 间 协 同 分 析 的 整 体 框 架 之 上, 利 用 辐 射 视 觉 量 子 采 集 灰 度 信 息, 计 算 能 量 频 率, 保 留 达 到 量 子 平 衡 的 视 觉 量 子, 将 频 率 变 化 幅 度 相 同 的 视 觉 量 子 组 成 量 子 簇, 以 该 量 子 簇 作 为 候 选 目 标 信 息, 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 重 复 验 证 移 动 后 的 视 觉 量 子 是 否 达 到 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 与 现 有 目 标 跟 踪 方 法 相 比, 该 方 法 的 优 势 在 于 :(1) 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 能 量 频 率 阶 跃 不 变 性 的 特 点 ;() 将 阶 跃 不 变 特 征 采 用 多 个 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低 ;(3) 视 觉 量 子 数 据 量 较 小, 同 时 不 需 要 存 储 目 标 多 种 姿 态 模 型, 计 算 复 杂 度 和 空 间 复 杂 度 低, 跟 踪 实 时 性 较 高. 视 觉 量 子 对 非 连 续 的 刚 性 突 变 运 动 不 具 有 跟 踪 意 义, 作 为 视 觉 量 子 实 现 长 时 间 稳 定 跟 踪 的 基 础, 目 标 运 动 轨 迹 及 其 频 域 变 换 必 须 具 有 连 续 的 光 滑 特 性, 才 能 确 保 对 频 率 阶 跃 计 算 的 有 效 性, 达 到 量 子 反 复 平 衡, 实 现 对 目 标 的 稳 定 跟 踪, 因 此, 本 文 首 先 给 出 了 目 标 运 动 可 微 分 定 理 及 其 证 明 过 程, 在 此 基 础 上 提 出 了 视 觉 量 子 理 论 模 型
4 Journal of Software 软 件 学 报 及 其 相 关 概 念 的 定 义, 然 后 阐 述 了 该 方 法 的 基 本 实 现 流 程, 并 给 出 了 变 结 构 运 动 目 标 视 觉 量 子 跟 踪 效 果, 最 后 在 多 个 变 结 构 目 标 运 动 视 频 数 据 库 中 对 本 文 VQ 方 法 TLD 方 法 [31] OLSL 方 法 [3] [33] WLMC 方 法 进 行 了 跟 踪 实 验, 并 给 出 实 验 结 果 和 对 比 分 析. 目 标 运 动 可 微 分 定 理 目 标 运 动 轨 迹 及 其 频 域 变 换 的 连 续 光 滑 特 性 如 图 所 示. 定 理 1. 目 标 运 动 过 程 中, 其 运 动 轨 迹 ϕ 在 时 域 内 是 连 续 光 滑 的, 轨 迹 记 为 ϕ = f ( xyz,, ), 则 轨 迹 ϕ 的 偏 导 数 ϕ / x ϕ / y ϕ / z 在 其 定 义 域 内 是 连 续 的, 即 轨 迹 ϕ 是 可 微 分 的. 证 明 : 设 点 ( x, yz, ) 为 自 变 量 定 义 域 内 任 意 一 点, 则 ( x + Δ xy, +Δ yz, +Δ z) 为 该 点 邻 域 内 任 意 一 点, 由 数 学 理 论 知, 轨 迹 全 增 量 Δ ϕ 为 : Δ ϕ = f( x+δ xy, +Δ yz, +Δz) f( xyz,, ) t t = [ f ( x+δ x, y+δ y, z+δz) f ( x, y+δ y, z+δz)] t t +[ f ( x, y+δ y, z+δz) f ( x, y, z+δz)] t t + [ f ( x, y, z+δz) f ( x, y, z)] t t 当 Δx 0, Δy 0, Δz 0 时, 轨 迹 全 增 量 Δ ϕ 可 以 表 示 为 : ' ' ' Δ ϕ = fx( xyz,, ) Δ x+ fy( xyz,, ) Δ y+ fz( xyz,, ) Δ z+ σ1δ x+ σδ y+ σ3δ z 其 中, σ 1 σ σ 3 分 别 为 ( Δx, Δy, Δ z) ( Δy, Δ z) ( Δ z) 的 函 数, 且 当 Δx 0 Δy 0 Δz 0 时, σ1 0 σ 0 σ 3 0, 此 时, 全 增 量 Δ ϕ 逐 渐 趋 于 0, 即 ϕ = ft ( xyz,, ) 在 任 意 点 ( x, yz, ) 可 微 分, 证 毕. π juxl ( / + vym / + rzn / ) 定 理 目 标 运 动 轨 迹 ϕ 的 傅 里 叶 变 换 Ft( u, v, r) = ft( x, y, z) e dxdydz 在 时 域 内 是 连 续 光 滑 的, 则 函 数 Ft ( uvr,, ) 的 偏 导 数 Ft / u Ft / v Ft / r 在 其 定 义 域 内 是 连 续 的, 即 函 数 Ft ( uvr,, ) 是 可 微 分 的. 证 明 : 设 点 ( uvr,, ) 为 自 变 量 定 义 域 内 任 意 一 点, 则 ( u+ Δ u, v+δ v, r+δ r) 为 该 点 邻 域 内 任 意 一 点, 由 数 学 分 析 理 论 可 知, 函 数 全 增 量 为 : ' ' ' Δ F = F ( u, v, r) Δ u+ F ( u, v, r) Δ v+ F ( u, v, r) Δ r + φ 其 中 : 由 柯 西 不 等 式 : 由 于 指 数 函 数 e π 且 ( φ ) 0 Δ u +Δ v +Δr j( ux/ l + vy / m + rz / n) t u v r φ = [ F ' ( u+ αδ u, v+δ v, r+δr) F ' ( u, v, r)] Δu u u + [ F ' ( u+δ u, v+ βδ v, r+δr) F ' ( u, v, r)] Δv v v + [ F ' ( u+δ uv, +Δ vr, + γδr) F ' ( uvr,, )] Δr r r φ [( F ' ( u+ αδ u, v+δ v, r+δr) F ' ( u, v, r)) u u ' ' + ( F( u+δ uv, + βδ vr, +Δr) F( uvr,, )) v v ' ' 1/ + ( F( u+δ uv, +Δ vr, + γδr) F( uvr,, )) ] r r Δ u +Δ v +Δr 的 偏 导 是 连 续 的, 当 Δu 0 Δv 0 Δr 0 时, ( Δ u +Δ v +Δr ) 0,, 即 Ft ( uvr,, ) 在 任 意 点 ( uvr,, ) 可 微 分, 证 毕. t
作 者 名 等 : 题 目 5 Fig. Continuous smooth sketch map of object trajectory and its frequency domain transformation 图 目 标 运 动 轨 迹 及 其 频 域 变 换 的 连 续 光 滑 特 性 示 意 图 3 视 觉 量 子 目 标 跟 踪 方 法 为 了 清 晰 描 述 视 觉 量 子 目 标 跟 踪 方 法, 将 其 中 涉 及 到 的 一 些 定 义 和 符 号 给 出 如 表 1 所 示. Table 1 Definitions and symbols 表 1 定 义 和 符 号 符 号 定 义 符 号 定 义 符 号 定 义 VFS 视 觉 场 空 间 G(x, y) 像 素 点 的 灰 度 O (X, Y ) 边 缘 区 域 几 何 中 心 VQ(V) 视 觉 量 子 ( 视 觉 采 样 单 元 ) S 视 觉 量 子 几 何 面 积 δ 移 动 向 量 EE 熵 能 量 γ 单 位 灰 度 能 量 QC 量 子 簇 ζ 信 息 熵 P 量 子 频 率 α kl 复 高 斯 随 机 变 量 A 信 息 熵 极 大 值 的 灰 度 阶 R(x, y) 目 标 边 缘 区 域 CN 复 高 斯 分 布 ρ 灰 度 阶 的 概 率 QB 量 子 平 衡 Sta 目 标 状 态 E 灰 度 能 量 o(x, Y) 视 觉 量 子 几 何 中 心 FER 预 测 错 误 率 3.1 基 本 定 义 定 义 1( 视 觉 场 空 间 ). 由 α β 个 视 觉 采 样 单 元 组 成 的 二 维 图 像 感 光 空 间 定 义 为 视 觉 场 空 间 (Visual Field Space, VFS), 记 为 : V1,1 V1, V1, β V =,1 V, V VFS, β t (1) Vα,1 Vα, V α, β 其 中, VFS 为 视 觉 场 空 间, t 为 时 间, V α, β 为 视 觉 场 空 间 的 视 觉 采 样 单 元,1 α < +,1 β < +. 视 觉 场 空 间 模 型 如 图 3 所 示. 本 文 提 出 的 视 觉 场 空 间 与 计 算 摄 像 学 领 域 中 的 视 觉 场 不 同, 本 文 视 觉 场 空 间 是 利 用 多 个 视 觉
6 Journal of Software 软 件 学 报 采 样 单 元 对 运 动 目 标 空 间 信 息 进 行 分 类 和 建 模, 主 要 包 括 目 标 外 部 的 背 景 视 觉 单 元 目 标 边 缘 处 的 边 缘 视 觉 单 元 以 及 目 标 内 部 的 前 景 视 觉 单 元 三 个 类 别, 而 计 算 摄 像 学 领 域 的 视 觉 场 概 念 不 具 有 这 种 分 类 和 建 模 特 点. Fig.3 The visual field space model (object external black circle is the background sample unit, the red circle of the target edge is the edge sampling unit including the background and foreground information, and the yellow circle is the foreground sampling unit) 图 3 视 觉 场 空 间 模 型 ( 目 标 外 部 黑 色 圆 为 背 景 采 样 单 元, 目 标 边 缘 处 红 色 圆 为 包 含 背 景 与 前 景 信 息 的 边 缘 采 样 单 元, 目 标 内 部 黄 色 圆 为 前 景 采 样 单 元 ) 定 义 ( 视 觉 量 子 ). 视 觉 场 空 间 中 包 含 目 标 背 景 信 息 前 景 信 息 和 背 景 与 前 景 交 界 处 信 息 的 视 觉 采 样 单 元 定 义 为 视 觉 量 子 (Vision Quantum, VQ), 记 为 : VQαβ, ( X, Y, D, P, T ) () 其 中, X Y 为 视 觉 量 子 的 几 何 中 心 坐 标, D 为 视 觉 量 子 的 直 径, P 为 视 觉 量 子 的 量 子 频 率 ( 详 见 定 义 4), T 为 时 间, 下 标 α β 表 示 视 觉 量 子 在 视 觉 场 空 间 中 的 矩 阵 位 置 是 α 行 β 列. 本 文 提 出 的 视 觉 量 子 与 量 子 力 学 中 量 子 不 同, 本 文 视 觉 量 子 是 模 仿 生 物 视 觉 系 统 的 视 觉 单 元 进 行 计 算 机 视 觉 研 究 的 图 像 信 息 的 最 小 载 体, 而 量 子 力 学 中 的 量 子 是 物 理 学 领 域 中 研 究 微 观 粒 子 能 量 变 化 的 最 小 单 位 和 能 量 载 体. 根 据 视 觉 量 子 包 含 信 息 的 不 同, 将 视 觉 量 子 分 为 三 类, 分 别 为 包 含 目 标 背 景 信 息 的 背 景 视 觉 量 子, 包 含 目 标 前 景 信 息 的 前 景 视 觉 量 子, 包 含 目 标 背 景 与 前 景 边 界 信 息 的 边 缘 视 觉 量 子, 分 别 如 图 4 图 5 图 6 所 示. Fig.4 Background visual quantum 图 4 背 景 视 觉 量 子
作 者 名 等 : 题 目 7 Fig.5 Foreground visual quantum 图 5 前 景 视 觉 量 子 Fig.6 Edge visual quantum 图 6 边 缘 视 觉 量 子 由 图 4 和 图 5 可 知, 背 景 视 觉 量 子 内 部 的 背 景 信 息 和 前 景 视 觉 量 子 内 部 的 前 景 信 息 分 布 较 为 均 匀, 对 于 变 结 构 运 动 目 标 不 具 有 跟 踪 意 义, 由 图 6 知, 边 缘 视 觉 量 子 既 包 含 了 目 标 前 景 信 息, 又 包 含 了 目 标 背 景 信 息, 对 于 变 结 构 运 动 目 标 具 有 较 好 的 跟 踪 意 义, 但 是 背 景 与 前 景 交 界 处 信 息 分 布 较 为 模 糊, 难 以 准 确 区 分, 由 于 信 息 熵 可 以 有 效 的 计 算 图 像 信 息 的 分 布 情 况, 而 灰 度 的 能 量 可 以 有 效 的 增 强 相 似 灰 度 信 息 的 差 别, 因 此 为 有 效 提 取 和 判 别 视 觉 量 子 内 部 信 息 的 类 别 和 分 布 情 况, 提 出 熵 能 量 的 概 念. F 定 义 3( 熵 能 量 ). 在 视 觉 场 空 间 中, 对 VQαβ, VFS, 存 在 VQ α, β 的 前 景 信 息 熵 ζ 的 概 率 分 布 和 背 景 信 息 熵 B ζ 的 概 率 分 布, 将 信 息 熵 与 单 位 灰 度 能 量 的 乘 积 定 义 为 VQ α, β 的 熵 能 量 (Entropy Energy, EE), 记 为 : στ BF BF αβ, = γ( αβ,, αβ, ) ( ζκλ ) κ= 1 λ= 1 EE E S (3) 其 中, B F 指 背 景 B 或 前 景 F, κ λ 指 κ 或 λ, 下 标 α β 表 示 视 觉 量 子 VQ α, β 在 视 觉 场 空 间 中 的 矩 阵 位 置 BF BF 是 α 行 β 列, 信 息 熵 ζ = A ρ log ρ, κλ κλ κλ F A 为 VQ α, β 内 前 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶, B A 为 B F VQ α, β 内 背 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶, ρ κ 为 A 出 现 的 概 率, ρ λ 为 A 出 现 的 概 率, σ τ 为 VQ α, β B B B B F F F F 内 背 景 信 息 熵 与 前 景 信 息 熵 的 数 量, ζκ [ ζ1, ζ, ζσ ], ζλ [ ζ1, ζ, ζτ ], E α, β 为 灰 度 能 量 信 息, Eαβ, = Gxy (, ), Gxy (, ) 为 视 觉 量 子 内 部 像 素 点 ( x, y ) 的 灰 度 值, S α, β 为 VQ α, β 的 几 何 面 积, S αβ, = π D /4, 则 Eαβ, Gxy (, ) VQ α, β 的 单 位 灰 度 能 量 为 γ ( Eαβ,, Sαβ, ) = =. S π D /4 αβ, 熵 能 量 函 数 波 形 图 如 图 7 所 示, 图 中 纵 坐 标 为 熵 能 量, 横 坐 标 为 熵 的 数 量, 函 数 振 幅 表 明 视 觉 量 子 中 边 缘 信 息 变 化 的 剧 烈 程 度, 其 中 1(5,9) 表 示 图 3 中 第 1 幅 图 像 的 第 5 行 第 9 列 视 觉 量 子 的 熵 能 量 波 形 图,(1,11) 表 示 图 3 中 第 幅 图 像 的 第 1 行 第 11 列 视 觉 量 子 的 熵 能 量 波 形 图,4(16,6) 表 示 图 3 中 第 4 幅 图 像 的 第 16 行 第 6 列 视 觉 量 子 的 熵 能 量 波 形 图,5(1,7) 表 示 图 3 中 第 5 幅 图 像 的 第 1 行 第 7 列 视 觉 量 子 的 熵 能 量 波 形 图.
8 Journal of Software 软 件 学 报 Fig.7 Entropy energy waveform 图 7 熵 能 量 波 形 图 B F 熵 能 量 可 以 有 效 提 取 和 判 别 视 觉 量 子 内 部 信 息 的 类 别 及 其 分 布 情 况, 但 由 于 信 息 熵 ζ 的 概 率 分 布 集 合 B F B F 中 存 在 多 个 概 率 值, 熵 能 量 EE 的 函 数 波 形 走 向 呈 不 规 则 曲 线 状 态, 因 此, 对 熵 能 量 EE 进 行 二 维 核 变 换, 然 后 进 行 滤 波 处 理, 提 取 视 觉 量 子 VQ 内 背 景 和 前 景 的 频 率 信 息. B F 定 义 4( 量 子 频 率 ). 对 熵 能 量 EE 的 二 维 核 变 换 定 义 为 VQ 的 量 子 频 率 (Quantum Frequency, QF), 记 为 : BF κ λ t BF j π( ux/ κ+ vy/ λ) t P ( u, v, t) = EE e dxdydt 0 0 (4) 0 化 简 得 : BF BF j πt( uλ/ κ+ vκ/ λ) j πtuλ/ κ j πtvκ/ λ P ( u, v, t) = EE κλ /4 π uvt[ e + e + e + 1] (5) B F B F j π t( uλκ / vκλ / ) 其 中, P 指 背 景 量 子 频 率 P 或 前 景 量 子 频 率 P, e + 为 二 维 变 换 j πt( uλ/ κ+ vκ/ λ) j πtuλ/ κ j πtvκ/ λ BF 核, e + e + e + 1 称 为 量 子 频 率 变 换 核 的 组 合, EE κλ /4π uvt 为 变 换 系 数. 由 图 7 可 以 看 出, 熵 能 量 是 围 绕 在 目 标 边 缘 处 的 离 散 波 动 效 应, 若 将 量 子 频 率 的 变 换 系 数 进 行 归 一 化 处 理, 可 以 有 效 滤 除 噪 音 和 杂 波 干 扰, 提 高 目 标 量 子 频 率 提 取 的 准 确 性, 归 一 化 操 作 定 义 如 下 : + BF EE κλ /4π uvt dt = 1 (6) - 目 标 运 动 过 程 中, 对 目 标 前 景 和 背 景 交 界 处 的 边 缘 视 觉 量 子 信 息 的 提 取 和 分 析 可 以 有 效 跟 踪 目 标 位 置, 因 此, 对 目 标 边 缘 信 息 的 提 取 变 得 尤 为 重 要. 由 数 学 理 论 知, 二 元 函 数 的 二 阶 偏 导 的 物 理 意 义 是 加 速 度 变 化 快 慢 的 量, 其 中 加 速 度 是 瞬 时 速 度 的 变 化 量, 而 量 子 频 率 瞬 时 变 化 的 快 慢 表 达 了 图 像 边 缘 梯 度 信 息 变 化 的 剧 烈 程 度, 因 此 可 以 通 过 计 算 局 部 量 子 频 率 的 二 阶 偏 导 来 确 定 目 标 边 缘 区 域 R ( x, y), 则 : P P P P R ( xy, ) = + + + (7) u v u v v u 由 目 标 运 动 可 微 分 定 理, 函 数 P 在 任 意 点 ( uv, ) 是 可 微 分 的, 则 有 : P = P cosθ + P sinθ (8) Τ u v 其 中, Τ 为 相 邻 极 值 间 的 向 量, 因 此 目 标 边 缘 区 域 R ( x, y) 为 : P P P P R ( xy, )= cosθ + sin θ + ( + )cosθsinθ u v u v v u (9)
作 者 名 等 : 题 目 9 令 θ 取 值 0 π /6 π /3 π / π /3 5 π /6. Τ 和 θ 如 图 8 所 示. Fig.8 Sketch map of Τ andθ 图 8 Τ 和 θ 示 意 图 对 于 快 速 变 结 构 运 动 目 标 而 言, 其 边 缘 视 觉 量 子 内 包 含 的 边 界 信 息 均 为 不 规 则 的 非 线 性 信 息, 对 统 计 相 邻 时 刻 视 觉 量 子 内 部 边 缘 信 息 的 变 化 幅 度 和 变 化 方 向 都 带 来 较 大 困 难, 因 此, 将 边 缘 视 觉 量 子 内 部 非 线 性 边 界 近 似 为 线 性 边 界 进 行 统 计 和 计 算, 可 以 克 服 不 规 则 非 线 性 边 缘 信 息 对 视 觉 量 子 分 析 的 影 响, 近 似 过 程 如 图 9 所 示. 在 近 似 状 态 下, 假 设 目 标 由 t 时 刻 运 动 到 t + 1 时 刻, 则 视 觉 量 子 采 集 的 目 标 边 缘 变 化 过 程 如 图 10 所 示, 对 应 的 量 子 频 率 变 化 过 程 如 图 11 所 示. Fig.9 The approximate representation of irregular object edge 图 9 不 规 则 目 标 边 缘 的 近 似 表 示 Fig.10 The change of object edge 图 10 目 标 边 缘 变 化 过 程 由 图 10, 视 觉 量 子 中 的 目 标 边 缘 由 t 时 刻 变 化 到 t + 1 时 刻, 即 由 虚 线 位 置 跳 变 至 实 线 位 置, 所 对 应 的 的 量 子 F F ' B B' F 频 率 跳 变 过 程 如 图 11 所 示, 即 P P 且 P P, 其 中, P P F ' B 与 P P B' 是 图 像 采 集 设 备 采 集 的 相 邻 两 F F ' 帧 图 像 的 量 子 频 率 计 算 值, 属 于 测 量 的 状 态 值, 而 实 际 上, 根 据 目 标 运 动 可 微 分 定 理, P P 的 峰 值 之 间 是 连 B B' 续 递 变 的, 同 理, P P 的 峰 值 之 间 也 是 连 续 递 变 的, 因 此 为 了 有 效 刻 画 量 子 频 率 峰 值 实 际 的 递 变 过 程, 需 要 对 目 标 前 景 与 背 景 的 量 子 频 率 峰 值 的 测 量 状 态 进 行 理 想 化, 即 将 量 子 频 率 的 跳 变 过 程 进 行 连 续 化 描 述. 量 子 频 率 峰 值 连 续 递 变 过 程 的 理 想 化 状 态 如 图 1 所 示, 其 中 左 侧 图 的 实 线 为 量 子 频 率 的 测 量 状 态, 右 侧 图 的 实 线 为 量 子 频 率 理 想 化 之 后 的 实 际 状 态.
10 Journal of Software 软 件 学 报 Fig.11 Sketch map of quantum frequency and its changing process between time t to t + 1 图 11 t 至 t + 1 时 刻 量 子 频 率 及 其 变 化 过 程 示 意 图 Fig.1 The idealized statuses in the continuous variation process of quantum frequency s peaks 图 1 量 子 频 率 峰 值 连 续 递 变 过 程 的 理 想 化 状 态 性 质 1( 阶 跃 不 变 性 ). 连 续 的 视 频 采 集 实 际 上 是 一 种 间 歇 性 的 图 像 抽 样 且 抽 样 过 程 是 均 匀 的, 根 据 目 标 运 动 可 微 分 定 理 及 图 1 可 知, 当 连 续 帧 间 的 时 间 间 隔 趋 于 零 时, 任 一 相 邻 时 刻 状 态 下 的 目 标 边 缘 视 觉 量 子 的 量 子 频 率 对 微 小 的 时 间 t 的 积 分 相 等, 将 这 种 性 质 定 义 为 量 子 频 率 的 阶 跃 不 变 性, 记 为 : t F B P P P P t Δt lim 1 (10) Δ t 0 t + 1 ' F' ' B' P P P P t+ Δ 1 t ' 其 中, P 为 t 时 刻 量 子 频 率, P 为 t+1 时 刻 量 子 频 率, Δ t 为 连 续 相 邻 两 帧 间 的 时 间 间 隔. F ' F B' B 证 明 : 当 Δt 0 时, 视 频 采 集 帧 率 FPS +, 此 时, 相 邻 时 刻 t 与 t+1 的 量 子 频 率 P P 且 P P, 证 毕. F B 由 图 11 可 知, P P P P 为 目 标 前 景 与 背 景 交 界 处 的 量 子 频 率 范 围, 在 目 标 运 动 过 程 中, 具 有 阶 跃 不 变 性, 对 于 视 觉 量 子 中 的 边 缘 信 息 的 跳 变 速 度 具 有 很 好 的 鲁 棒 性, 同 样 对 于 前 景 和 背 景 区 域 的 光 照 变 化 颜 色 变 化 以 及 目 标 遮 挡 有 很 好 的 抗 干 扰 特 点. 定 义 5( 量 子 平 衡 ). 视 觉 量 子 VQαβ, ( X, Y, D, P, T ) 沿 向 量 δ 移 动, 使 视 觉 量 子 几 何 中 心 ο ( X, Y ) 与 目 标 边 缘 区 域 几 何 中 心 ο '( X ', Y ') 重 合, 将 此 时 的 状 态 定 义 为 量 子 平 衡 (Quantum Balance, QB), 记 为 : F B QB P = P, ο( X, Y ) = ο'( X ', Y ') (11) { } F B 其 中, P 为 目 标 前 景 量 子 频 率, P 为 目 标 背 景 量 子 频 率, ο ( X, Y ) 为 视 觉 量 子 几 何 中 心 坐 标, ο '( X ', Y ') 为 目 标 边 缘 区 域 几 何 中 心 坐 标, 设 目 标 边 缘 区 域 R ( x, y) 的 像 素 点 数 量 为 n, x i y i 为 R ( x, y) 的 像 素 点 坐 标,1 i n, n n 则 有 X ' = xi n, Y' = yi n, 移 动 向 量 δ 是 以 ο ( X, Y ) 为 起 点 ο '( X ', Y ') 为 终 点 的 向 量, 即 : i= 1 i= 1 δ = οο' = ( X ' XY, ' Y) 本 文 提 出 的 量 子 平 衡 与 量 子 医 学 领 域 中 的 量 子 平 衡 不 同, 本 文 提 出 的 量 子 平 衡 是 指 视 觉 量 子 沿 向 量 移 动 后 与 目 标 边 缘 几 何 中 心 重 合 的 状 态, 而 量 子 医 学 领 域 中 的 量 子 平 衡 是 指 人 体 细 胞 内 部 电 (1)
作 者 名 等 : 题 目 11 子 运 动 由 异 常 恢 复 正 常 的 状 态. 图 10 中 t 和 t+1 时 刻 的 视 觉 量 子 达 到 量 子 平 衡 状 态 如 图 13 所 示, 图 13 中 第 二 列 t+1 时 刻 视 觉 量 子 移 动 至 量 子 平 衡 状 态 时 的 量 子 频 率 变 化 如 图 14 所 示. 由 图 13 可 见, 视 觉 量 子 经 过 移 动 达 到 量 子 平 衡 状 态 时, 可 以 对 快 速 变 结 构 目 标 运 动 的 局 部 边 缘 信 息 进 行 有 效 跟 踪, 如 果 在 视 频 序 列 初 始 化 中 选 定 待 跟 踪 的 目 标 前 景 信 息, 则 可 以 通 过 多 个 视 觉 量 子 对 目 标 准 确 定 位 和 跟 踪. Fig.13 The status of quantum balance 图 13 视 觉 量 子 平 衡 状 态 Fig.14 The quantum frequency variation in the process of an object moving to quantum balance status 图 14 量 子 平 衡 移 动 过 程 中 量 子 频 率 变 化 过 程 定 义 6( 量 子 簇 ). 将 达 到 量 子 平 衡 状 态 的 N 个 边 缘 视 觉 量 子 的 组 合 定 义 为 量 子 簇 (Quantum Cluster, QC), 记 为 : QB QB QB QB T QC () t = [ VQ (), t VQ (), t, VQ ()] t 1 QB 其 中, N 为 量 子 簇 中 边 缘 视 觉 量 子 的 数 量, N 3, QB 为 量 子 平 衡 状 态, VQ () t 为 t 时 刻 达 到 量 子 平 衡 状 态 N k
1 Journal of Software 软 件 学 报 QB QB QB 的 视 觉 量 子,3 k N, 对 于 任 意 VQ () t, 存 在 VQ () t QC () t VFS. 量 子 簇 如 图 15 所 示. k k t 3. 目 标 状 态 预 测 Fig.15 The Sketch map of a quantum cluster 图 15 量 子 簇 示 意 图 假 设 在 视 频 图 像 内 向 目 标 区 域 辐 射 M 个 视 觉 量 子 ( xk, y k), k = 1,, M, 经 移 动 达 到 量 子 平 衡 后, 得 到 N 个 候 选 的 视 觉 量 子 ( xl, y l), l = 1,, N, 则 第 k 个 视 觉 量 子 被 候 选 为 第 l 个 视 觉 量 子 的 概 率 分 布 可 以 看 做 熵 能 量 与 复 高 斯 随 机 变 量 α kl 的 乘 积, 且 有 : αkl CN(0, ε kl ) (13) 其 中, 复 高 斯 分 布 可 参 考 文 献 [38], ε kl 为 复 高 斯 随 机 变 量 与 均 值 偏 离 的 程 度, α kl 的 变 化 反 映 了 扩 大 对 目 标 区 域 辐 射 视 觉 量 子 导 致 候 选 视 觉 量 子 增 加 的 累 积 效 果. 候 选 的 视 觉 量 子 当 中 包 含 了 一 部 分 无 效 的 视 觉 量 子, 它 们 是 由 相 似 运 动 目 标 干 扰 而 形 成 量 子 平 衡 的 视 觉 量 子, 由 于 相 似 目 标 的 出 现 和 运 动 对 整 个 视 觉 场 空 间 具 有 随 机 性 和 均 匀 性, 其 概 率 密 度 满 足 正 态 的 均 匀 分 布, 将 其 对 目 标 的 作 用 看 做 一 组 复 高 斯 白 噪 声 干 扰 过 程, 则 作 为 候 选 的 视 觉 量 子 被 复 高 斯 白 噪 声 β l () t 影 响 的 概 率 分 布 为 : βl () t CN(0, φ0) (14) 其 中, φ 0 为 受 复 高 斯 白 噪 声 影 响 的 候 选 视 觉 量 子 与 均 值 的 偏 离 程 度. 假 设 候 选 视 觉 量 子 整 体 对 目 标 跟 踪 是 有 效 的, 则 可 以 设 计 似 然 函 数 以 准 确 预 测 目 标 状 态 信 息 Sta=( x, y, v ) T, 其 中 包 括 目 标 位 置 ( x, y ) 和 目 标 运 动 速 度 v, v= vx + vy. 将 候 选 视 觉 量 子 看 做 一 个 N 1 维 向 量 组 合 : VQ() t = [ VQ1(), t VQ(), t, VQ ()] T N t (15) 则 目 标 状 态 Sta 的 极 大 似 然 估 计 为 : 其 中, 有 : ϕ kl 为 VQ() t 的 信 噪 比 : M N Sta k = 1 l = 1 BF [ ϕ φ ϕ + ] Sta=argmax ( 1) VQ ( EE ( Sta)) (16) kl 0 kl kl BF BF ( ) = γ(, ) ( )( ρκλ ( ) log ρκλ ( )) EE Sta E S VQ t A Sta Sta dt (17) 若 给 定 一 组 标 准 正 交 基 { ξ1( t), ξ( t), ξk ( t)}, 则 VQ l () t 可 拓 展 为 如 下 形 式 : 其 中, kl ρκλ ε kl ϕkl = (18) φ l kl k K k = 1 0 K VQ () t = lim ξ () t (19) kl l k βkl CN(0, φ0) BF ρ εkl + φ0 * 是 第 k 个 正 交 基 函 数 的 系 数, 且 = VQ ( t) ξ ( t) dt, ()* i 为 复 共 轭 操 作. 因 此, 有 : (0) EE CN(0, κλ ) (1) 由 于 似 然 函 数 与 似 然 比 成 正 比 例 关 系, 因 此 当 目 标 图 像 中 存 在 前 景 信 息 H 1 和 噪 声 干 扰 信 息 H 0 且 k > M B F 时, 根 据 β kl 与 EE 的 概 率 分 布, VQ l 的 似 然 比 可 以 派 生 为 :
作 者 名 等 : 题 目 13 ( VQ Sta, H ) Γ( VQ Sta, H ) l 1 Γ l 1 () Γ ( VQl H0) 其 中 : Γ( VQ, 1) M l Sta H Γ( VQkl Sta, H1) Γ( VQkl H1) Γ( VQl Sta, H1) = Γ( VQ H ) Γ( VQ H ) Γ( VQ H ) l 0 k= 1 kl 0 k= M+ 1 kl 0 M φ 0 ρκλ εkl VQ kl Γ βkl = exp k= 1ρκλ εkl + φ0 φ0 ρκλ εkl + φ0 k= M+ 1Γ βkl ( ) ( ) ( ) BF M 1 ϕkl γ( ES, ) VQt ( ) A ρκλ ( Sta)log ρ ( Sta) dt κλ = exp k = 11+ ϕkl φ0( ϕkl + 1) 因 为 候 选 视 觉 量 子 之 间 是 非 相 关 的, 则 VQ() t 的 似 然 函 数 可 以 写 为 如 下 形 式 : BF N M 1 ϕkl γ( E, S) VQ( t) A ρκλ ( Sta)log ρ ( Sta) dt κλ Γ( VQ( t) Sta, H1) exp (3) l= 1k= 11 + ϕkl φ0( ϕkl + 1) Γ ( VQ Sta, H ) 取 对 数, 则 其 对 数 似 然 函 数 可 以 写 为 : 对 l 1 BF M N ϕkl γ( E, S) VQ( t) A ρκλ ( Sta)log ρ ( Sta) dt κλ ln Γ ( VQ( t) Sta, H1) = + C (4) k= 1l= 1 φ0( ϕkl + 1) 其 中,C 是 一 个 常 数, 由 于 Γ ( VQ( t) Sta, H1) 的 导 数 存 在, 令 其 导 数 为 0, 解 方 程 并 验 证 方 程 的 解 使 似 然 函 数 ln Γ ( VQ( t) Sta, H1) 达 到 最 大 值, 因 为 计 算 过 程 对 于 任 何 观 测 样 本 值 都 成 立, 因 此 可 以 代 入 样 本 值 便 会 得 到 目 标 状 态 预 测 信 息 Sta=( x, y, v ) T 的 极 大 似 然 估 计 值. 3.3 算 法 步 骤 视 觉 量 子 跟 踪 方 法 步 骤 描 述 如 下 : 1 目 标 初 始 化. 在 待 跟 踪 目 标 图 像 中 选 定 目 标 大 致 的 前 景 范 围 和 背 景 范 围, 统 计 前 景 区 域 与 背 景 区 域 的 观 测 值. 如 图 16 所 示. Fig.16 Object initialization (yellow line indicates foreground, blue line indicates background) 图 16 目 标 初 始 化 ( 黄 色 线 为 前 景 区 域, 蓝 色 线 为 背 景 区 域 ) 量 子 频 率 计 算.(1) 在 目 标 初 始 化 区 域 内 自 上 而 下 辐 射 视 觉 量 子 VQ α, β, 形 成 视 觉 场 空 间 VFS ;() 计 算 并 统 F 计 视 觉 量 子 内 前 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶 A 以 及 背 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 的 灰 度 阶 B BF BF A ;(3) 以 观 测 值 统 计 A 的 分 布 概 率 ρ κλ, 计 算 VQ 的 熵 能 量 EE ( 见 式 (3));(4) 计 算 VQ 的 量 子 频 率 QF, 将 量 子 频 率 系 数 归 一 化, 滤 除 系 统 噪 音 和 杂 波 干 扰 ( 见 式 (5)(6)). 3 量 子 平 衡 跟 踪.(1) 计 算 量 子 频 率 的 二 阶 偏 导, 确 定 目 标 边 缘 区 域 R ( x, y) ( 见 式 (7)~(9));() 保 留 目 标 边 缘 处 的 视 觉 量 子, 删 除 目 标 其 它 区 域 的 视 觉 量 子 ;(3) 计 算 以 视 觉 量 子 几 何 中 心 ο ( X, Y ) 为 起 点 目 标 边 缘 区 域 几 何 中 心 ο '( X ', Y ') 为 终 点 的 向 量 δ ;(4) 沿 向 量 δ 将 视 觉 量 子 移 动 至 量 子 平 衡 状 态 ;(5) 计 算 视 觉 量 子 的 频 率 积 分,( 见 式 (10)~(1)). 4 目 标 状 态 预 测.(1) 对 目 标 运 动 状 态 进 行 极 大 似 然 估 计, 预 测 下 一 帧 目 标 位 置 ;() 采 集 下 一 帧 图 像, 利 用 频 率 阶 跃 不 变 性, 移 动 视 觉 量 子 至 平 衡 状 态, 若 目 标 因 完 全 遮 挡 丢 失, 则 对 预 测 位 置 辐 射 视 觉 量 子 ;(3) 以 预 测 位 置
14 Journal of Software 软 件 学 报 BF 的 前 景 信 息 和 背 景 信 息 更 新 A. X Y 5 输 出 跟 踪 结 果. 以 达 到 量 子 平 衡 状 态 的 视 觉 量 子 作 为 目 标 位 置 信 息, 输 出 目 标 位 置 (, ). α + β α + β 6 循 环 跟 踪. 以 第 5 步 中 输 出 的 跟 踪 位 置 作 为 下 一 帧 图 像 的 目 标 初 始 化 区 域, 转 至 步 骤 循 环 执 行. 3.4 实 例 测 试 为 了 验 证 视 觉 量 子 目 标 跟 踪 方 法 的 实 用 性, 在 复 杂 条 件 下 的 实 际 现 场 中 对 运 动 目 标 进 行 跟 踪 测 试, 跟 踪 对 象 选 用 不 同 光 照 不 同 拍 摄 角 度 不 同 旋 转 尺 度 不 同 形 状 变 化 的 变 结 构 机 动 目 标. 通 过 视 觉 量 子 局 部 采 样 可 以 看 出, 利 用 频 率 阶 跃 不 变 性 检 测 变 结 构 目 标 信 息 基 本 覆 盖 了 目 标 关 键 特 征 区 域, 抑 制 了 非 关 键 信 息, 通 过 视 觉 量 子 的 频 率 阶 跃 不 变 性 质 实 现 了 从 变 化 的 目 标 信 息 中 提 取 不 变 信 息 的 仿 生 视 觉 跟 踪 方 法. 在 复 杂 条 件 下, 当 运 动 目 标 出 现 快 速 的 变 结 构 运 动 时, 目 标 本 身 的 形 状 及 尺 度 变 化 速 度 较 快, 特 征 变 化 剧 烈, 尤 其 是 在 动 态 背 景 下, 目 标 前 景 与 背 景 运 动 相 似, 难 以 进 行 区 分, 而 且 目 标 混 合 边 缘 区 域 的 增 长 也 为 目 标 跟 踪 带 来 较 大 干 扰. 但 基 于 视 觉 量 子 的 目 标 跟 踪 方 法, 在 采 用 频 率 阶 跃 不 变 性 检 测 量 子 平 衡 跟 踪 和 目 标 状 态 预 测 情 况 下, 对 目 标 混 合 边 缘 信 息 的 跟 踪 保 持 了 较 强 的 稳 定 性 和 很 好 的 鲁 棒 性 能, 同 时 由 于 视 觉 量 子 方 法 对 目 标 实 行 跟 踪, 不 需 要 对 目 标 多 种 状 态 下 的 模 板 信 息 进 行 计 算 匹 配 及 存 储, 也 不 需 要 对 视 频 图 像 整 体 进 行 目 标 运 动 信 息 计 算 和 分 割, 因 此 视 觉 量 子 目 标 跟 踪 方 法 处 理 的 数 据 量 较 低, 使 该 方 法 具 有 较 高 的 跟 踪 速 度 和 较 强 的 适 应 能 力. 与 现 阶 段 著 名 的 TLD 方 法 OLSL 方 法 及 WLMC 方 法 相 比, 视 觉 量 子 跟 踪 方 法 在 实 时 性 稳 定 性 和 准 确 性 方 面 具 有 较 高 的 优 势. 在 测 试 中, 选 取 了 一 组 实 际 应 用 场 景 中 对 现 有 目 标 跟 踪 方 法 极 具 挑 战 性 的 高 速 变 结 构 战 机 飞 行 视 频 数 据 ( 视 频 数 据 量 为 30884 帧, 宽 高 为 646 468 像 素, 帧 容 量 为 87KB, 位 深 度 为 4 位 ). 对 基 于 视 觉 量 子 理 论 的 目 标 跟 踪 方 法 进 行 测 试 的 结 果 及 其 跟 踪 过 程 中 移 动 向 量 围 绕 量 子 中 心 波 动 的 效 果 分 别 如 图 17(a) 和 图 17(b) 所 示, 图 17(a) 中 黄 色 框 图 为 跟 踪 结 果, 视 频 处 理 速 度 为 65 帧 / 秒, 准 确 率 为 90.7%. 实 例 测 试 的 目 标 运 动 状 态 包 括 : 后 空 翻 与 垂 直 旋 转 后 斜 左 侧 翻 后 右 侧 翻 后 左 侧 翻 前 右 侧 翻 前 空 翻 前 斜 左 上 翻 及 相 似 背 景 干 扰.
作 者 名 等 : 题 目 15 后 空 翻 与 垂 直 旋 转 后 斜 左 侧 翻 后 右 侧 翻 后 左 侧 翻 前 右 侧 翻 前 空 翻 前 斜 左 上 翻 相 似 背 景 干 扰 Fig.17 (a) The results of maneuvering object tracking under 8 variable structure moving statuses 图 17(a) 8 种 变 结 构 运 动 状 态 下 的 机 动 目 标 跟 踪 结 果
16 Journal of Software 软 件 学 报 4 实 验 与 相 关 工 作 对 比 分 析 Fig.17(b) The fluctuating effect of moving vector around the quantum center 图 17(b) 移 动 向 量 围 绕 量 子 中 心 波 动 效 果 本 文 以 视 觉 量 子 理 论 为 核 心 的 变 结 构 目 标 跟 踪 方 法 在 Pentium 3.06GHz/1GB 机 器 上 采 用 C++ 语 言 编 程 实 现. 为 了 突 出 视 觉 量 子 跟 踪 方 法 的 优 点 及 与 相 关 跟 踪 方 法 的 不 同 之 处, 本 文 介 绍 了 目 前 较 为 流 行 的 目 标 跟 踪 方
作 者 名 等 : 题 目 17 [39] 法 的 实 现 步 骤. 在 评 估 中, 首 先 采 用 与 本 文 算 法 应 用 条 件 相 同 的 IBM 多 目 标 遮 挡 数 据 库 进 行 算 法 测 试, 同 时 采 用 跟 踪 与 监 视 性 能 评 估 工 作 组 [40] (Performance evaluation of tracking and surveillance, PETS) 的 性 能 评 估 指 标 对 本 文 算 法 进 行 性 能 评 估.PETS 主 要 提 供 视 觉 监 控 与 目 标 跟 踪 算 法 的 评 估 服 务, 早 期 的 PETS 主 要 针 对 人 员 与 车 辆 的 运 动 目 标 检 测 与 跟 踪, 现 在 主 要 进 行 以 像 素 和 目 标 为 单 位 的 统 计 评 估 并 且 提 供 在 线 监 控 与 跟 踪 算 法 的 性 能 评 估 服 务. 同 时 也 采 用 了 美 国 California 大 学 YiWu 等 人 提 出 的 视 觉 跟 踪 评 估 体 系 [9], 对 本 文 方 法 进 行 了 公 正 的 评 价. 对 相 关 文 献 中 作 者 公 开 发 布 的 Matlab 跟 踪 算 法 采 用 C++ 语 言 进 行 了 重 新 实 现, 以 与 本 文 方 法 进 行 更 为 公 平 的 对 比. 4.1 相 关 工 作 [31] 4.1.1 TLD 跟 踪 方 法 01 年 7 月 英 国 萨 里 大 学 的 学 者 Zdenek Kalal 提 出 了 一 种 TLD(Tracking-Learning-Detection) 单 目 标 跟 踪 方 法, 即 将 跟 踪 - 学 习 - 检 测 三 者 进 行 结 合, 实 现 边 跟 踪 边 学 习 边 检 测. 该 方 法 是 将 传 统 的 模 板 匹 配 跟 踪 算 法 特 征 检 测 算 法 及 P-N 学 习 算 法 相 结 合 以 解 决 目 标 运 动 过 程 中 产 的 形 变 和 局 部 遮 挡 问 题. 通 过 P-N 学 习 算 法 对 跟 踪 模 板 的 显 著 特 征 进 行 不 断 更 新, 对 检 测 过 程 中 的 目 标 模 型 及 相 关 参 数 也 要 进 行 更 新, 以 此 实 现 目 标 稳 定 跟 踪.TLD 实 现 过 程 如 图 18 所 示. Fig.18 The implementation process of TLD method 图 18 TLD 实 现 过 程 TLD 方 法 缺 点 : 由 于 TLD 方 法 需 要 不 断 进 行 模 板 更 新 和 在 线 学 习,TLD 方 法 只 能 对 目 标 外 形 和 尺 度 变 化 较 小 的 目 标 进 行 跟 踪, 对 于 外 形 和 尺 度 变 化 速 度 较 快 且 出 现 相 似 背 景 干 扰 情 况 时,TLD 方 法 很 容 易 出 现 失 跟 和 跟 踪 错 误 的 问 题. [33] 4.1. OLSL 跟 踪 方 法 013 年 RuiYao 等 学 者 提 出 了 基 于 在 线 局 部 结 构 学 习 的 跟 踪 算 法. 采 用 观 测 样 本 和 样 本 数 量 对 图 像 局 部 模 板 进 行 在 线 训 练 和 分 类, 结 合 历 史 模 型 数 据 与 样 本 分 类 对 多 个 局 部 模 型 进 行 SVM 结 构 化 学 习, 建 立 外 观 模 型, 输 出 跟 踪 结 果. 当 目 标 发 生 遮 挡 或 者 局 部 外 观 发 生 显 著 变 化 时, 该 帧 数 据 不 能 用 于 增 量 学 习, 以 提 高 模 型 的 鲁 棒 性. 这 就 要 求, 在 每 一 帧, 都 要 根 据 历 史 数 据 重 新 训 练 SVM. 即 为 了 计 算 当 前 帧 的 外 观 模 型, 需 要 将 当 前 帧 加 入 到 在 线 训 练 与 分 类 器 中 进 行 训 练, 重 新 计 算 SVM.OLSL 算 法 步 骤 如 图 19 所 示. 视 频 在 线 训 练 与 分 类 样 本 分 类 模 型 跟 踪 与 更 新 跟 踪 窗 历 史 数 据 SVM 在 线 学 习 Fig.19 The implementation process of OLSL algorithm 图 19 OLSL 算 法 步 骤 OLSL 方 法 缺 点 :OLSL 方 法 需 要 对 外 观 模 型 进 行 反 复 学 习 和 更 新, 同 时 需 要 对 新 生 长 的 局 部 外 观 模 型 需 要 重 新 训 练 与 分 类. 虽 然 在 一 定 条 件 下 显 示 了 较 好 的 跟 踪 效 果, 但 是 对 于 相 似 目 标 干 扰 和 变 结 构 目 标 运 动 跟 踪 的 失 跟 率 较 高, 甚 至 容 易 出 现 跟 踪 错 误 目 标 的 情 况.
18 Journal of Software 软 件 学 报 [3] 4.1.3 WLMC 跟 踪 方 法 013 年 韩 国 首 尔 大 学 的 学 者 Junseok Kwon 针 对 突 变 运 动 问 题 提 出 了 一 种 基 于 Wang-Landau 的 蒙 特 卡 罗 采 样 跟 踪 方 法, 用 来 解 决 目 标 在 复 杂 环 境 下 的 突 变 运 动 跟 踪 问 题. 该 算 法 首 先 引 入 了 Wang-Landau 采 样 方 法 并 将 其 集 成 到 一 个 以 蒙 特 卡 罗 (MCMC) 跟 踪 框 架 为 基 础 的 马 尔 科 夫 链 中, 通 过 采 集 当 前 观 测 样 本, 利 用 Wang-Landau 采 样 方 法 引 入 MCMC 接 受 率, 可 以 有 效 缓 解 目 标 运 动 的 平 滑 约 束 和 实 现 鲁 棒 跟 踪.WLMC 方 法 可 以 对 目 标 状 态 进 行 有 效 采 样, 对 目 标 位 置 和 尺 度 发 生 较 大 突 变 运 动 时 可 以 进 行 有 效 跟 踪.WLMC 实 现 步 骤 如 图 0 所 示. Fig.0 The implementation process of WLMC algorithm 图 0 WLMC 实 现 步 骤 WLMC 方 法 缺 点 :WLMC 跟 踪 方 法 在 蒙 特 卡 罗 (MCMC) 跟 踪 框 架 的 基 础 上 利 用 Wang-Landau 采 样 方 法 引 入 MCMC 接 受 率. 可 以 对 突 变 目 标 进 行 有 效 跟 踪, 但 是 对 于 长 时 间 的 连 续 的 变 结 构 目 标 运 动 情 况 不 具 有 稳 定 的 跟 踪 效 果,WLMC 方 法 对 快 速 的 连 续 变 结 构 运 动 目 标 的 跟 踪 窗 抖 动 性 较 强, 稳 定 性 较 低. 4. IBM 评 估 指 标 及 评 估 结 果 目 标 检 测 的 研 究 对 象 主 要 包 括 像 素 和 目 标 两 种, 因 此 目 前 主 要 有 基 于 像 素 和 基 于 目 标 的 种 评 估 方 案. 基 于 像 素 级 别 的 评 估 包 含 4 项 统 计 指 标, 分 别 是 目 标 矩 形 框 内 的 前 景 帧 数 量 TP(True positive), 目 标 矩 形 框 外 的 背 景 帧 数 量 TN(True negative), 目 标 矩 形 框 外 的 前 景 帧 数 量 FP(False positive), 目 标 矩 形 框 内 的 背 景 帧 数 量 FN(False negative). 基 于 以 上 4 种 数 据 指 标,PETS 提 出 了 相 应 的 评 估 指 标 对 目 标 跟 踪 算 法 进 行 性 能 评 估, 具 体 指 标 见 表. Table The evaluation indexes of monitoring and tracking algorithms 表 监 控 与 跟 踪 算 法 性 能 评 估 指 标 项 目 名 称 计 算 过 程 TDR(Tracker detect rate) TDR=TP/(TP+FN) PP (Positive prediction) PP=TP/(TP+FP) FNR (False negative rate) FNR=FN/(TP+FN) FAR (False alarm rate) FAR=FP/(TP+FP) ACC (Accuracy) ACC=(TN+TP)/NTF FPR (False positive rate) FPR=FP/(TN+FP) 表 中 NTF(The number of total frame) 为 经 过 算 法 处 理 的 帧 总 数. 基 于 像 素 的 评 估 方 法 需 要 用 人 工 对 视 频 数 据 的 真 实 场 景 进 行 准 确 标 定, 人 工 实 现 较 为 困 难, 而 基 于 目 标 为 单 位 的 统 计 评 估 方 法, 表 所 列 出 的 参 数 也 同 样 适 用. 以 目 标 数 量 进 行 统 计 的 评 估 方 法, 主 要 通 过 系 统 的 输 出 目 标 区 域 和 矩 形 框 标 定 的 目 标 区 域 的 重 叠 区 域 进 行 判 别. 主 要 判 断 矩 形 框 标 定 目 标 是 否 处 于 待 检 测 目 标 的 边 界 以 内, 若 处 于 边 界 内, 则 判 定 为 目 标 检 测 成 功, 此 时 TP=TP+1; 否 则 判 定 为 目 标 没 有 检 测 成 功, 此 时 FN=FN+1; 若 待 检 测 目 标 搜 索 不 到 可 以 成 功 匹 配 的 矩 形 框, 则 标 定 此 待 检 测 目 标 为 FP, 此 时 FP=FP+1; 若 待 检 测 目 标 与 矩 形 框 目 标 产 生 交 错, 则 列 为 候 选 目 标 的 像 素 区 域, 此 时 TN=TN+1. 基 于 目 标 的 评 估 方 法 简 便 快 捷, 可 以 对 跟 踪 算 法 的 监 控 与 跟 踪 效 果 虚 警 概 率 进 行 有 效 的 性 能 评 估. 同 时 为 了 定 量 评 价 本 文 算 法 处 理 遮 挡 下 目 标 状 态 预 测 能 力, 在 此 引 入 一 个 新 的 评 价 指 标 : 预 测 错 误 率 (Forecast error rate, FER), 用 于 描 述 目 标 在 被 遮 挡 前 后 错 误 预 测 的 概 率 ( 包 括 发 生 实 际 运 行 轨 迹 和 预 测 轨 迹 出 现 较 大 偏 离 的 情 况 ), 定 义 如 下 : FER= (~ μ j) (~ ψ l) 其 中, μ j 为 第 j 次 遮 挡 前 后 预 测 状 态 值, ψ l 为 第 l 次 遮 挡 前 后 分 裂 状 态 值, μ = 0时, 预 测 错 误, μ = 1时, 预 测 有 效. ψ = 0时, 遮 挡 发 生 分 裂, ψ = 1时, 遮 挡 未 分 裂. 本 文 VQ 跟 踪 方 法 TLD 方 法 OLSL 方 法 及 WLMC 方 法 在 IBM 多 目 标 遮 挡 数 据 库 的 15 组 视 频, 共 10603 帧
作 者 名 等 : 题 目 19 图 像 的 测 试 结 果 如 图 1 所 示, 其 中 每 组 实 验 均 反 复 进 行 0 次. 综 合 测 试 结 果 表 明,VQ 跟 踪 方 法 具 有 较 高 的 跟 踪 性 能 : 目 标 外 观 与 背 景 相 似 干 扰 条 件 下 的 漏 检 概 率 FNR 为 0.011, 如 图 1 所 示. 由 于 跟 踪 过 程 中 充 分 考 虑 了 运 动 目 标 邻 域 量 子 频 率 间 存 在 的 频 率 阶 跃 不 变 性, 然 后 将 该 性 质 纳 入 量 子 平 衡 移 动 中, 并 对 目 标 进 行 预 测 跟 踪, 降 低 了 系 统 和 环 境 噪 声 引 起 的 虚 警 概 率 FPR,FPR 的 平 均 测 试 结 果 为 0.037, 同 时 有 效 解 决 了 变 结 构 运 动 及 遮 挡 引 起 的 目 标 丢 失 问 题, 跟 踪 准 确 率 TDR 平 均 为 0.91, 预 测 错 误 率 平 均 为 0.13. 在 目 标 跟 踪 过 程 中, 由 于 采 用 了 似 然 估 计 对 目 标 状 态 进 行 预 测 式 跟 踪, 使 得 本 文 算 法 具 有 较 高 的 实 时 性 和 准 确 率, 对 IBM 多 目 标 遮 挡 数 据 库 的 处 理 速 度 平 均 为 75 帧 / 秒. 为 了 进 一 步 验 证 本 文 前 趋 预 测 跟 踪 方 法 在 相 似 背 景 干 扰 强 度 目 标 运 动 速 度 和 多 目 标 遮 挡 强 度 变 化 情 况 下 的 跟 踪 性 能, 本 文 在 IBM 多 目 标 遮 挡 数 据 库 的 15 组 视 频 上 进 行 了 大 量 的 性 能 测 试, 每 组 实 验 反 复 进 行 0 次, 以 均 值 表 示 平 均 测 试 结 果, 同 时 与 TLD 算 法 OLSL 算 法 WLMC 算 法 在 相 似 背 景 干 扰 强 度 变 结 构 运 动 速 度 和 多 目 标 遮 挡 强 度 变 化 的 情 况 下 三 者 的 跟 踪 性 能 进 行 比 较. Fig.1 The assessment result of multi-objective occlusion database 图 1 多 目 标 遮 挡 数 据 库 评 估 结 果 4..1 相 似 背 景 干 扰 强 度 变 换 相 似 背 景 干 扰 强 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 所 示. 实 验 结 果 表 明 当 相 似 背 景 干 扰 强 度 逐 步 递 增 时, 本 文 视 觉 量 子 跟 踪 方 法 在 运 动 目 标 相 似 背 景 的 递 增 式 干 扰 条 件 下 的 跟 踪 误 差 和 实 时 误 差 都 普 遍 较 低, 相 对 于 其 他 三 种 方 法, 本 文 跟 踪 方 法 对 相 似 背 景 干 扰 条 件 下 的 目 标 跟 踪 具 有 显 著 的 稳 定 性 和 实 时 性. (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig. The performance comparison about the intensity transformation of interference from similar background 图 相 似 背 景 干 扰 强 度 变 换 的 性 能 对 比 4.. 变 结 构 运 动 速 度 变 换 目 标 运 动 速 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 3 所 示. 实 验 结 果 表 明 当 目 标 运 动 速 度 逐 渐 增 大 时, 本 文 视 觉 量 子 跟 踪 方 法 的 跟 踪 误 差 递 增 幅 度 较 小, 实 时 性 误 差 基 本 保 持 在 较 低 水 平, 验 证 了 本 文 基 于 视 觉 量 子 的 目 标 跟 踪 方 法 对 于 速 度 变 化 的 运 动 目 标 跟 踪 具 有 明 显 优 势. 而 其 它 三 种 方 法 对 目 标 运 动 速 度 递 增 条 件 下 的 跟 踪 误 差 和 实 时 性 误 差 都 在 逐 步 递 增, 比 本 文 VQ 方 法 的 跟 踪 误 差 和 实 时 性 误 差 平 均 高 出 0. 和 0.3, 不 具 有 明 显 的 跟 踪 优 势.
0 Journal of Software 软 件 学 报 (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig.3 The performance comparison about speed transformation of variable structure motion 图 3 目 标 运 动 速 度 变 换 的 性 能 对 比 4..3 多 目 标 运 动 遮 挡 强 度 变 换 多 目 标 运 动 遮 挡 强 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 4 所 示. 从 图 中 可 以 看 出 当 多 目 标 交 叉 式 运 动 的 遮 挡 强 度 逐 步 增 加 时, 本 文 视 觉 量 子 跟 踪 方 法 的 跟 踪 误 差 保 持 在 较 低 水 平, 增 幅 较 小, 跟 踪 误 差 较 低, 对 多 目 标 遮 挡 具 有 很 好 的 鲁 棒 性, 而 其 它 三 种 方 法 跟 踪 误 差 较 高, 尤 其 是 TLD 方 法, 虽 然 在 目 标 遮 挡 强 度 较 低 时 保 持 了 很 好 的 跟 踪 准 确 性, 跟 踪 误 差 最 小, 但 是 当 目 标 遮 挡 强 度 递 增 时, 跟 踪 误 差 增 幅 较 大, 对 目 标 遮 挡 跟 踪 的 鲁 棒 性 较 低. 在 实 时 性 误 差 当 中, 四 种 方 法 在 目 标 遮 挡 强 度 递 增 时, 都 保 持 了 较 好 的 鲁 棒 性, 但 是 本 文 VQ 方 法 的 跟 踪 实 时 性 误 差 最 低, 比 其 它 三 种 方 法 具 有 较 高 的 抗 遮 挡 跟 踪 优 势. (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig.4 The performance comparison about intensity transformation of occlusion for multi-objective motions 图 4 多 目 标 遮 挡 强 度 变 换 的 性 能 对 比 4.3 Benchmark 评 估 指 标 及 评 估 结 果 在 PETS 性 能 评 估 基 础 上, 本 文 采 用 美 国 California 大 学 YiWu 等 人 提 出 的 Benchmark 视 觉 跟 踪 评 估 体 系, 对 本 文 方 法 进 行 了 进 一 步 公 正 的 评 价.Benchmark 评 估 体 系 提 供 了 50 组 不 同 干 扰 条 件 下 的 视 频 数 据 库 进 行 跟 踪 测 试, 在 此 基 础 上 提 供 了 可 以 与 相 关 算 法 进 行 对 比 的 近 660000 个 目 标 跟 踪 窗, 并 注 明 了 最 常 使 用 的 跟 踪 序 列, 图 5 显 示 了 Benchmark 视 频 数 据 库 中 每 个 视 频 序 列 的 第 一 帧 进 行 初 始 化 的 目 标 窗 口. 视 频 数 据 库 及 跟 踪 结 果 可 以 从 http://visual tracking.net 下 载.
作 者 名 等 : 题 目 1 Fig.5 Samples of object initialization in Benchmark video databases 图 5 Benchmark 视 频 数 据 库 目 标 初 始 化 示 例 Benchmark 评 估 方 法 主 要 通 过 算 法 可 执 行 程 序 的 运 行 结 果 对 算 法 性 能 的 好 坏 进 行 定 量 分 析 与 评 估. 评 估 指 标 包 括 整 体 跟 踪 性 能 指 标 OPE 时 间 鲁 棒 性 指 标 TRE 和 空 间 鲁 棒 性 指 标 SRE.OPE 是 在 第 一 帧 初 始 化 目 标 位 置 限 制 下 的 整 体 跟 踪 平 均 通 过 率,TRE 指 第 一 帧 跟 踪 到 最 后 一 帧 的 整 体 耗 时 与 准 确 性,SRE 包 含 两 个 方 面, 一 是 程 序 跟 踪 窗 中 心 位 置 与 目 标 中 心 位 置 的 平 均 Euclidean 距 离, 另 一 个 是 程 序 跟 踪 窗 边 框 与 实 际 目 标 边 框 的 重 叠 率, 最 后 通 过 AUC 对 精 度 和 准 确 率 进 行 统 计, 因 此 选 择 合 理 的 可 执 行 程 序 是 进 行 算 法 性 能 正 确 评 价 的 基 础. 本 文 根 据 相 关 文 献 中 的 算 法 流 程 并 参 照 了 作 者 公 开 发 布 的 基 于 Matlab 的 跟 踪 程 序, 采 用 C++ 语 言 对 相 关 文 献 所 提 方 法 进 行 了 重 新 实 现 和 算 法 优 化, 以 与 本 文 方 法 进 行 更 为 公 平 的 对 比. 在 Pentium 3.06GHz/1GB 机 器 上 对 VQ 方 法 TLD 方 法 OLSL 方 法 WLMC 方 法 进 行 了 跟 踪 测 试, 测 试 结 果 如 图 6 所 示. 测 试 中, 以 第 一 帧 初 始 化 的 区 域 为 跟 踪 目 标, 视 频 测 试 结 果 有 效 区 间 为 第 二 帧 至 最 后 一 帧, 每 组 视 频 均 反 复 测 试 0 次, 取 均 值 作 为 测 试 结 果, 以 提 高 评 估 准 确 性 和 公 平 性. 综 合 实 验 结 果, 本 文 VQ 方 法 在 Benchmark 评 估 测 试 中 的 平 均 跟 踪 准 确 率 为 9.5%, 视 频 处 理 速 度 平 均 为 73 帧 / 秒. (a) Test data of OPE accuracy (a)ope 准 确 率 测 试 数 据 (b) Test data of SRE accuracy (b)sre 准 确 率 测 试 数 据
Journal of Software 软 件 学 报 (c) Test data of TRE accuracy (c)tre 准 确 率 测 试 数 据 (d) Test data of OPE precision (d)ope 精 度 测 试 数 据 (e) Test data of SRE precision (f) Test data of TRE precision (e)sre 精 度 测 试 数 据 (f)tre 精 度 测 试 数 据 Fig. 6 Benchmark performance evaluation results of VQ method, TLD method, OLSL method and WLMC method 图 6 VQ 方 法 TLD 方 法 OLSL 方 法 WLMC 方 法 的 Benchmark 性 能 评 估 结 果 由 图 6(a)~(f) 测 试 数 据 可 以 得 出 以 下 评 估 结 果 : s r s r OPE : TLD < OLSL < WLMC < VQ SRE : TLD < OLSL < WLMC < VQ s r pre TRE : TLD < OLSL < WLMC < VQ OPE : TLD < OLSL < WLMC < VQ pre pre SRE : TLD < WLMC < OLSL < VQ TRE : TLD < WLMC < OLSL < VQ 其 中,s-r 为 准 确 率,pre 为 精 度. 由 结 果 可 以 看 出, 前 四 项 评 估 结 果 一 致, 第 四 项 和 第 五 项 中 WLMC 算 法 的 SRE 精 度 和 TRE 精 度 略 小 于 OLSL 算 法, 原 因 是 WLMC 算 法 在 蒙 特 卡 罗 跟 踪 的 样 本 输 入 过 程 中, 对 输 入 样 本 实 行 接 受 率 反 馈, 对 样 本 系 数 进 行 动 态 调 整, 虽 然 在 一 定 程 度 上 提 高 了 跟 踪 准 确 率, 但 跟 踪 系 统 的 鲁 棒 性 也 略 有 降 低. 即 便 如 此,WLMC 算 法 在 整 体 性 能 上 仍 然 好 于 OLSL 算 法. 四 中 算 法 的 综 合 评 估 结 果 如 下 : TLD < OLSL < WLMC < VQ 在 OPE 准 确 率 SRE 准 确 率 TRE 准 确 率 OPE 精 度 SRE 精 度 和 TRE 精 度 6 种 评 估 指 标 的 评 估 下,TLD 方 法 OLSL 方 法 与 WLMC 方 法 显 示 出 了 较 高 的 跟 踪 精 度 和 准 确 率, 也 显 示 出 了 较 好 的 鲁 棒 性 能. 相 比 之 下, 本 文 VQ 跟 踪 方 法 比 其 它 三 种 算 法 在 保 持 同 一 评 测 条 件 下 显 示 出 了 更 高 的 跟 踪 精 度 和 跟 踪 准 确 率, 同 时 相 比 其 它 三 种 方 法, 视 觉 量 子 跟 踪 方 法 不 需 要 进 行 在 线 学 习 在 线 分 类 及 特 征 融 合 等 相 关 操 作, 通 过 视 觉 量 子 熵 能 量 计 算 频 率 阶 跃 不 变 性 提 取 量 子 平 衡 跟 踪 以 及 目 标 状 态 预 测 四 个 步 骤 实 行 目 标 跟 踪, 在 时 间 鲁 棒 性 和 空 间 鲁 棒 性 上 凸 显 出 较 强 的 优 势. 同 时 由 图 5 可 知,Benchmark 性 能 评 估 体 系 提 供 测 试 的 视 频 数 据 在 目 标 运 动 速 度 形 状 变 化 幅 度 尺 度 伸 缩 强 度 相 似 背 景 / 目 标 遮 挡 与 干 扰 光 照 强 度 变 化 特 征 域 旋 转 系 统 与 环 境 噪 声 杂 波 等 多
作 者 名 等 : 题 目 3 种 复 杂 因 素 的 综 合 影 响 下, 对 目 标 跟 踪 方 法 的 测 试 具 有 全 面 性 和 客 观 性, 而 且 其 评 估 过 程 严 格, 视 频 数 据 环 境 贴 近 实 际 现 场, 评 估 指 标 较 为 公 正. 因 此 本 文 提 出 的 视 觉 量 子 跟 踪 方 法 在 跟 踪 的 准 确 性 稳 定 性 实 时 性 及 鲁 棒 性 上 都 显 示 出 了 较 强 的 优 势 和 很 好 的 跟 踪 性 能. 同 时 由 于 视 觉 量 子 跟 踪 方 法 在 进 行 量 子 频 率 阶 跃 计 算 量 子 平 衡 状 态 移 动 过 程 中, 对 图 像 采 集 设 备 的 采 集 频 率 具 有 较 强 的 依 赖 性, 较 高 的 图 像 采 集 频 率 对 本 文 视 觉 量 子 目 标 跟 踪 的 准 确 性 和 目 标 状 态 预 测 准 确 性 具 有 积 极 的 推 动 作 用, 因 此 如 果 能 在 提 升 图 像 采 集 设 备 的 采 集 频 率 前 提 下, 进 行 视 觉 量 子 跟 踪, 将 会 使 本 文 方 法 发 挥 出 更 好 的 跟 踪 性 能. 4.4 计 算 复 杂 性 与 数 据 量 分 析 在 Pentium4 3.06G CPU/1G 内 存 的 机 器 上 对 一 组 大 小 为 a b 长 度 为 l 的 视 频 进 行 目 标 跟 踪, 手 动 选 取 的 目 标 跟 踪 窗 大 小 为 m n, 视 觉 量 子 数 量 为 N. 本 文 方 法 的 时 间 计 算 量 包 含 三 个 部 分 : 第 一 部 分 是 量 子 频 率 计 算 时 间, 第 二 部 分 是 量 子 平 衡 跟 踪 的 计 算 时 间, 第 三 部 分 是 目 标 状 态 预 测 的 计 算 时 间. 计 算 量 子 频 率 信 息 的 时 间 复 杂 度 为 Ο ( N log N), 进 行 量 子 平 衡 跟 踪 的 时 间 复 杂 度 为 Ο ( Nlog N + N), 进 行 目 标 状 态 预 测 的 时 间 复 杂 度 为 Ο[( mn log N) / N], 因 此 本 文 方 法 的 时 间 复 杂 3 3 度 是 Ο [(N + mn / N)log N + N], 远 小 于 基 于 TLD 的 时 间 复 杂 度 Ο ( abm n N ), 也 远 小 于 基 于 OLSL 的 时 间 复 杂 度 Ο ( mnn + log N) 和 基 于 WLMC 的 时 间 复 杂 度 Ο ( mnn + mnn). 本 文 方 法 的 空 间 复 杂 度 为 Ο (3 N), 即 Ο ( N), 而 文 献 [31-33] 的 方 法 的 空 间 复 杂 度 都 是 Ο ( N ), 因 此 本 文 方 法 的 计 算 效 率 优 于 TLD 方 法, 也 优 于 OLSL 和 WLMC 的 方 法. 在 数 据 处 理 方 面, 本 文 方 法 需 要 处 理 的 数 据 主 要 集 中 在 目 标 混 合 边 缘 区 域 的 量 子 频 率 计 算 上, 数 据 量 较 小, 同 时 采 用 极 大 似 然 估 计 方 法 预 测 目 标 位 置, 无 需 对 候 选 目 标 进 行 全 局 搜 索 和 存 储 多 种 目 标 姿 态 模 型, 降 低 了 目 标 搜 索 范 围 和 待 处 理 的 数 据 总 量, 对 于 本 节 设 定 的 视 频 图 像, 其 处 理 的 数 据 总 量 远 远 小 于 abl 个 像 素, 而 文 献 [31-33] 方 法 需 要 处 理 的 数 据 总 量 均 为 abl 个 像 素. 因 此 本 文 方 法 处 理 的 数 据 量 小 于 其 他 三 种 方 法 的 数 据 量. 5 结 论 及 展 望 本 文 在 生 物 视 觉 单 元 协 同 工 作 的 方 向 上, 提 出 了 一 种 新 的 基 于 视 觉 量 子 的 目 标 跟 踪 方 法. 视 觉 量 子 目 标 跟 踪 方 法 是 建 立 在 子 空 间 目 标 协 同 分 析 的 整 体 框 架 之 上, 利 用 视 觉 量 子 采 样, 熵 能 量 计 算 频 率 阶 跃 不 变 性 提 取 量 子 平 衡 跟 踪 以 及 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 重 复 验 证 移 动 后 的 视 觉 量 子 的 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 与 现 有 目 标 跟 踪 方 法 相 比, 该 方 法 的 优 势 在 于 :(1) 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 能 量 频 率 阶 跃 不 变 性 的 特 点 ;() 将 阶 跃 不 变 特 征 采 用 多 个 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低, 鲁 棒 性 能 较 高 ;(3) 视 觉 量 子 数 据 量 较 小, 同 时 不 需 要 存 储 目 标 多 种 姿 态 模 型, 计 算 复 杂 度 和 空 间 复 杂 度 低, 跟 踪 实 时 性 较 高. 通 过 IBM 评 估 测 试 和 Benchmark 评 估 测 试 表 明, 视 觉 量 子 在 多 种 复 杂 环 境 下, 特 别 是 速 度 较 高 的 变 结 构 运 动 目 标 跟 踪 中 保 持 了 较 强 的 稳 定 性, 对 环 境 变 化 和 目 标 自 身 变 化 具 有 很 好 的 鲁 棒 性 和 准 确 性, 准 确 率 平 均 为 91.5%, 在 高 速 变 结 构 机 动 目 标 跟 踪 IBM 评 估 数 据 库 和 Benchmark 评 估 数 据 库 上 跟 踪 的 实 时 性 平 均 为 7 帧 / 秒. 本 文 方 法 不 仅 对 视 频 目 标 跟 踪 有 效, 而 且 对 三 维 场 景 图 像 检 索 视 觉 场 景 分 析 也 具 有 普 遍 意 义, 为 计 算 机 视 觉 处 理 提 供 了 新 的 思 路. 视 觉 量 子 通 过 目 标 子 空 间 量 子 簇 的 协 同 分 析 进 行 目 标 跟 踪, 如 果 目 标 图 像 整 体 模 糊 程 度 较 高 ( 熵 分 布 趋 于 1) 时, 量 子 频 率 近 似 程 度 较 为 严 重, 影 响 了 目 标 跟 踪 效 果, 虽 然 模 糊 程 度 较 高 的 视 频 图 像 在 视 觉 意 义 上 已 经 失 去 作 用, 但 针 对 模 糊 图 像 跟 踪 做 进 一 步 分 析, 将 对 视 觉 量 子 跟 踪 性 能 的 完 善 起 到 很 好 的 推 动 作 用, 因 此 本 文 今 后 将 针 对 模 糊 图 像 的 目 标 跟 踪 做 进 一 步 研 究 工 作. 致 谢 在 此, 我 们 向 对 本 文 的 工 作 给 予 支 持 指 导 和 建 议 的 国 内 外 同 行, 尤 其 是 英 国 Surrey 大 学 Zdenek Kalal 学 者 韩 国 Seoul 大 学 Junseok Kwon 学 者 美 国 Carnegie Mellon 大 学 Robert T. Collins 教 授 表 示 感 谢.
4 Journal of Software 软 件 学 报 References: [1] David T, Matthew F, Atsushi N. Motion coherent tracking using multi-label MRF optimization. International Journal of Computer Vision, 01, 100(): 190-0.[doi: 10.1007/s1163-011-051-5] [] Xi L, Dick A, Chun HS, Van DHA, Han Z W. Incremental learning of 3D-DCT compact representations for robust visual tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(4):863-881.[doi: 10.1109/TPAMI.01.166] [3] Salmond DJ, Gordon NJ. Group and extended object tracking. In: Proc. of IEE Colloquium on Target Tracking. London, UK: IEE, 1999. 1611-1614.[doi: 10.1049/ic:19990517] [4] Waxmann MJ, Drummond OE. A bibliography of cluster (group) tracking. In: Proc. of the International Conference on Signal and Data Processing of Small Targets. Orlando, USA:SPIE, 004. 551-560.[doi: 10.1117/1.548357] [5] Bugeau A, Perez P. Detection and segmentation of moving objects in highly dynamic scenes. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Minnesota, USA:IEEE, 007.1-8.[doi: 10.1109/CVPR.007.38344] [6] Lu Z, Laurens VM. Structure preserving object tracking. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 1838-1845.[doi: 10.1109/CVPR.013.40] [7] Rizwan C, Gregory H, Rene V. Dynamic template tracking and recognition. International Journal of Computer Vision, 013, 105(1):19-48.[doi: 10.1007/s1163-013-065-0] [8] Huttenlocher DP, Klanderman GA, Rucklidge WJ. Comparing images using the Hausdorff distance. IEEE Transactions on Pattern Analysis Machine Intellelligence, 1993, 15(9):850-863.[doi: 10.1109/34.3073] [9] Huttenlocker DP, Noh JJ, Rucklidge WJ. Tracking nonrigid objects in complex scenes. In: Proc. of the 4th Int l Conference on Computer Vision, Berlin, Germany,1993.[doi: 10.1109/ICCV.1993.37831] [10] Haritaoglu I, Harwood D, Davis LS. W 4 : Real-time surveillance of people and their activities. IEEE Transactions on Pattern Analysis and Machine Intelligence, 008, (8):809-830.[doi: 10.1109/34.868683] [11] Stauffer C, Grimson WEL. Learning patterns of activity using real-time tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 006, (8):747-757.[doi: 10.1109/34.868677] [1] Rezaeian M, Vo BN. Error bounds for joint detection and estimation of a single object with random finite set observation. IEEE Transactions on Signal Processing. 010, 58(3):1493-1506.[doi: 10.1109/TSP.009.037665] [13] Yan XX, Han CZ. Multiple target tracking based on online estimation of clutter intensity. Control and Decision, 01, 7(4):507-51 (in Chinese with English abstract). [doi: 10.13195/j.cd.01.04.9.yanxx.013] [14] Juan R, Raul E, Victor A. A fuzzy inference approach to template-based visual tracking. Machine Vision and Applications, 01, 3(3):47-439.[doi: 10.1007/s00138-010-0314-8] [15] Airouche M, Bentabet L, Zelmat M, Gao G. Pedestrian tracking using color, thermal and location cue measurements: a DSmT-based framework. Machine Vision and Applications, 01, 3(5):999-1010.[doi: 10.1007/s00138-011-034-z] [16] Zhou HY, Yuan Y, Shi CM. Object tracking using SIFT features and mean shift. Computer Vision and Image Understanding,009, 113(3):345-35.[doi: 10.1016/j.cviu.008.08.006] [17] Maggio E, Cavallaro A. Learning scene context for multiple object tracking. IEEE Transactions on Image Processing, 009, 18(8):1873-1884.[doi: 10.1109/TIP.009.019934] [18] Carl YR, Victor P, Ian R. Regressing local to global shape properties for online segmentation and tracking. International Journal of Computer Vision, 013, 106(3):69-81.[doi: 10.1007/s1163-013-0635-y] [19] Vo BN, Ma WK. The Gaussian mixture probability hypothesis density filter. IEEE Transactions on Signal Processing, 009, 51(11):4091-4104.[doi: 10.1109/TSP.006.881190] [0] Mahler R. Detecting, tracking, and classifying group targets: a unified approach. In: Proc. of the International Conference on Signal and Data Processing of Small Targets. Orlando, USA: SPIE, 009. 17-8.[doi: 10.1117/1.436950] [1] Xi L, Wei MH, Chun HS, Zhong FZ, Anthony D, Anton VDH. A survey of appearance models in visual object tracking. ACM Transactions on Intelligent Systems and Technology, 013, 4(4):58(1-48).[doi: 10.1145/508037.508039] [] Comaniciu D, Ramesh V, Meer P. Real-time tracking of non-rigid objects using mean shift. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. South Carolina, USA, 000, : 14-149.[doi: 10.1109/CVPR.000.854761] [3] Comaniciu D, Ramesh V, Meer P. Kernel-based object tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 007, 5(5):564-577.[doi: 10.1109/TPAMI.003.1195991]
作 者 名 等 : 题 目 5 [4] Yang C, Duraiswami R, Davis L. Efficient means shift tracking via a new similarity measure. In: Proc. of the 005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. California, USA, 005, 1: 176-183.[doi: 10.1109/CVPR.005.139] [5] Jeong MH, You BJ, Oh YH, Oh SR, Oh SH. Adaptive mean-shift tracking with novel color model. In: Proc. of the IEEE International Conference on Mechatronics & Automation. Niagara Falls, Canada, 005, 3: 139-1333.[doi: 10.1109/ICMA.005.166746] [6] Davy M, Tourneret JY. Generative supervised classification using dirichlet process priors. IEEE Transactions on Pattern Analysis and Machine Intelligence, 010, 3(10):1781-1794.[doi: 10.1109/TPAMI.010.1] [7] Liam E, Nicholas D, Jiri M, Richard B. Linear regression and adaptive appearance models for fast simultaneous modeling and tracking. International Journal of Computer Vision, 011,95():154-179.[doi: 10.1007/s1163-010-0364-4] [8] Ying LT, Andrew S, Max L. Robust and efficient foreground analysis in complex surveillance videos. Machine Vision and Applications, 01, 3(5):967-983.[doi: 10.1007/s00138-011-0377-1] [9] Yi W, Jongwoo L, Hsuan Y. Online object tracking: a benchmark. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 411-418.[doi: 10.1109/CVPR.013.31] [30] Lv XB, Zhou QB, Chen ZM, Xiong YY, Cai K. The gaussian mixture probability hypothesis density filter and its application to multi-target tracking. Chinese Journal of Computers, 01, 35():397-403 (in Chinese with English abstract). [doi: 10.374/sP.J.1016.01.00397] [31] Kalal Z, Mikolajczyk K, Matas J. Tracking-learning-detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 01, 34(7):1409-14.[doi: 10.1109/TPAMI.011.39] [3] Rui Y, Qinfeng S, Chunhua S, Yanning Z, Vandenhengel A. Part-based visual tracking with online latent structural learning. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 363-370.[doi: 10.1109/CVPR.013.306] [33] Junseok K, Kyoung ML. Wang-landau monte carlo-based tracking methods for abrupt motions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(4): 1011-104.[doi: 10.1109/TPAMI.01.161] [34] Hu DK. The research on technology of image understanding based on biological visual perception[ph.d. Thesis].Chengdu: University of Electronic Science and Technology of China, 01 (in Chinese with English abstract). [35] Ali B, Laurent I. State-of-the-art in visual attention modeling. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(1): 185-07. [36] Zhang JS, Xu ZB, Ruan YW. A new data processing method based on a biological model of compound eye: direction quantization representation and its theory. Chinese Journal of Computers, 000, 3(6): 609-614 (in Chinese with English abstract). [doi: 10.331/j.issn:054-4164.000.06.007] [37] Zhang JS, Xu ZB, Ruan YW. A new data processing method based on a biological model of compound eye: direction quantization representation in applications. Chinese Journal of Computers, 000, 3(6): 615-619 (in Chinese with English abstract). [doi: 10.331/j.issn:054-4164.000.06.008] [38] Goodman N. Statistical analysis based on a certain multivariate complex Gaussian distribution (an introduction). The Annals of Mathematical Statistics, 1963, 34(1): 15-177.[doi: 10.114/aoms/117770450] [39] Brown LM, Senior AW, Tian YL, Connell J, Hampapur A. Performance evaluation of surveillance systems under varying conditions. In: Proc. of the IEEE International Workshop on Performance Evaluation of Tracking and Surveillance, Colorado, USA, 005, 1-8.[doi: 10.1.1.83.9549] [40] Grabner H, Roth PM, Bischof H. Is pedestrian detection really a hard task. In: Proc. of the 10th IEEE International Workshop on Performance Evaluation of Tracking and Surveillance, Rio de Janeiro, 007.1-8.[doi: 10.1.1.144.9468] 附 中 文 参 考 文 献 : [13] 闫 小 喜, 韩 崇 昭. 基 于 杂 波 强 度 在 线 估 计 的 多 目 标 跟 踪 算 法. 控 制 与 决 策,01,7(4):507-51. [doi: 10.13195/j.cd. 01.04.9. yanxx.013] [30] 吕 学 斌, 周 群 彪, 陈 正 茂, 熊 运 余, 蔡 葵. 高 斯 混 合 概 率 假 设 密 度 滤 波 器 在 多 目 标 跟 踪 中 的 应 用. 计 算 机 学 报,01, 35():397-403. [doi: 10.374/sP.J.1016.01.00397]
6 Journal of Software 软 件 学 报 [34] 胡 德 昆. 基 于 生 物 视 觉 感 知 机 制 的 图 像 理 解 技 术 研 究 [ 博 士 学 位 论 文 ]. 成 都 : 电 子 科 技 大 学, 01. [36] 张 讲 社, 徐 宗 本, 阮 奕 文. 一 类 模 拟 生 物 复 眼 几 何 结 构 的 数 据 处 理 方 法 - 方 向 量 子 化 表 示 的 理 论. 计 算 机 学 报, 000, 3(6): 609-614.[doi: 10.331/j.issn:054-4164.000.06.007] [37] 张 讲 社, 徐 宗 本, 阮 奕 文. 一 类 模 拟 生 物 复 眼 几 何 结 构 的 数 据 处 理 方 法 - 方 向 量 子 化 表 示 的 应 用. 计 算 机 学 报, 000, 3(6): 615-619. [doi: 10.331/j.issn:054-4164.000.06.008]