Microsoft Word - 4931.doc



Similar documents
中文模板

经 济 与 管 理 耿 庆 峰 : 我 国 创 业 板 市 场 与 中 小 板 市 场 动 态 相 关 性 实 证 研 究 基 于 方 法 比 较 视 角 87 Copula 模 型 均 能 较 好 地 刻 画 金 融 市 场 间 的 动 态 关 系, 但 Copula 模 型 效 果 要 好 于

微 分 方 程 是 经 典 数 学 的 一 个 重 要 分 支, 常 用 来 描 述 随 时 间 变 化 的 动 态 系 统, 被 广 泛 应 用 于 物 理 学 工 程 数 学 和 经 济 学 等 领 域. 实 际 上, 系 统 在 随 时 间 的 变 化 过 程 中, 经 常 会 受 到 一 些

g 100mv /g 0. 5 ~ 5kHz 1 YSV8116 DASP 1 N 2. 2 [ M] { x } + [ C] { x } + [ K]{ x } = { f t } 1 M C K 3 M C K f t x t 1 [ H( ω )] = - ω 2

% GIS / / Fig. 1 Characteristics of flood disaster variation in suburbs of Shang

(Pattern Recognition) 1 1. CCD

標準 BIG 中文字型碼表 A 0 9 B C D E F 一 乙 丁 七 乃 九 了 二 人 儿 入 八 几 刀 刁 力 匕 十 卜 又 三 下 丈 上 丫 丸 凡 久 么 也 乞 于 亡 兀 刃 勺 千 叉 口 土 士 夕 大 女 子 孑 孓 寸 小 尢 尸 山 川 工 己 已 巳 巾 干 廾

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 研 究 方 向 数 据 处 理 近 三 年 来

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

92

* CUSUM EWMA PCA TS79 A DOI /j. issn X Incipient Fault Detection in Papermaking Wa

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

240 生 异 性 相 吸 的 异 性 效 应 [6] 虽 然, 心 理 学 基 础 研 [7-8] 究 已 经 证 实 存 在 异 性 相 吸 异 性 相 吸 是 否 存 在 于 名 字 认 知 识 别 尚 无 报 道 本 实 验 选 取 不 同 性 别 的 名 字 作 为 刺 激 材 料, 通

标题

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 5 Oct /35 TU3521 P315.

08陈会广

~ ~

[1-3] (Smile) [4] 808 nm (CW) W 1 50% 1 W 1 W Fig.1 Thermal design of semiconductor laser vertical stack ; Ansys 20 bar ; bar 2 25 Fig

具有多个输入 特别是多个输出的 部门 或 单位 ( 称为 决策单元 Decision Making Unit 简称 DMU) 间的相对有效 8 性 C2R 模型是 DEA 的个模型 也是 DEA 的基础 和重要模型 假设有 n 个决策单元 DMUj( j = n) 每个 DMU 有 m

總目186-運輸署

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

物理学报 Acta Phys. Sin. Vol. 62, No. 14 (2013) 叠 [4]. PET 设备最重要的部件就是探测器环, 探测 备重建图像具有减少数据插值的优势. 器环的性能直接影响 PET 的成像能力. 探头与探头 之间得到的符合直线叫做投影线. 所有的投影线在

untitled

标题


,,.,, : 1),,,,, 2),,,,, 3),,,,,,,,,, [6].,,, ( ),, [9], : 1), 2),,,,, 3),,, 2.,, [10].,,,,,,,,, [11]. 2.1,, [12],, ;, ; Fig. 1 1 Granular hier

Dan Buettner / /

ii

Revit Revit Revit BIM BIM 7-9 3D 1 BIM BIM 6 Revit 0 4D 1 2 Revit Revit 2. 1 Revit Revit Revit Revit 2 2 Autodesk Revit Aut

<4D F736F F D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

4 115,,. : p { ( x ( t), y ( t) ) x R m, y R n, t = 1,2,, p} (1),, x ( t), y ( t),,: F : R m R n.,m, n, u.,, Sigmoid. :,f Sigmoid,f ( x) = ^y k ( t) =

Microsoft Word - chead095.doc

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

[1] Liu Hongwei,2013, Study on Comprehensive Evaluation of Iron and Steel Enterprises Production System s Basic Capacities, International Asia Confere

km km mm km m /s hpa 500 hpa E N 41 N 37 N 121

Microsoft Word tb 赵宏宇s-高校教改纵横.doc

彩色地图中道路的识别和提取

soturon.dvi

<4D F736F F D20C9CFBAA3BFC6BCBCB4F3D1A7D0C5CFA2D1A7D4BA C4EAC7EFBCBEC8EBD1A7B2A9CABFD7CAB8F1BFBCCAD4CAB5CAA9CFB8D4F22D C8B7B6A8B8E5>

Microsoft Word - A doc

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

Fig. 1 Frame calculation model 1 mm Table 1 Joints displacement mm

SWAN min TITAN Thunder Identification Tracking Analysis SWAN TITAN and Nowcasting 19 TREC Tracking Radar Echo by Correlaction T

11 25 stable state. These conclusions were basically consistent with the analysis results of the multi - stage landslide in loess area with the Monte

Microsoft Word - 专论综述1.doc

标题

Microsoft Word 記錄附件

附3

Microsoft Word - A _ doc

y 1 = 槡 P 1 1h T 1 1f 1 s 1 + 槡 P 1 2g T 1 2 interference 2f 2 s y 2 = 槡 P 2 2h T 2 2f 2 s 2 + 槡 P 2 1g T 2 1 interference 1f 1 s + n n

優 秀 的 構 圖 設 計 可 以 引 起 眾 的 注 意, 書 籍 封 面 的 構 圖 影 響 消 費 者 的 購 買 意 願 海 報 設 計 的 構 圖 影 響 的 傳 達 效 益 照 片 的 構 圖 影 響 美 感 的 表 現 與 傳 遞 經 典 名 作 在 構 圖 上 皆 有 細 膩 的 安

普通高等学校本科专业设置管理规定

T R 1 t z v 4z 2 + x 2 t = 2 槡 v t z 200 m/s x v ~

标题

[29] a N d N b 2 d sin θ N b ФФ a b Ф Ф θ θ a b Fig.1 Working principle demonstration of a phased-array antenna θ

doc

Microsoft Word - p11.doc

幻灯片 1

Microsoft Word - 33-p skyd8.doc

Microsoft Word - 01李惠玲ok.doc

一次辽宁暴雨过程的诊断及风场反演分析

Transcription:

软 件 学 报 doi: 10.1338/j.cnki.jos.004931 视 觉 量 子 目 标 跟 踪 方 法 研 究 姜 文 涛 1+, 刘 万 军 1, 袁 姮, 张 海 涛 1 1 ( 辽 宁 工 程 技 术 大 学 软 件 学 院, 辽 宁 葫 芦 岛 15105) ( 辽 宁 工 程 技 术 大 学 研 究 生 院, 辽 宁 葫 芦 岛 15105) Object Tracking Method Based on Vision Quantum * JIANG Wen-Tao 1+, LIU Wan-Jun 1, YUAN Heng, ZHANG Hai-Tao 1 1 (Department of Software, Liaoning Technical University, Huludao 15105, China) (Department of Postgraduate, Liaoning Technical University, Huludao 15105, China) + Corresponding author: Phn +86-049-5310858, Fax +86-049-5310858, E-mail: lntuwulue@163.com, http://www.lntu.edu.cn Abstract: A novel approach to object tracking based on the vision quantum is proposed in this paper in order to solve the high lost-tracking rate in variable structure object tracking. Firstly, the gray information is detected in the image from top to bottom with vision quantum, and the distribution area and gray levels of larger probability density are counted in the vision quantum. Then all the energy frequency of the visual quantum are calculated, of which the weaker energy frequency gradient is removal by filtration and the stronger frequency gradient of vision quantum that the distribution of high frequency information account for half quantum area is reserved. The quantum cluster is composed of vision quantum with the same frequency variation. Finally, we take quantum cluster as candidate object information, the state of moving object is predicted with maximum likelihood estimation and we take the forecast results as moving reference position of vision quantum in the next frame. And a further verification of the visual quantum balance state is made to ensure the effectiveness of object tracking. This method catches the point that the variable structure moving object has the feature of the energy frequency step invariance at the juncture pixels of the foreground and background. It can overcome the shape changing, scale changing and other factors on the influence of the moving object tracking effectively with lower lost-tracking rate and lower computational complexity by using independent and continuous visual quantum to describe the step invariant feature. Experiments show that the proposed approach has good adaptability to variable structure tracking with real-time and robust tracking performance. Key words: vision quantum; frequency step; quantum balance; quantum cluster; object tracking 摘 要 : 为 了 解 决 变 结 构 目 标 跟 踪 过 程 中 目 标 失 跟 率 较 高 的 问 题, 提 出 了 一 种 新 的 基 于 视 觉 量 子 (Vision Quantum, VQ) 的 目 标 跟 踪 方 法. 该 方 法 首 先 在 图 像 内 自 上 而 下 辐 射 视 觉 量 子 采 集 灰 度 信 息, 统 计 量 子 内 部 概 率 Supported by the National Natural Science Foundation of China under Grant No.6117144 ( 国 家 自 然 科 学 基 金 ); the National High-Tech Research and Development Plan of China under Grant Nos.13-05 ( 国 家 高 技 术 研 究 发 展 计 划 子 课 题 (863)); the Science and Technology Foundation of Liaoning Province of China under Grant No. 011606 ( 辽 宁 省 科 技 攻 关 计 划 项 目 ) 收 稿 时 间 : 014-04-7; 修 改 时 间 : 015-06-4, 015-06-30; 采 用 时 间 : 015-10-09; jos 在 线 出 版 时 间 : 015-11-15 CNKI 网 络 优 先 出 版 : 015-11-16 09::3, http://www.cnki.net/kcms/detail/11.560.tp.0151116.09.004.html

Journal of Software 软 件 学 报 密 度 较 大 的 灰 度 级 和 分 布 区 域. 然 后 计 算 视 觉 量 子 的 量 子 频 率, 归 一 化 量 子 频 率 系 数, 滤 除 系 统 噪 音 和 杂 波 干 扰, 利 用 频 率 阶 跃 不 变 性 移 动 视 觉 量 子 至 平 衡 状 态, 将 达 到 量 子 平 衡 状 态 的 视 觉 量 子 组 成 量 子 簇. 最 后 以 该 量 子 簇 作 为 候 选 目 标 信 息, 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 以 预 测 结 果 作 为 下 一 帧 图 像 中 视 觉 量 子 移 动 的 参 考 值, 并 进 一 步 验 证 移 动 后 的 视 觉 量 子 是 否 达 到 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 该 方 法 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 量 子 频 率 阶 跃 不 变 性 的 特 点, 继 而 将 阶 跃 不 变 特 征 采 用 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低. 同 时 由 于 视 觉 量 子 数 据 量 较 小, 计 算 复 杂 度 低, 其 跟 踪 实 时 性 较 高. 大 量 实 验 测 试 表 明, 该 方 法 对 变 结 构 目 标 跟 踪 具 有 很 好 的 适 应 性 实 时 性 和 鲁 棒 性. 关 键 词 : 视 觉 量 子 ; 频 率 阶 跃 ; 量 子 平 衡 ; 量 子 簇 ; 目 标 跟 踪 中 图 法 分 类 号 : TP391 文 献 标 识 码 : A 1 引 言 运 动 目 标 跟 踪 MOT(Moving Object Tracking) 作 为 目 前 国 内 外 计 算 机 视 觉 领 域 的 研 究 热 点 之 一 [1-], 经 过 50 余 年 的 研 究 发 展, 已 经 取 得 了 较 大 的 成 绩. 它 是 一 种 利 用 计 算 机 与 摄 像 机 模 仿 生 物 视 觉 系 统 对 感 兴 趣 目 标 进 行 分 析 识 别 跟 踪 及 测 量 的 技 术, 具 有 无 接 触 隐 蔽 性 强 精 准 性 高 的 技 术 优 点 [3-7]. 目 标 跟 踪 应 用 广 泛, 在 仿 生 机 器 人 无 人 驾 驶 汽 车 智 能 视 频 监 控 等 自 动 感 知 领 域 具 有 重 要 的 研 究 和 应 用 价 值. 目 前, 目 标 跟 踪 技 术 的 研 究 主 要 有 两 大 方 向, 一 种 是 建 立 在 运 动 信 息 分 析 基 础 之 上 的 跟 踪 方 法, 另 一 种 是 基 于 模 型 分 析 的 目 标 跟 踪 方 法. 利 用 运 动 信 息 分 析 的 目 标 跟 踪 方 法 研 究 较 多, 已 形 成 了 众 多 的 算 法 和 标 准. 例 如,Huttenlocher 首 先 利 用 Hausdorff 距 离 的 定 义 与 计 算 方 法 进 行 序 列 图 像 间 的 去 相 关, 然 后 对 残 余 误 差 图 像 采 用 空 间 去 相 关 实 现 了 物 体 的 跟 踪 算 法 [8-9] ; 在 Huttenlocher 的 基 础 上,Haritaoglu 通 过 建 立 双 峰 分 布 的 统 计 背 景 模 型 来 实 现 目 标 检 测, 并 为 目 标 建 立 外 观 模 型, 取 得 更 好 的 效 果 [10] ; 在 进 行 空 间 域 上 去 相 关 的 基 础 上,Stauffer 提 出 了 自 适 应 混 合 高 斯 模 型, 建 立 运 动 目 标 与 前 景 目 标 间 的 对 应 关 系 来 实 现 对 目 标 的 跟 踪 [11] ; 在 自 适 应 模 型 的 基 础 上,Rezaeian 利 用 观 测 模 型 联 合 收 敛 (COMJ) 技 术 对 目 标 进 行 检 测, 然 后 应 用 序 贯 蒙 特 卡 罗 方 法 (SMC) 对 目 标 进 行 拓 展 跟 踪, 获 得 了 较 好 的 效 果 [1] ; 目 标 跟 踪 方 法 也 不 仅 仅 限 于 空 间 域 上 的 去 相 关 方 法, 国 内 的 闫 小 喜 和 韩 崇 昭 提 出 了 基 于 杂 波 强 度 在 线 估 计 的 目 标 跟 踪 方 法 [13] ;Juan 和 Raul 等 人 提 出 了 基 于 视 频 对 象 运 动 的 模 糊 推 理 方 法, 取 得 了 较 好 的 跟 踪 效 果, 但 存 在 目 标 分 割 完 整 性 欠 缺 的 问 题 [14] ; 而 Airouche 和 Bentabet 等 人 对 此 进 行 了 改 进, 采 用 运 动 区 域 增 长 和 先 验 知 识 结 合 的 方 法 使 视 频 对 象 的 提 取 较 为 精 确, 并 具 有 较 好 的 鲁 棒 性 能 [15]. 基 于 运 动 分 析 的 目 标 跟 踪 方 法, 原 理 简 单, 实 现 较 为 方 便, 但 是 对 于 相 似 运 动 目 标 难 以 进 行 区 分, 容 易 粘 连 和 失 跟. 另 一 种 基 于 模 型 的 目 标 跟 踪 方 法 可 以 克 服 相 似 运 动 信 息 的 干 扰. 近 年 来, 基 于 模 型 的 目 标 域 密 度 估 计 方 法 (Mean Shift) 成 为 研 究 的 热 点 [16-1], 目 标 域 密 度 估 计 是 由 Fukunaga 和 Hostetler 在 1975 年 提 出 的 一 种 无 监 督 聚 类 方 法, 它 使 每 一 个 点 漂 移 到 密 度 函 数 的 局 部 极 大 值 点 ;Comaniciu 首 先 将 mean shift 算 法 应 用 到 目 标 跟 踪 领 域 中 来, 他 利 用 Bhattacharyya 系 数 作 为 目 标 模 型 域 候 选 目 标 之 间 的 相 似 性 度 量 标 准, 用 mean shift 算 法 来 搜 索 最 优 候 选 目 标, 获 得 了 很 好 的 跟 踪 效 果 [-3], 但 不 足 之 处 是 计 算 量 较 大, 影 响 了 跟 踪 的 准 确 性 和 实 时 性 ; 为 了 克 服 特 征 信 息 不 足 造 成 的 偏 差,Yang 等 人 提 出 了 空 域 特 征 中 的 相 似 性 度 量 方 法, 允 许 mean shift 跟 踪 更 一 般 的 运 动 目 标 [4], 但 是 对 于 相 似 目 标 的 衔 接 不 能 进 行 有 效 判 别 ; 在 此 基 础 上,Jeong 提 出 了 一 个 鲁 棒 的 实 时 的 高 斯 圆 柱 模 型, 通 过 mean shift 实 现 目 标 跟 踪 以 解 决 不 规 则 光 照 变 化 下 目 标 衔 接 带 来 的 影 响 [5], 但 是 没 有 解 决 形 状 变 化 导 致 的 误 跟 问 题. 高 斯 模 型 的 不 足 是 基 函 数 需 要 计 算 与 原 始 数 据 相 关 的 协 方 差 矩 阵 和 特 征 矢 量, 这 些 计 算 在 应 用 中 通 常 是 较 难 实 现 的. 因 此 人 们 往 往 利 用 目 标 参 数 分 布 模 型 来 代 替 高 斯 模 型 变 换 的 去 相 关, 例 如,Davy 和 Tourneret 通 过 在 高 斯 混 合 模 型 中 引 入 先 验 参 数 的 分 布 模 型, 采 用 混 合 监 督 对 目 标 进 行 分 类, 可 以 同 时 跟 踪 多 种 运 动 目 标, 对 于 一 定 角 度 内 的 外 观 形 变 具 有 鲁 棒 性 [6], 但 稳 定 性 较 低, 容 易 漂 移 ; 为 了 提 高 目 标 检 测 与 跟 踪 的 稳

作 者 名 等 : 题 目 3 定 性,Liam 等 人 提 出 线 性 回 归 和 自 适 应 快 速 同 步 建 模 方 法, 通 过 自 适 应 运 动 目 标 的 外 观 模 型 进 行 目 标 更 新, 增 强 目 标 跟 踪 的 稳 定 性 [7] ;YingLi 和 Andrew 等 人 提 出 对 背 景 变 化 的 运 动 目 标 前 景 信 息 进 行 混 合 高 斯 处 理 [8], 将 多 种 纹 理 直 方 图 和 颜 色 直 方 图 建 立 目 标 运 动 模 型, 选 择 近 似 模 型 进 行 视 频 目 标 跟 踪, 取 得 较 好 跟 踪 效 果 ; 另 外, 不 同 的 图 像 特 征 描 述 方 法 适 合 于 不 同 的 场 合, 因 此 根 据 场 景 来 自 适 应 选 择 特 征 描 述 方 法 是 非 常 重 要 的 研 究 内 容, 例 如 Yi 和 Jongwoo 研 究 了 目 标 跟 踪 中 适 合 于 场 景 变 化 的 在 线 特 征 选 择 机 制, 以 提 高 跟 踪 性 能 [9]. 其 次, 在 目 标 跟 踪 中 引 入 随 机 有 限 集 的 目 标 模 型 是 一 种 行 之 有 效 的 方 法, 对 目 标 模 型 进 行 学 习 后 确 定 相 应 特 征 和 参 数, 可 提 高 对 周 围 杂 波 环 境 的 适 应 性, 例 如 吕 学 斌 等 人 通 过 引 入 概 率 密 度 滤 波 器, 建 立 判 决 门 限 的 跟 踪 策 略, 以 此 提 高 对 周 围 杂 波 环 境 的 适 应 性 [30]. 基 于 模 型 更 新 的 目 标 跟 踪 方 法 是 计 算 机 视 觉 领 域 内 的 主 流 方 法, 例 如 Zdenek Kalal 的 TLD 方 法 [31] Rui Yao 的 OLSL 方 法 [3] Junseok Kwon 的 WLMC 方 法 [33], 对 相 似 运 动 信 息 和 低 速 变 结 构 运 动 具 有 较 强 的 抗 干 扰 性, 可 以 较 好 的 跟 踪 运 动 目 标, 但 是 在 目 标 发 生 快 速 变 结 构 运 动, 例 如 目 标 快 速 旋 转 导 致 目 标 形 状 和 尺 度 变 化 幅 度 较 大 时, 却 不 能 进 行 长 时 间 的 有 效 跟 踪, 容 易 发 生 漂 移 和 误 跟. 与 生 物 的 视 觉 系 统 相 比, 现 有 目 标 跟 踪 方 法 的 普 遍 弱 点 是 缺 乏 与 感 兴 趣 目 标 及 其 周 围 环 境 同 步 调 节 的 能 力, 而 生 物 的 视 觉 系 统 可 以 自 然 的 感 知 目 标 和 环 境 的 变 化, 做 到 协 同 调 节, 以 形 成 对 感 兴 趣 目 标 的 最 大 关 注 度. 蝇 眼 是 一 种 复 眼 结 构, 由 多 个 六 边 形 结 构 的 小 眼 睛 拼 成, 每 个 小 眼 睛 都 可 以 独 立 成 像, 协 同 工 作, 最 后 形 成 一 个 影 像, 而 人 眼 内 部 也 是 由 多 个 分 布 密 集 的 感 光 神 经 单 元 组 成, 由 多 个 感 光 单 元 协 同 完 成 目 标 成 像, 生 物 视 觉 单 元 如 图 1 所 示. 这 种 生 物 视 觉 系 统 可 以 同 时 抓 住 目 标 多 个 局 部 边 缘 信 息 的 变 化, 因 此 对 目 标 整 体 形 状 和 尺 度 的 变 化 感 知 十 分 灵 敏, 对 其 变 化 的 幅 度 也 具 有 很 好 的 鲁 棒 性 [34-35]. Fig.1 Biological "visual unit" photosensitive diagram 图 1 生 物 视 觉 单 元 感 光 示 意 图 [36-37] 在 生 物 视 觉 系 统 的 启 发 下, 张 讲 社 等 人 模 拟 生 物 复 眼 结 构, 提 出 一 种 基 于 方 向 量 子 化 表 示 理 论 的 并 行 数 据 处 理 方 法, 利 用 最 小 矢 量 集 合 模 拟 生 物 视 觉 单 元, 在 机 器 人 运 动 控 制 和 自 适 应 图 像 处 理 领 域 取 得 了 较 好 的 应 用 效 果. 在 计 算 机 视 觉 领 域 中, 如 果 现 有 的 目 标 跟 踪 方 法 具 有 生 物 视 觉 系 统 的 这 种 多 个 视 觉 单 元 的 协 同 工 作 能 力, 将 对 目 标 跟 踪 效 果 的 提 升 起 到 不 可 限 量 的 作 用. 基 于 此, 本 文 在 生 物 视 觉 单 元 协 同 工 作 的 方 向 上, 提 出 了 一 种 视 觉 量 子 (Vision Quantum, VQ) 的 概 念, 并 应 用 到 目 标 跟 踪 中. 视 觉 量 子 目 标 跟 踪 方 法 是 建 立 在 目 标 子 空 间 协 同 分 析 的 整 体 框 架 之 上, 利 用 辐 射 视 觉 量 子 采 集 灰 度 信 息, 计 算 能 量 频 率, 保 留 达 到 量 子 平 衡 的 视 觉 量 子, 将 频 率 变 化 幅 度 相 同 的 视 觉 量 子 组 成 量 子 簇, 以 该 量 子 簇 作 为 候 选 目 标 信 息, 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 重 复 验 证 移 动 后 的 视 觉 量 子 是 否 达 到 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 与 现 有 目 标 跟 踪 方 法 相 比, 该 方 法 的 优 势 在 于 :(1) 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 能 量 频 率 阶 跃 不 变 性 的 特 点 ;() 将 阶 跃 不 变 特 征 采 用 多 个 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低 ;(3) 视 觉 量 子 数 据 量 较 小, 同 时 不 需 要 存 储 目 标 多 种 姿 态 模 型, 计 算 复 杂 度 和 空 间 复 杂 度 低, 跟 踪 实 时 性 较 高. 视 觉 量 子 对 非 连 续 的 刚 性 突 变 运 动 不 具 有 跟 踪 意 义, 作 为 视 觉 量 子 实 现 长 时 间 稳 定 跟 踪 的 基 础, 目 标 运 动 轨 迹 及 其 频 域 变 换 必 须 具 有 连 续 的 光 滑 特 性, 才 能 确 保 对 频 率 阶 跃 计 算 的 有 效 性, 达 到 量 子 反 复 平 衡, 实 现 对 目 标 的 稳 定 跟 踪, 因 此, 本 文 首 先 给 出 了 目 标 运 动 可 微 分 定 理 及 其 证 明 过 程, 在 此 基 础 上 提 出 了 视 觉 量 子 理 论 模 型

4 Journal of Software 软 件 学 报 及 其 相 关 概 念 的 定 义, 然 后 阐 述 了 该 方 法 的 基 本 实 现 流 程, 并 给 出 了 变 结 构 运 动 目 标 视 觉 量 子 跟 踪 效 果, 最 后 在 多 个 变 结 构 目 标 运 动 视 频 数 据 库 中 对 本 文 VQ 方 法 TLD 方 法 [31] OLSL 方 法 [3] [33] WLMC 方 法 进 行 了 跟 踪 实 验, 并 给 出 实 验 结 果 和 对 比 分 析. 目 标 运 动 可 微 分 定 理 目 标 运 动 轨 迹 及 其 频 域 变 换 的 连 续 光 滑 特 性 如 图 所 示. 定 理 1. 目 标 运 动 过 程 中, 其 运 动 轨 迹 ϕ 在 时 域 内 是 连 续 光 滑 的, 轨 迹 记 为 ϕ = f ( xyz,, ), 则 轨 迹 ϕ 的 偏 导 数 ϕ / x ϕ / y ϕ / z 在 其 定 义 域 内 是 连 续 的, 即 轨 迹 ϕ 是 可 微 分 的. 证 明 : 设 点 ( x, yz, ) 为 自 变 量 定 义 域 内 任 意 一 点, 则 ( x + Δ xy, +Δ yz, +Δ z) 为 该 点 邻 域 内 任 意 一 点, 由 数 学 理 论 知, 轨 迹 全 增 量 Δ ϕ 为 : Δ ϕ = f( x+δ xy, +Δ yz, +Δz) f( xyz,, ) t t = [ f ( x+δ x, y+δ y, z+δz) f ( x, y+δ y, z+δz)] t t +[ f ( x, y+δ y, z+δz) f ( x, y, z+δz)] t t + [ f ( x, y, z+δz) f ( x, y, z)] t t 当 Δx 0, Δy 0, Δz 0 时, 轨 迹 全 增 量 Δ ϕ 可 以 表 示 为 : ' ' ' Δ ϕ = fx( xyz,, ) Δ x+ fy( xyz,, ) Δ y+ fz( xyz,, ) Δ z+ σ1δ x+ σδ y+ σ3δ z 其 中, σ 1 σ σ 3 分 别 为 ( Δx, Δy, Δ z) ( Δy, Δ z) ( Δ z) 的 函 数, 且 当 Δx 0 Δy 0 Δz 0 时, σ1 0 σ 0 σ 3 0, 此 时, 全 增 量 Δ ϕ 逐 渐 趋 于 0, 即 ϕ = ft ( xyz,, ) 在 任 意 点 ( x, yz, ) 可 微 分, 证 毕. π juxl ( / + vym / + rzn / ) 定 理 目 标 运 动 轨 迹 ϕ 的 傅 里 叶 变 换 Ft( u, v, r) = ft( x, y, z) e dxdydz 在 时 域 内 是 连 续 光 滑 的, 则 函 数 Ft ( uvr,, ) 的 偏 导 数 Ft / u Ft / v Ft / r 在 其 定 义 域 内 是 连 续 的, 即 函 数 Ft ( uvr,, ) 是 可 微 分 的. 证 明 : 设 点 ( uvr,, ) 为 自 变 量 定 义 域 内 任 意 一 点, 则 ( u+ Δ u, v+δ v, r+δ r) 为 该 点 邻 域 内 任 意 一 点, 由 数 学 分 析 理 论 可 知, 函 数 全 增 量 为 : ' ' ' Δ F = F ( u, v, r) Δ u+ F ( u, v, r) Δ v+ F ( u, v, r) Δ r + φ 其 中 : 由 柯 西 不 等 式 : 由 于 指 数 函 数 e π 且 ( φ ) 0 Δ u +Δ v +Δr j( ux/ l + vy / m + rz / n) t u v r φ = [ F ' ( u+ αδ u, v+δ v, r+δr) F ' ( u, v, r)] Δu u u + [ F ' ( u+δ u, v+ βδ v, r+δr) F ' ( u, v, r)] Δv v v + [ F ' ( u+δ uv, +Δ vr, + γδr) F ' ( uvr,, )] Δr r r φ [( F ' ( u+ αδ u, v+δ v, r+δr) F ' ( u, v, r)) u u ' ' + ( F( u+δ uv, + βδ vr, +Δr) F( uvr,, )) v v ' ' 1/ + ( F( u+δ uv, +Δ vr, + γδr) F( uvr,, )) ] r r Δ u +Δ v +Δr 的 偏 导 是 连 续 的, 当 Δu 0 Δv 0 Δr 0 时, ( Δ u +Δ v +Δr ) 0,, 即 Ft ( uvr,, ) 在 任 意 点 ( uvr,, ) 可 微 分, 证 毕. t

作 者 名 等 : 题 目 5 Fig. Continuous smooth sketch map of object trajectory and its frequency domain transformation 图 目 标 运 动 轨 迹 及 其 频 域 变 换 的 连 续 光 滑 特 性 示 意 图 3 视 觉 量 子 目 标 跟 踪 方 法 为 了 清 晰 描 述 视 觉 量 子 目 标 跟 踪 方 法, 将 其 中 涉 及 到 的 一 些 定 义 和 符 号 给 出 如 表 1 所 示. Table 1 Definitions and symbols 表 1 定 义 和 符 号 符 号 定 义 符 号 定 义 符 号 定 义 VFS 视 觉 场 空 间 G(x, y) 像 素 点 的 灰 度 O (X, Y ) 边 缘 区 域 几 何 中 心 VQ(V) 视 觉 量 子 ( 视 觉 采 样 单 元 ) S 视 觉 量 子 几 何 面 积 δ 移 动 向 量 EE 熵 能 量 γ 单 位 灰 度 能 量 QC 量 子 簇 ζ 信 息 熵 P 量 子 频 率 α kl 复 高 斯 随 机 变 量 A 信 息 熵 极 大 值 的 灰 度 阶 R(x, y) 目 标 边 缘 区 域 CN 复 高 斯 分 布 ρ 灰 度 阶 的 概 率 QB 量 子 平 衡 Sta 目 标 状 态 E 灰 度 能 量 o(x, Y) 视 觉 量 子 几 何 中 心 FER 预 测 错 误 率 3.1 基 本 定 义 定 义 1( 视 觉 场 空 间 ). 由 α β 个 视 觉 采 样 单 元 组 成 的 二 维 图 像 感 光 空 间 定 义 为 视 觉 场 空 间 (Visual Field Space, VFS), 记 为 : V1,1 V1, V1, β V =,1 V, V VFS, β t (1) Vα,1 Vα, V α, β 其 中, VFS 为 视 觉 场 空 间, t 为 时 间, V α, β 为 视 觉 场 空 间 的 视 觉 采 样 单 元,1 α < +,1 β < +. 视 觉 场 空 间 模 型 如 图 3 所 示. 本 文 提 出 的 视 觉 场 空 间 与 计 算 摄 像 学 领 域 中 的 视 觉 场 不 同, 本 文 视 觉 场 空 间 是 利 用 多 个 视 觉

6 Journal of Software 软 件 学 报 采 样 单 元 对 运 动 目 标 空 间 信 息 进 行 分 类 和 建 模, 主 要 包 括 目 标 外 部 的 背 景 视 觉 单 元 目 标 边 缘 处 的 边 缘 视 觉 单 元 以 及 目 标 内 部 的 前 景 视 觉 单 元 三 个 类 别, 而 计 算 摄 像 学 领 域 的 视 觉 场 概 念 不 具 有 这 种 分 类 和 建 模 特 点. Fig.3 The visual field space model (object external black circle is the background sample unit, the red circle of the target edge is the edge sampling unit including the background and foreground information, and the yellow circle is the foreground sampling unit) 图 3 视 觉 场 空 间 模 型 ( 目 标 外 部 黑 色 圆 为 背 景 采 样 单 元, 目 标 边 缘 处 红 色 圆 为 包 含 背 景 与 前 景 信 息 的 边 缘 采 样 单 元, 目 标 内 部 黄 色 圆 为 前 景 采 样 单 元 ) 定 义 ( 视 觉 量 子 ). 视 觉 场 空 间 中 包 含 目 标 背 景 信 息 前 景 信 息 和 背 景 与 前 景 交 界 处 信 息 的 视 觉 采 样 单 元 定 义 为 视 觉 量 子 (Vision Quantum, VQ), 记 为 : VQαβ, ( X, Y, D, P, T ) () 其 中, X Y 为 视 觉 量 子 的 几 何 中 心 坐 标, D 为 视 觉 量 子 的 直 径, P 为 视 觉 量 子 的 量 子 频 率 ( 详 见 定 义 4), T 为 时 间, 下 标 α β 表 示 视 觉 量 子 在 视 觉 场 空 间 中 的 矩 阵 位 置 是 α 行 β 列. 本 文 提 出 的 视 觉 量 子 与 量 子 力 学 中 量 子 不 同, 本 文 视 觉 量 子 是 模 仿 生 物 视 觉 系 统 的 视 觉 单 元 进 行 计 算 机 视 觉 研 究 的 图 像 信 息 的 最 小 载 体, 而 量 子 力 学 中 的 量 子 是 物 理 学 领 域 中 研 究 微 观 粒 子 能 量 变 化 的 最 小 单 位 和 能 量 载 体. 根 据 视 觉 量 子 包 含 信 息 的 不 同, 将 视 觉 量 子 分 为 三 类, 分 别 为 包 含 目 标 背 景 信 息 的 背 景 视 觉 量 子, 包 含 目 标 前 景 信 息 的 前 景 视 觉 量 子, 包 含 目 标 背 景 与 前 景 边 界 信 息 的 边 缘 视 觉 量 子, 分 别 如 图 4 图 5 图 6 所 示. Fig.4 Background visual quantum 图 4 背 景 视 觉 量 子

作 者 名 等 : 题 目 7 Fig.5 Foreground visual quantum 图 5 前 景 视 觉 量 子 Fig.6 Edge visual quantum 图 6 边 缘 视 觉 量 子 由 图 4 和 图 5 可 知, 背 景 视 觉 量 子 内 部 的 背 景 信 息 和 前 景 视 觉 量 子 内 部 的 前 景 信 息 分 布 较 为 均 匀, 对 于 变 结 构 运 动 目 标 不 具 有 跟 踪 意 义, 由 图 6 知, 边 缘 视 觉 量 子 既 包 含 了 目 标 前 景 信 息, 又 包 含 了 目 标 背 景 信 息, 对 于 变 结 构 运 动 目 标 具 有 较 好 的 跟 踪 意 义, 但 是 背 景 与 前 景 交 界 处 信 息 分 布 较 为 模 糊, 难 以 准 确 区 分, 由 于 信 息 熵 可 以 有 效 的 计 算 图 像 信 息 的 分 布 情 况, 而 灰 度 的 能 量 可 以 有 效 的 增 强 相 似 灰 度 信 息 的 差 别, 因 此 为 有 效 提 取 和 判 别 视 觉 量 子 内 部 信 息 的 类 别 和 分 布 情 况, 提 出 熵 能 量 的 概 念. F 定 义 3( 熵 能 量 ). 在 视 觉 场 空 间 中, 对 VQαβ, VFS, 存 在 VQ α, β 的 前 景 信 息 熵 ζ 的 概 率 分 布 和 背 景 信 息 熵 B ζ 的 概 率 分 布, 将 信 息 熵 与 单 位 灰 度 能 量 的 乘 积 定 义 为 VQ α, β 的 熵 能 量 (Entropy Energy, EE), 记 为 : στ BF BF αβ, = γ( αβ,, αβ, ) ( ζκλ ) κ= 1 λ= 1 EE E S (3) 其 中, B F 指 背 景 B 或 前 景 F, κ λ 指 κ 或 λ, 下 标 α β 表 示 视 觉 量 子 VQ α, β 在 视 觉 场 空 间 中 的 矩 阵 位 置 BF BF 是 α 行 β 列, 信 息 熵 ζ = A ρ log ρ, κλ κλ κλ F A 为 VQ α, β 内 前 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶, B A 为 B F VQ α, β 内 背 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶, ρ κ 为 A 出 现 的 概 率, ρ λ 为 A 出 现 的 概 率, σ τ 为 VQ α, β B B B B F F F F 内 背 景 信 息 熵 与 前 景 信 息 熵 的 数 量, ζκ [ ζ1, ζ, ζσ ], ζλ [ ζ1, ζ, ζτ ], E α, β 为 灰 度 能 量 信 息, Eαβ, = Gxy (, ), Gxy (, ) 为 视 觉 量 子 内 部 像 素 点 ( x, y ) 的 灰 度 值, S α, β 为 VQ α, β 的 几 何 面 积, S αβ, = π D /4, 则 Eαβ, Gxy (, ) VQ α, β 的 单 位 灰 度 能 量 为 γ ( Eαβ,, Sαβ, ) = =. S π D /4 αβ, 熵 能 量 函 数 波 形 图 如 图 7 所 示, 图 中 纵 坐 标 为 熵 能 量, 横 坐 标 为 熵 的 数 量, 函 数 振 幅 表 明 视 觉 量 子 中 边 缘 信 息 变 化 的 剧 烈 程 度, 其 中 1(5,9) 表 示 图 3 中 第 1 幅 图 像 的 第 5 行 第 9 列 视 觉 量 子 的 熵 能 量 波 形 图,(1,11) 表 示 图 3 中 第 幅 图 像 的 第 1 行 第 11 列 视 觉 量 子 的 熵 能 量 波 形 图,4(16,6) 表 示 图 3 中 第 4 幅 图 像 的 第 16 行 第 6 列 视 觉 量 子 的 熵 能 量 波 形 图,5(1,7) 表 示 图 3 中 第 5 幅 图 像 的 第 1 行 第 7 列 视 觉 量 子 的 熵 能 量 波 形 图.

8 Journal of Software 软 件 学 报 Fig.7 Entropy energy waveform 图 7 熵 能 量 波 形 图 B F 熵 能 量 可 以 有 效 提 取 和 判 别 视 觉 量 子 内 部 信 息 的 类 别 及 其 分 布 情 况, 但 由 于 信 息 熵 ζ 的 概 率 分 布 集 合 B F B F 中 存 在 多 个 概 率 值, 熵 能 量 EE 的 函 数 波 形 走 向 呈 不 规 则 曲 线 状 态, 因 此, 对 熵 能 量 EE 进 行 二 维 核 变 换, 然 后 进 行 滤 波 处 理, 提 取 视 觉 量 子 VQ 内 背 景 和 前 景 的 频 率 信 息. B F 定 义 4( 量 子 频 率 ). 对 熵 能 量 EE 的 二 维 核 变 换 定 义 为 VQ 的 量 子 频 率 (Quantum Frequency, QF), 记 为 : BF κ λ t BF j π( ux/ κ+ vy/ λ) t P ( u, v, t) = EE e dxdydt 0 0 (4) 0 化 简 得 : BF BF j πt( uλ/ κ+ vκ/ λ) j πtuλ/ κ j πtvκ/ λ P ( u, v, t) = EE κλ /4 π uvt[ e + e + e + 1] (5) B F B F j π t( uλκ / vκλ / ) 其 中, P 指 背 景 量 子 频 率 P 或 前 景 量 子 频 率 P, e + 为 二 维 变 换 j πt( uλ/ κ+ vκ/ λ) j πtuλ/ κ j πtvκ/ λ BF 核, e + e + e + 1 称 为 量 子 频 率 变 换 核 的 组 合, EE κλ /4π uvt 为 变 换 系 数. 由 图 7 可 以 看 出, 熵 能 量 是 围 绕 在 目 标 边 缘 处 的 离 散 波 动 效 应, 若 将 量 子 频 率 的 变 换 系 数 进 行 归 一 化 处 理, 可 以 有 效 滤 除 噪 音 和 杂 波 干 扰, 提 高 目 标 量 子 频 率 提 取 的 准 确 性, 归 一 化 操 作 定 义 如 下 : + BF EE κλ /4π uvt dt = 1 (6) - 目 标 运 动 过 程 中, 对 目 标 前 景 和 背 景 交 界 处 的 边 缘 视 觉 量 子 信 息 的 提 取 和 分 析 可 以 有 效 跟 踪 目 标 位 置, 因 此, 对 目 标 边 缘 信 息 的 提 取 变 得 尤 为 重 要. 由 数 学 理 论 知, 二 元 函 数 的 二 阶 偏 导 的 物 理 意 义 是 加 速 度 变 化 快 慢 的 量, 其 中 加 速 度 是 瞬 时 速 度 的 变 化 量, 而 量 子 频 率 瞬 时 变 化 的 快 慢 表 达 了 图 像 边 缘 梯 度 信 息 变 化 的 剧 烈 程 度, 因 此 可 以 通 过 计 算 局 部 量 子 频 率 的 二 阶 偏 导 来 确 定 目 标 边 缘 区 域 R ( x, y), 则 : P P P P R ( xy, ) = + + + (7) u v u v v u 由 目 标 运 动 可 微 分 定 理, 函 数 P 在 任 意 点 ( uv, ) 是 可 微 分 的, 则 有 : P = P cosθ + P sinθ (8) Τ u v 其 中, Τ 为 相 邻 极 值 间 的 向 量, 因 此 目 标 边 缘 区 域 R ( x, y) 为 : P P P P R ( xy, )= cosθ + sin θ + ( + )cosθsinθ u v u v v u (9)

作 者 名 等 : 题 目 9 令 θ 取 值 0 π /6 π /3 π / π /3 5 π /6. Τ 和 θ 如 图 8 所 示. Fig.8 Sketch map of Τ andθ 图 8 Τ 和 θ 示 意 图 对 于 快 速 变 结 构 运 动 目 标 而 言, 其 边 缘 视 觉 量 子 内 包 含 的 边 界 信 息 均 为 不 规 则 的 非 线 性 信 息, 对 统 计 相 邻 时 刻 视 觉 量 子 内 部 边 缘 信 息 的 变 化 幅 度 和 变 化 方 向 都 带 来 较 大 困 难, 因 此, 将 边 缘 视 觉 量 子 内 部 非 线 性 边 界 近 似 为 线 性 边 界 进 行 统 计 和 计 算, 可 以 克 服 不 规 则 非 线 性 边 缘 信 息 对 视 觉 量 子 分 析 的 影 响, 近 似 过 程 如 图 9 所 示. 在 近 似 状 态 下, 假 设 目 标 由 t 时 刻 运 动 到 t + 1 时 刻, 则 视 觉 量 子 采 集 的 目 标 边 缘 变 化 过 程 如 图 10 所 示, 对 应 的 量 子 频 率 变 化 过 程 如 图 11 所 示. Fig.9 The approximate representation of irregular object edge 图 9 不 规 则 目 标 边 缘 的 近 似 表 示 Fig.10 The change of object edge 图 10 目 标 边 缘 变 化 过 程 由 图 10, 视 觉 量 子 中 的 目 标 边 缘 由 t 时 刻 变 化 到 t + 1 时 刻, 即 由 虚 线 位 置 跳 变 至 实 线 位 置, 所 对 应 的 的 量 子 F F ' B B' F 频 率 跳 变 过 程 如 图 11 所 示, 即 P P 且 P P, 其 中, P P F ' B 与 P P B' 是 图 像 采 集 设 备 采 集 的 相 邻 两 F F ' 帧 图 像 的 量 子 频 率 计 算 值, 属 于 测 量 的 状 态 值, 而 实 际 上, 根 据 目 标 运 动 可 微 分 定 理, P P 的 峰 值 之 间 是 连 B B' 续 递 变 的, 同 理, P P 的 峰 值 之 间 也 是 连 续 递 变 的, 因 此 为 了 有 效 刻 画 量 子 频 率 峰 值 实 际 的 递 变 过 程, 需 要 对 目 标 前 景 与 背 景 的 量 子 频 率 峰 值 的 测 量 状 态 进 行 理 想 化, 即 将 量 子 频 率 的 跳 变 过 程 进 行 连 续 化 描 述. 量 子 频 率 峰 值 连 续 递 变 过 程 的 理 想 化 状 态 如 图 1 所 示, 其 中 左 侧 图 的 实 线 为 量 子 频 率 的 测 量 状 态, 右 侧 图 的 实 线 为 量 子 频 率 理 想 化 之 后 的 实 际 状 态.

10 Journal of Software 软 件 学 报 Fig.11 Sketch map of quantum frequency and its changing process between time t to t + 1 图 11 t 至 t + 1 时 刻 量 子 频 率 及 其 变 化 过 程 示 意 图 Fig.1 The idealized statuses in the continuous variation process of quantum frequency s peaks 图 1 量 子 频 率 峰 值 连 续 递 变 过 程 的 理 想 化 状 态 性 质 1( 阶 跃 不 变 性 ). 连 续 的 视 频 采 集 实 际 上 是 一 种 间 歇 性 的 图 像 抽 样 且 抽 样 过 程 是 均 匀 的, 根 据 目 标 运 动 可 微 分 定 理 及 图 1 可 知, 当 连 续 帧 间 的 时 间 间 隔 趋 于 零 时, 任 一 相 邻 时 刻 状 态 下 的 目 标 边 缘 视 觉 量 子 的 量 子 频 率 对 微 小 的 时 间 t 的 积 分 相 等, 将 这 种 性 质 定 义 为 量 子 频 率 的 阶 跃 不 变 性, 记 为 : t F B P P P P t Δt lim 1 (10) Δ t 0 t + 1 ' F' ' B' P P P P t+ Δ 1 t ' 其 中, P 为 t 时 刻 量 子 频 率, P 为 t+1 时 刻 量 子 频 率, Δ t 为 连 续 相 邻 两 帧 间 的 时 间 间 隔. F ' F B' B 证 明 : 当 Δt 0 时, 视 频 采 集 帧 率 FPS +, 此 时, 相 邻 时 刻 t 与 t+1 的 量 子 频 率 P P 且 P P, 证 毕. F B 由 图 11 可 知, P P P P 为 目 标 前 景 与 背 景 交 界 处 的 量 子 频 率 范 围, 在 目 标 运 动 过 程 中, 具 有 阶 跃 不 变 性, 对 于 视 觉 量 子 中 的 边 缘 信 息 的 跳 变 速 度 具 有 很 好 的 鲁 棒 性, 同 样 对 于 前 景 和 背 景 区 域 的 光 照 变 化 颜 色 变 化 以 及 目 标 遮 挡 有 很 好 的 抗 干 扰 特 点. 定 义 5( 量 子 平 衡 ). 视 觉 量 子 VQαβ, ( X, Y, D, P, T ) 沿 向 量 δ 移 动, 使 视 觉 量 子 几 何 中 心 ο ( X, Y ) 与 目 标 边 缘 区 域 几 何 中 心 ο '( X ', Y ') 重 合, 将 此 时 的 状 态 定 义 为 量 子 平 衡 (Quantum Balance, QB), 记 为 : F B QB P = P, ο( X, Y ) = ο'( X ', Y ') (11) { } F B 其 中, P 为 目 标 前 景 量 子 频 率, P 为 目 标 背 景 量 子 频 率, ο ( X, Y ) 为 视 觉 量 子 几 何 中 心 坐 标, ο '( X ', Y ') 为 目 标 边 缘 区 域 几 何 中 心 坐 标, 设 目 标 边 缘 区 域 R ( x, y) 的 像 素 点 数 量 为 n, x i y i 为 R ( x, y) 的 像 素 点 坐 标,1 i n, n n 则 有 X ' = xi n, Y' = yi n, 移 动 向 量 δ 是 以 ο ( X, Y ) 为 起 点 ο '( X ', Y ') 为 终 点 的 向 量, 即 : i= 1 i= 1 δ = οο' = ( X ' XY, ' Y) 本 文 提 出 的 量 子 平 衡 与 量 子 医 学 领 域 中 的 量 子 平 衡 不 同, 本 文 提 出 的 量 子 平 衡 是 指 视 觉 量 子 沿 向 量 移 动 后 与 目 标 边 缘 几 何 中 心 重 合 的 状 态, 而 量 子 医 学 领 域 中 的 量 子 平 衡 是 指 人 体 细 胞 内 部 电 (1)

作 者 名 等 : 题 目 11 子 运 动 由 异 常 恢 复 正 常 的 状 态. 图 10 中 t 和 t+1 时 刻 的 视 觉 量 子 达 到 量 子 平 衡 状 态 如 图 13 所 示, 图 13 中 第 二 列 t+1 时 刻 视 觉 量 子 移 动 至 量 子 平 衡 状 态 时 的 量 子 频 率 变 化 如 图 14 所 示. 由 图 13 可 见, 视 觉 量 子 经 过 移 动 达 到 量 子 平 衡 状 态 时, 可 以 对 快 速 变 结 构 目 标 运 动 的 局 部 边 缘 信 息 进 行 有 效 跟 踪, 如 果 在 视 频 序 列 初 始 化 中 选 定 待 跟 踪 的 目 标 前 景 信 息, 则 可 以 通 过 多 个 视 觉 量 子 对 目 标 准 确 定 位 和 跟 踪. Fig.13 The status of quantum balance 图 13 视 觉 量 子 平 衡 状 态 Fig.14 The quantum frequency variation in the process of an object moving to quantum balance status 图 14 量 子 平 衡 移 动 过 程 中 量 子 频 率 变 化 过 程 定 义 6( 量 子 簇 ). 将 达 到 量 子 平 衡 状 态 的 N 个 边 缘 视 觉 量 子 的 组 合 定 义 为 量 子 簇 (Quantum Cluster, QC), 记 为 : QB QB QB QB T QC () t = [ VQ (), t VQ (), t, VQ ()] t 1 QB 其 中, N 为 量 子 簇 中 边 缘 视 觉 量 子 的 数 量, N 3, QB 为 量 子 平 衡 状 态, VQ () t 为 t 时 刻 达 到 量 子 平 衡 状 态 N k

1 Journal of Software 软 件 学 报 QB QB QB 的 视 觉 量 子,3 k N, 对 于 任 意 VQ () t, 存 在 VQ () t QC () t VFS. 量 子 簇 如 图 15 所 示. k k t 3. 目 标 状 态 预 测 Fig.15 The Sketch map of a quantum cluster 图 15 量 子 簇 示 意 图 假 设 在 视 频 图 像 内 向 目 标 区 域 辐 射 M 个 视 觉 量 子 ( xk, y k), k = 1,, M, 经 移 动 达 到 量 子 平 衡 后, 得 到 N 个 候 选 的 视 觉 量 子 ( xl, y l), l = 1,, N, 则 第 k 个 视 觉 量 子 被 候 选 为 第 l 个 视 觉 量 子 的 概 率 分 布 可 以 看 做 熵 能 量 与 复 高 斯 随 机 变 量 α kl 的 乘 积, 且 有 : αkl CN(0, ε kl ) (13) 其 中, 复 高 斯 分 布 可 参 考 文 献 [38], ε kl 为 复 高 斯 随 机 变 量 与 均 值 偏 离 的 程 度, α kl 的 变 化 反 映 了 扩 大 对 目 标 区 域 辐 射 视 觉 量 子 导 致 候 选 视 觉 量 子 增 加 的 累 积 效 果. 候 选 的 视 觉 量 子 当 中 包 含 了 一 部 分 无 效 的 视 觉 量 子, 它 们 是 由 相 似 运 动 目 标 干 扰 而 形 成 量 子 平 衡 的 视 觉 量 子, 由 于 相 似 目 标 的 出 现 和 运 动 对 整 个 视 觉 场 空 间 具 有 随 机 性 和 均 匀 性, 其 概 率 密 度 满 足 正 态 的 均 匀 分 布, 将 其 对 目 标 的 作 用 看 做 一 组 复 高 斯 白 噪 声 干 扰 过 程, 则 作 为 候 选 的 视 觉 量 子 被 复 高 斯 白 噪 声 β l () t 影 响 的 概 率 分 布 为 : βl () t CN(0, φ0) (14) 其 中, φ 0 为 受 复 高 斯 白 噪 声 影 响 的 候 选 视 觉 量 子 与 均 值 的 偏 离 程 度. 假 设 候 选 视 觉 量 子 整 体 对 目 标 跟 踪 是 有 效 的, 则 可 以 设 计 似 然 函 数 以 准 确 预 测 目 标 状 态 信 息 Sta=( x, y, v ) T, 其 中 包 括 目 标 位 置 ( x, y ) 和 目 标 运 动 速 度 v, v= vx + vy. 将 候 选 视 觉 量 子 看 做 一 个 N 1 维 向 量 组 合 : VQ() t = [ VQ1(), t VQ(), t, VQ ()] T N t (15) 则 目 标 状 态 Sta 的 极 大 似 然 估 计 为 : 其 中, 有 : ϕ kl 为 VQ() t 的 信 噪 比 : M N Sta k = 1 l = 1 BF [ ϕ φ ϕ + ] Sta=argmax ( 1) VQ ( EE ( Sta)) (16) kl 0 kl kl BF BF ( ) = γ(, ) ( )( ρκλ ( ) log ρκλ ( )) EE Sta E S VQ t A Sta Sta dt (17) 若 给 定 一 组 标 准 正 交 基 { ξ1( t), ξ( t), ξk ( t)}, 则 VQ l () t 可 拓 展 为 如 下 形 式 : 其 中, kl ρκλ ε kl ϕkl = (18) φ l kl k K k = 1 0 K VQ () t = lim ξ () t (19) kl l k βkl CN(0, φ0) BF ρ εkl + φ0 * 是 第 k 个 正 交 基 函 数 的 系 数, 且 = VQ ( t) ξ ( t) dt, ()* i 为 复 共 轭 操 作. 因 此, 有 : (0) EE CN(0, κλ ) (1) 由 于 似 然 函 数 与 似 然 比 成 正 比 例 关 系, 因 此 当 目 标 图 像 中 存 在 前 景 信 息 H 1 和 噪 声 干 扰 信 息 H 0 且 k > M B F 时, 根 据 β kl 与 EE 的 概 率 分 布, VQ l 的 似 然 比 可 以 派 生 为 :

作 者 名 等 : 题 目 13 ( VQ Sta, H ) Γ( VQ Sta, H ) l 1 Γ l 1 () Γ ( VQl H0) 其 中 : Γ( VQ, 1) M l Sta H Γ( VQkl Sta, H1) Γ( VQkl H1) Γ( VQl Sta, H1) = Γ( VQ H ) Γ( VQ H ) Γ( VQ H ) l 0 k= 1 kl 0 k= M+ 1 kl 0 M φ 0 ρκλ εkl VQ kl Γ βkl = exp k= 1ρκλ εkl + φ0 φ0 ρκλ εkl + φ0 k= M+ 1Γ βkl ( ) ( ) ( ) BF M 1 ϕkl γ( ES, ) VQt ( ) A ρκλ ( Sta)log ρ ( Sta) dt κλ = exp k = 11+ ϕkl φ0( ϕkl + 1) 因 为 候 选 视 觉 量 子 之 间 是 非 相 关 的, 则 VQ() t 的 似 然 函 数 可 以 写 为 如 下 形 式 : BF N M 1 ϕkl γ( E, S) VQ( t) A ρκλ ( Sta)log ρ ( Sta) dt κλ Γ( VQ( t) Sta, H1) exp (3) l= 1k= 11 + ϕkl φ0( ϕkl + 1) Γ ( VQ Sta, H ) 取 对 数, 则 其 对 数 似 然 函 数 可 以 写 为 : 对 l 1 BF M N ϕkl γ( E, S) VQ( t) A ρκλ ( Sta)log ρ ( Sta) dt κλ ln Γ ( VQ( t) Sta, H1) = + C (4) k= 1l= 1 φ0( ϕkl + 1) 其 中,C 是 一 个 常 数, 由 于 Γ ( VQ( t) Sta, H1) 的 导 数 存 在, 令 其 导 数 为 0, 解 方 程 并 验 证 方 程 的 解 使 似 然 函 数 ln Γ ( VQ( t) Sta, H1) 达 到 最 大 值, 因 为 计 算 过 程 对 于 任 何 观 测 样 本 值 都 成 立, 因 此 可 以 代 入 样 本 值 便 会 得 到 目 标 状 态 预 测 信 息 Sta=( x, y, v ) T 的 极 大 似 然 估 计 值. 3.3 算 法 步 骤 视 觉 量 子 跟 踪 方 法 步 骤 描 述 如 下 : 1 目 标 初 始 化. 在 待 跟 踪 目 标 图 像 中 选 定 目 标 大 致 的 前 景 范 围 和 背 景 范 围, 统 计 前 景 区 域 与 背 景 区 域 的 观 测 值. 如 图 16 所 示. Fig.16 Object initialization (yellow line indicates foreground, blue line indicates background) 图 16 目 标 初 始 化 ( 黄 色 线 为 前 景 区 域, 蓝 色 线 为 背 景 区 域 ) 量 子 频 率 计 算.(1) 在 目 标 初 始 化 区 域 内 自 上 而 下 辐 射 视 觉 量 子 VQ α, β, 形 成 视 觉 场 空 间 VFS ;() 计 算 并 统 F 计 视 觉 量 子 内 前 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 灰 度 阶 A 以 及 背 景 信 息 熵 分 布 的 极 大 值 所 对 应 的 的 灰 度 阶 B BF BF A ;(3) 以 观 测 值 统 计 A 的 分 布 概 率 ρ κλ, 计 算 VQ 的 熵 能 量 EE ( 见 式 (3));(4) 计 算 VQ 的 量 子 频 率 QF, 将 量 子 频 率 系 数 归 一 化, 滤 除 系 统 噪 音 和 杂 波 干 扰 ( 见 式 (5)(6)). 3 量 子 平 衡 跟 踪.(1) 计 算 量 子 频 率 的 二 阶 偏 导, 确 定 目 标 边 缘 区 域 R ( x, y) ( 见 式 (7)~(9));() 保 留 目 标 边 缘 处 的 视 觉 量 子, 删 除 目 标 其 它 区 域 的 视 觉 量 子 ;(3) 计 算 以 视 觉 量 子 几 何 中 心 ο ( X, Y ) 为 起 点 目 标 边 缘 区 域 几 何 中 心 ο '( X ', Y ') 为 终 点 的 向 量 δ ;(4) 沿 向 量 δ 将 视 觉 量 子 移 动 至 量 子 平 衡 状 态 ;(5) 计 算 视 觉 量 子 的 频 率 积 分,( 见 式 (10)~(1)). 4 目 标 状 态 预 测.(1) 对 目 标 运 动 状 态 进 行 极 大 似 然 估 计, 预 测 下 一 帧 目 标 位 置 ;() 采 集 下 一 帧 图 像, 利 用 频 率 阶 跃 不 变 性, 移 动 视 觉 量 子 至 平 衡 状 态, 若 目 标 因 完 全 遮 挡 丢 失, 则 对 预 测 位 置 辐 射 视 觉 量 子 ;(3) 以 预 测 位 置

14 Journal of Software 软 件 学 报 BF 的 前 景 信 息 和 背 景 信 息 更 新 A. X Y 5 输 出 跟 踪 结 果. 以 达 到 量 子 平 衡 状 态 的 视 觉 量 子 作 为 目 标 位 置 信 息, 输 出 目 标 位 置 (, ). α + β α + β 6 循 环 跟 踪. 以 第 5 步 中 输 出 的 跟 踪 位 置 作 为 下 一 帧 图 像 的 目 标 初 始 化 区 域, 转 至 步 骤 循 环 执 行. 3.4 实 例 测 试 为 了 验 证 视 觉 量 子 目 标 跟 踪 方 法 的 实 用 性, 在 复 杂 条 件 下 的 实 际 现 场 中 对 运 动 目 标 进 行 跟 踪 测 试, 跟 踪 对 象 选 用 不 同 光 照 不 同 拍 摄 角 度 不 同 旋 转 尺 度 不 同 形 状 变 化 的 变 结 构 机 动 目 标. 通 过 视 觉 量 子 局 部 采 样 可 以 看 出, 利 用 频 率 阶 跃 不 变 性 检 测 变 结 构 目 标 信 息 基 本 覆 盖 了 目 标 关 键 特 征 区 域, 抑 制 了 非 关 键 信 息, 通 过 视 觉 量 子 的 频 率 阶 跃 不 变 性 质 实 现 了 从 变 化 的 目 标 信 息 中 提 取 不 变 信 息 的 仿 生 视 觉 跟 踪 方 法. 在 复 杂 条 件 下, 当 运 动 目 标 出 现 快 速 的 变 结 构 运 动 时, 目 标 本 身 的 形 状 及 尺 度 变 化 速 度 较 快, 特 征 变 化 剧 烈, 尤 其 是 在 动 态 背 景 下, 目 标 前 景 与 背 景 运 动 相 似, 难 以 进 行 区 分, 而 且 目 标 混 合 边 缘 区 域 的 增 长 也 为 目 标 跟 踪 带 来 较 大 干 扰. 但 基 于 视 觉 量 子 的 目 标 跟 踪 方 法, 在 采 用 频 率 阶 跃 不 变 性 检 测 量 子 平 衡 跟 踪 和 目 标 状 态 预 测 情 况 下, 对 目 标 混 合 边 缘 信 息 的 跟 踪 保 持 了 较 强 的 稳 定 性 和 很 好 的 鲁 棒 性 能, 同 时 由 于 视 觉 量 子 方 法 对 目 标 实 行 跟 踪, 不 需 要 对 目 标 多 种 状 态 下 的 模 板 信 息 进 行 计 算 匹 配 及 存 储, 也 不 需 要 对 视 频 图 像 整 体 进 行 目 标 运 动 信 息 计 算 和 分 割, 因 此 视 觉 量 子 目 标 跟 踪 方 法 处 理 的 数 据 量 较 低, 使 该 方 法 具 有 较 高 的 跟 踪 速 度 和 较 强 的 适 应 能 力. 与 现 阶 段 著 名 的 TLD 方 法 OLSL 方 法 及 WLMC 方 法 相 比, 视 觉 量 子 跟 踪 方 法 在 实 时 性 稳 定 性 和 准 确 性 方 面 具 有 较 高 的 优 势. 在 测 试 中, 选 取 了 一 组 实 际 应 用 场 景 中 对 现 有 目 标 跟 踪 方 法 极 具 挑 战 性 的 高 速 变 结 构 战 机 飞 行 视 频 数 据 ( 视 频 数 据 量 为 30884 帧, 宽 高 为 646 468 像 素, 帧 容 量 为 87KB, 位 深 度 为 4 位 ). 对 基 于 视 觉 量 子 理 论 的 目 标 跟 踪 方 法 进 行 测 试 的 结 果 及 其 跟 踪 过 程 中 移 动 向 量 围 绕 量 子 中 心 波 动 的 效 果 分 别 如 图 17(a) 和 图 17(b) 所 示, 图 17(a) 中 黄 色 框 图 为 跟 踪 结 果, 视 频 处 理 速 度 为 65 帧 / 秒, 准 确 率 为 90.7%. 实 例 测 试 的 目 标 运 动 状 态 包 括 : 后 空 翻 与 垂 直 旋 转 后 斜 左 侧 翻 后 右 侧 翻 后 左 侧 翻 前 右 侧 翻 前 空 翻 前 斜 左 上 翻 及 相 似 背 景 干 扰.

作 者 名 等 : 题 目 15 后 空 翻 与 垂 直 旋 转 后 斜 左 侧 翻 后 右 侧 翻 后 左 侧 翻 前 右 侧 翻 前 空 翻 前 斜 左 上 翻 相 似 背 景 干 扰 Fig.17 (a) The results of maneuvering object tracking under 8 variable structure moving statuses 图 17(a) 8 种 变 结 构 运 动 状 态 下 的 机 动 目 标 跟 踪 结 果

16 Journal of Software 软 件 学 报 4 实 验 与 相 关 工 作 对 比 分 析 Fig.17(b) The fluctuating effect of moving vector around the quantum center 图 17(b) 移 动 向 量 围 绕 量 子 中 心 波 动 效 果 本 文 以 视 觉 量 子 理 论 为 核 心 的 变 结 构 目 标 跟 踪 方 法 在 Pentium 3.06GHz/1GB 机 器 上 采 用 C++ 语 言 编 程 实 现. 为 了 突 出 视 觉 量 子 跟 踪 方 法 的 优 点 及 与 相 关 跟 踪 方 法 的 不 同 之 处, 本 文 介 绍 了 目 前 较 为 流 行 的 目 标 跟 踪 方

作 者 名 等 : 题 目 17 [39] 法 的 实 现 步 骤. 在 评 估 中, 首 先 采 用 与 本 文 算 法 应 用 条 件 相 同 的 IBM 多 目 标 遮 挡 数 据 库 进 行 算 法 测 试, 同 时 采 用 跟 踪 与 监 视 性 能 评 估 工 作 组 [40] (Performance evaluation of tracking and surveillance, PETS) 的 性 能 评 估 指 标 对 本 文 算 法 进 行 性 能 评 估.PETS 主 要 提 供 视 觉 监 控 与 目 标 跟 踪 算 法 的 评 估 服 务, 早 期 的 PETS 主 要 针 对 人 员 与 车 辆 的 运 动 目 标 检 测 与 跟 踪, 现 在 主 要 进 行 以 像 素 和 目 标 为 单 位 的 统 计 评 估 并 且 提 供 在 线 监 控 与 跟 踪 算 法 的 性 能 评 估 服 务. 同 时 也 采 用 了 美 国 California 大 学 YiWu 等 人 提 出 的 视 觉 跟 踪 评 估 体 系 [9], 对 本 文 方 法 进 行 了 公 正 的 评 价. 对 相 关 文 献 中 作 者 公 开 发 布 的 Matlab 跟 踪 算 法 采 用 C++ 语 言 进 行 了 重 新 实 现, 以 与 本 文 方 法 进 行 更 为 公 平 的 对 比. 4.1 相 关 工 作 [31] 4.1.1 TLD 跟 踪 方 法 01 年 7 月 英 国 萨 里 大 学 的 学 者 Zdenek Kalal 提 出 了 一 种 TLD(Tracking-Learning-Detection) 单 目 标 跟 踪 方 法, 即 将 跟 踪 - 学 习 - 检 测 三 者 进 行 结 合, 实 现 边 跟 踪 边 学 习 边 检 测. 该 方 法 是 将 传 统 的 模 板 匹 配 跟 踪 算 法 特 征 检 测 算 法 及 P-N 学 习 算 法 相 结 合 以 解 决 目 标 运 动 过 程 中 产 的 形 变 和 局 部 遮 挡 问 题. 通 过 P-N 学 习 算 法 对 跟 踪 模 板 的 显 著 特 征 进 行 不 断 更 新, 对 检 测 过 程 中 的 目 标 模 型 及 相 关 参 数 也 要 进 行 更 新, 以 此 实 现 目 标 稳 定 跟 踪.TLD 实 现 过 程 如 图 18 所 示. Fig.18 The implementation process of TLD method 图 18 TLD 实 现 过 程 TLD 方 法 缺 点 : 由 于 TLD 方 法 需 要 不 断 进 行 模 板 更 新 和 在 线 学 习,TLD 方 法 只 能 对 目 标 外 形 和 尺 度 变 化 较 小 的 目 标 进 行 跟 踪, 对 于 外 形 和 尺 度 变 化 速 度 较 快 且 出 现 相 似 背 景 干 扰 情 况 时,TLD 方 法 很 容 易 出 现 失 跟 和 跟 踪 错 误 的 问 题. [33] 4.1. OLSL 跟 踪 方 法 013 年 RuiYao 等 学 者 提 出 了 基 于 在 线 局 部 结 构 学 习 的 跟 踪 算 法. 采 用 观 测 样 本 和 样 本 数 量 对 图 像 局 部 模 板 进 行 在 线 训 练 和 分 类, 结 合 历 史 模 型 数 据 与 样 本 分 类 对 多 个 局 部 模 型 进 行 SVM 结 构 化 学 习, 建 立 外 观 模 型, 输 出 跟 踪 结 果. 当 目 标 发 生 遮 挡 或 者 局 部 外 观 发 生 显 著 变 化 时, 该 帧 数 据 不 能 用 于 增 量 学 习, 以 提 高 模 型 的 鲁 棒 性. 这 就 要 求, 在 每 一 帧, 都 要 根 据 历 史 数 据 重 新 训 练 SVM. 即 为 了 计 算 当 前 帧 的 外 观 模 型, 需 要 将 当 前 帧 加 入 到 在 线 训 练 与 分 类 器 中 进 行 训 练, 重 新 计 算 SVM.OLSL 算 法 步 骤 如 图 19 所 示. 视 频 在 线 训 练 与 分 类 样 本 分 类 模 型 跟 踪 与 更 新 跟 踪 窗 历 史 数 据 SVM 在 线 学 习 Fig.19 The implementation process of OLSL algorithm 图 19 OLSL 算 法 步 骤 OLSL 方 法 缺 点 :OLSL 方 法 需 要 对 外 观 模 型 进 行 反 复 学 习 和 更 新, 同 时 需 要 对 新 生 长 的 局 部 外 观 模 型 需 要 重 新 训 练 与 分 类. 虽 然 在 一 定 条 件 下 显 示 了 较 好 的 跟 踪 效 果, 但 是 对 于 相 似 目 标 干 扰 和 变 结 构 目 标 运 动 跟 踪 的 失 跟 率 较 高, 甚 至 容 易 出 现 跟 踪 错 误 目 标 的 情 况.

18 Journal of Software 软 件 学 报 [3] 4.1.3 WLMC 跟 踪 方 法 013 年 韩 国 首 尔 大 学 的 学 者 Junseok Kwon 针 对 突 变 运 动 问 题 提 出 了 一 种 基 于 Wang-Landau 的 蒙 特 卡 罗 采 样 跟 踪 方 法, 用 来 解 决 目 标 在 复 杂 环 境 下 的 突 变 运 动 跟 踪 问 题. 该 算 法 首 先 引 入 了 Wang-Landau 采 样 方 法 并 将 其 集 成 到 一 个 以 蒙 特 卡 罗 (MCMC) 跟 踪 框 架 为 基 础 的 马 尔 科 夫 链 中, 通 过 采 集 当 前 观 测 样 本, 利 用 Wang-Landau 采 样 方 法 引 入 MCMC 接 受 率, 可 以 有 效 缓 解 目 标 运 动 的 平 滑 约 束 和 实 现 鲁 棒 跟 踪.WLMC 方 法 可 以 对 目 标 状 态 进 行 有 效 采 样, 对 目 标 位 置 和 尺 度 发 生 较 大 突 变 运 动 时 可 以 进 行 有 效 跟 踪.WLMC 实 现 步 骤 如 图 0 所 示. Fig.0 The implementation process of WLMC algorithm 图 0 WLMC 实 现 步 骤 WLMC 方 法 缺 点 :WLMC 跟 踪 方 法 在 蒙 特 卡 罗 (MCMC) 跟 踪 框 架 的 基 础 上 利 用 Wang-Landau 采 样 方 法 引 入 MCMC 接 受 率. 可 以 对 突 变 目 标 进 行 有 效 跟 踪, 但 是 对 于 长 时 间 的 连 续 的 变 结 构 目 标 运 动 情 况 不 具 有 稳 定 的 跟 踪 效 果,WLMC 方 法 对 快 速 的 连 续 变 结 构 运 动 目 标 的 跟 踪 窗 抖 动 性 较 强, 稳 定 性 较 低. 4. IBM 评 估 指 标 及 评 估 结 果 目 标 检 测 的 研 究 对 象 主 要 包 括 像 素 和 目 标 两 种, 因 此 目 前 主 要 有 基 于 像 素 和 基 于 目 标 的 种 评 估 方 案. 基 于 像 素 级 别 的 评 估 包 含 4 项 统 计 指 标, 分 别 是 目 标 矩 形 框 内 的 前 景 帧 数 量 TP(True positive), 目 标 矩 形 框 外 的 背 景 帧 数 量 TN(True negative), 目 标 矩 形 框 外 的 前 景 帧 数 量 FP(False positive), 目 标 矩 形 框 内 的 背 景 帧 数 量 FN(False negative). 基 于 以 上 4 种 数 据 指 标,PETS 提 出 了 相 应 的 评 估 指 标 对 目 标 跟 踪 算 法 进 行 性 能 评 估, 具 体 指 标 见 表. Table The evaluation indexes of monitoring and tracking algorithms 表 监 控 与 跟 踪 算 法 性 能 评 估 指 标 项 目 名 称 计 算 过 程 TDR(Tracker detect rate) TDR=TP/(TP+FN) PP (Positive prediction) PP=TP/(TP+FP) FNR (False negative rate) FNR=FN/(TP+FN) FAR (False alarm rate) FAR=FP/(TP+FP) ACC (Accuracy) ACC=(TN+TP)/NTF FPR (False positive rate) FPR=FP/(TN+FP) 表 中 NTF(The number of total frame) 为 经 过 算 法 处 理 的 帧 总 数. 基 于 像 素 的 评 估 方 法 需 要 用 人 工 对 视 频 数 据 的 真 实 场 景 进 行 准 确 标 定, 人 工 实 现 较 为 困 难, 而 基 于 目 标 为 单 位 的 统 计 评 估 方 法, 表 所 列 出 的 参 数 也 同 样 适 用. 以 目 标 数 量 进 行 统 计 的 评 估 方 法, 主 要 通 过 系 统 的 输 出 目 标 区 域 和 矩 形 框 标 定 的 目 标 区 域 的 重 叠 区 域 进 行 判 别. 主 要 判 断 矩 形 框 标 定 目 标 是 否 处 于 待 检 测 目 标 的 边 界 以 内, 若 处 于 边 界 内, 则 判 定 为 目 标 检 测 成 功, 此 时 TP=TP+1; 否 则 判 定 为 目 标 没 有 检 测 成 功, 此 时 FN=FN+1; 若 待 检 测 目 标 搜 索 不 到 可 以 成 功 匹 配 的 矩 形 框, 则 标 定 此 待 检 测 目 标 为 FP, 此 时 FP=FP+1; 若 待 检 测 目 标 与 矩 形 框 目 标 产 生 交 错, 则 列 为 候 选 目 标 的 像 素 区 域, 此 时 TN=TN+1. 基 于 目 标 的 评 估 方 法 简 便 快 捷, 可 以 对 跟 踪 算 法 的 监 控 与 跟 踪 效 果 虚 警 概 率 进 行 有 效 的 性 能 评 估. 同 时 为 了 定 量 评 价 本 文 算 法 处 理 遮 挡 下 目 标 状 态 预 测 能 力, 在 此 引 入 一 个 新 的 评 价 指 标 : 预 测 错 误 率 (Forecast error rate, FER), 用 于 描 述 目 标 在 被 遮 挡 前 后 错 误 预 测 的 概 率 ( 包 括 发 生 实 际 运 行 轨 迹 和 预 测 轨 迹 出 现 较 大 偏 离 的 情 况 ), 定 义 如 下 : FER= (~ μ j) (~ ψ l) 其 中, μ j 为 第 j 次 遮 挡 前 后 预 测 状 态 值, ψ l 为 第 l 次 遮 挡 前 后 分 裂 状 态 值, μ = 0时, 预 测 错 误, μ = 1时, 预 测 有 效. ψ = 0时, 遮 挡 发 生 分 裂, ψ = 1时, 遮 挡 未 分 裂. 本 文 VQ 跟 踪 方 法 TLD 方 法 OLSL 方 法 及 WLMC 方 法 在 IBM 多 目 标 遮 挡 数 据 库 的 15 组 视 频, 共 10603 帧

作 者 名 等 : 题 目 19 图 像 的 测 试 结 果 如 图 1 所 示, 其 中 每 组 实 验 均 反 复 进 行 0 次. 综 合 测 试 结 果 表 明,VQ 跟 踪 方 法 具 有 较 高 的 跟 踪 性 能 : 目 标 外 观 与 背 景 相 似 干 扰 条 件 下 的 漏 检 概 率 FNR 为 0.011, 如 图 1 所 示. 由 于 跟 踪 过 程 中 充 分 考 虑 了 运 动 目 标 邻 域 量 子 频 率 间 存 在 的 频 率 阶 跃 不 变 性, 然 后 将 该 性 质 纳 入 量 子 平 衡 移 动 中, 并 对 目 标 进 行 预 测 跟 踪, 降 低 了 系 统 和 环 境 噪 声 引 起 的 虚 警 概 率 FPR,FPR 的 平 均 测 试 结 果 为 0.037, 同 时 有 效 解 决 了 变 结 构 运 动 及 遮 挡 引 起 的 目 标 丢 失 问 题, 跟 踪 准 确 率 TDR 平 均 为 0.91, 预 测 错 误 率 平 均 为 0.13. 在 目 标 跟 踪 过 程 中, 由 于 采 用 了 似 然 估 计 对 目 标 状 态 进 行 预 测 式 跟 踪, 使 得 本 文 算 法 具 有 较 高 的 实 时 性 和 准 确 率, 对 IBM 多 目 标 遮 挡 数 据 库 的 处 理 速 度 平 均 为 75 帧 / 秒. 为 了 进 一 步 验 证 本 文 前 趋 预 测 跟 踪 方 法 在 相 似 背 景 干 扰 强 度 目 标 运 动 速 度 和 多 目 标 遮 挡 强 度 变 化 情 况 下 的 跟 踪 性 能, 本 文 在 IBM 多 目 标 遮 挡 数 据 库 的 15 组 视 频 上 进 行 了 大 量 的 性 能 测 试, 每 组 实 验 反 复 进 行 0 次, 以 均 值 表 示 平 均 测 试 结 果, 同 时 与 TLD 算 法 OLSL 算 法 WLMC 算 法 在 相 似 背 景 干 扰 强 度 变 结 构 运 动 速 度 和 多 目 标 遮 挡 强 度 变 化 的 情 况 下 三 者 的 跟 踪 性 能 进 行 比 较. Fig.1 The assessment result of multi-objective occlusion database 图 1 多 目 标 遮 挡 数 据 库 评 估 结 果 4..1 相 似 背 景 干 扰 强 度 变 换 相 似 背 景 干 扰 强 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 所 示. 实 验 结 果 表 明 当 相 似 背 景 干 扰 强 度 逐 步 递 增 时, 本 文 视 觉 量 子 跟 踪 方 法 在 运 动 目 标 相 似 背 景 的 递 增 式 干 扰 条 件 下 的 跟 踪 误 差 和 实 时 误 差 都 普 遍 较 低, 相 对 于 其 他 三 种 方 法, 本 文 跟 踪 方 法 对 相 似 背 景 干 扰 条 件 下 的 目 标 跟 踪 具 有 显 著 的 稳 定 性 和 实 时 性. (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig. The performance comparison about the intensity transformation of interference from similar background 图 相 似 背 景 干 扰 强 度 变 换 的 性 能 对 比 4.. 变 结 构 运 动 速 度 变 换 目 标 运 动 速 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 3 所 示. 实 验 结 果 表 明 当 目 标 运 动 速 度 逐 渐 增 大 时, 本 文 视 觉 量 子 跟 踪 方 法 的 跟 踪 误 差 递 增 幅 度 较 小, 实 时 性 误 差 基 本 保 持 在 较 低 水 平, 验 证 了 本 文 基 于 视 觉 量 子 的 目 标 跟 踪 方 法 对 于 速 度 变 化 的 运 动 目 标 跟 踪 具 有 明 显 优 势. 而 其 它 三 种 方 法 对 目 标 运 动 速 度 递 增 条 件 下 的 跟 踪 误 差 和 实 时 性 误 差 都 在 逐 步 递 增, 比 本 文 VQ 方 法 的 跟 踪 误 差 和 实 时 性 误 差 平 均 高 出 0. 和 0.3, 不 具 有 明 显 的 跟 踪 优 势.

0 Journal of Software 软 件 学 报 (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig.3 The performance comparison about speed transformation of variable structure motion 图 3 目 标 运 动 速 度 变 换 的 性 能 对 比 4..3 多 目 标 运 动 遮 挡 强 度 变 换 多 目 标 运 动 遮 挡 强 度 递 增 且 检 测 频 率 不 变 的 情 况 下 进 行 跟 踪 误 差 与 实 时 性 误 差 实 验 如 图 4 所 示. 从 图 中 可 以 看 出 当 多 目 标 交 叉 式 运 动 的 遮 挡 强 度 逐 步 增 加 时, 本 文 视 觉 量 子 跟 踪 方 法 的 跟 踪 误 差 保 持 在 较 低 水 平, 增 幅 较 小, 跟 踪 误 差 较 低, 对 多 目 标 遮 挡 具 有 很 好 的 鲁 棒 性, 而 其 它 三 种 方 法 跟 踪 误 差 较 高, 尤 其 是 TLD 方 法, 虽 然 在 目 标 遮 挡 强 度 较 低 时 保 持 了 很 好 的 跟 踪 准 确 性, 跟 踪 误 差 最 小, 但 是 当 目 标 遮 挡 强 度 递 增 时, 跟 踪 误 差 增 幅 较 大, 对 目 标 遮 挡 跟 踪 的 鲁 棒 性 较 低. 在 实 时 性 误 差 当 中, 四 种 方 法 在 目 标 遮 挡 强 度 递 增 时, 都 保 持 了 较 好 的 鲁 棒 性, 但 是 本 文 VQ 方 法 的 跟 踪 实 时 性 误 差 最 低, 比 其 它 三 种 方 法 具 有 较 高 的 抗 遮 挡 跟 踪 优 势. (a) The absolute value of tracking error (b) Real-time error of tracking (a) 跟 踪 误 差 绝 对 值 (b) 跟 踪 实 时 性 误 差 Fig.4 The performance comparison about intensity transformation of occlusion for multi-objective motions 图 4 多 目 标 遮 挡 强 度 变 换 的 性 能 对 比 4.3 Benchmark 评 估 指 标 及 评 估 结 果 在 PETS 性 能 评 估 基 础 上, 本 文 采 用 美 国 California 大 学 YiWu 等 人 提 出 的 Benchmark 视 觉 跟 踪 评 估 体 系, 对 本 文 方 法 进 行 了 进 一 步 公 正 的 评 价.Benchmark 评 估 体 系 提 供 了 50 组 不 同 干 扰 条 件 下 的 视 频 数 据 库 进 行 跟 踪 测 试, 在 此 基 础 上 提 供 了 可 以 与 相 关 算 法 进 行 对 比 的 近 660000 个 目 标 跟 踪 窗, 并 注 明 了 最 常 使 用 的 跟 踪 序 列, 图 5 显 示 了 Benchmark 视 频 数 据 库 中 每 个 视 频 序 列 的 第 一 帧 进 行 初 始 化 的 目 标 窗 口. 视 频 数 据 库 及 跟 踪 结 果 可 以 从 http://visual tracking.net 下 载.

作 者 名 等 : 题 目 1 Fig.5 Samples of object initialization in Benchmark video databases 图 5 Benchmark 视 频 数 据 库 目 标 初 始 化 示 例 Benchmark 评 估 方 法 主 要 通 过 算 法 可 执 行 程 序 的 运 行 结 果 对 算 法 性 能 的 好 坏 进 行 定 量 分 析 与 评 估. 评 估 指 标 包 括 整 体 跟 踪 性 能 指 标 OPE 时 间 鲁 棒 性 指 标 TRE 和 空 间 鲁 棒 性 指 标 SRE.OPE 是 在 第 一 帧 初 始 化 目 标 位 置 限 制 下 的 整 体 跟 踪 平 均 通 过 率,TRE 指 第 一 帧 跟 踪 到 最 后 一 帧 的 整 体 耗 时 与 准 确 性,SRE 包 含 两 个 方 面, 一 是 程 序 跟 踪 窗 中 心 位 置 与 目 标 中 心 位 置 的 平 均 Euclidean 距 离, 另 一 个 是 程 序 跟 踪 窗 边 框 与 实 际 目 标 边 框 的 重 叠 率, 最 后 通 过 AUC 对 精 度 和 准 确 率 进 行 统 计, 因 此 选 择 合 理 的 可 执 行 程 序 是 进 行 算 法 性 能 正 确 评 价 的 基 础. 本 文 根 据 相 关 文 献 中 的 算 法 流 程 并 参 照 了 作 者 公 开 发 布 的 基 于 Matlab 的 跟 踪 程 序, 采 用 C++ 语 言 对 相 关 文 献 所 提 方 法 进 行 了 重 新 实 现 和 算 法 优 化, 以 与 本 文 方 法 进 行 更 为 公 平 的 对 比. 在 Pentium 3.06GHz/1GB 机 器 上 对 VQ 方 法 TLD 方 法 OLSL 方 法 WLMC 方 法 进 行 了 跟 踪 测 试, 测 试 结 果 如 图 6 所 示. 测 试 中, 以 第 一 帧 初 始 化 的 区 域 为 跟 踪 目 标, 视 频 测 试 结 果 有 效 区 间 为 第 二 帧 至 最 后 一 帧, 每 组 视 频 均 反 复 测 试 0 次, 取 均 值 作 为 测 试 结 果, 以 提 高 评 估 准 确 性 和 公 平 性. 综 合 实 验 结 果, 本 文 VQ 方 法 在 Benchmark 评 估 测 试 中 的 平 均 跟 踪 准 确 率 为 9.5%, 视 频 处 理 速 度 平 均 为 73 帧 / 秒. (a) Test data of OPE accuracy (a)ope 准 确 率 测 试 数 据 (b) Test data of SRE accuracy (b)sre 准 确 率 测 试 数 据

Journal of Software 软 件 学 报 (c) Test data of TRE accuracy (c)tre 准 确 率 测 试 数 据 (d) Test data of OPE precision (d)ope 精 度 测 试 数 据 (e) Test data of SRE precision (f) Test data of TRE precision (e)sre 精 度 测 试 数 据 (f)tre 精 度 测 试 数 据 Fig. 6 Benchmark performance evaluation results of VQ method, TLD method, OLSL method and WLMC method 图 6 VQ 方 法 TLD 方 法 OLSL 方 法 WLMC 方 法 的 Benchmark 性 能 评 估 结 果 由 图 6(a)~(f) 测 试 数 据 可 以 得 出 以 下 评 估 结 果 : s r s r OPE : TLD < OLSL < WLMC < VQ SRE : TLD < OLSL < WLMC < VQ s r pre TRE : TLD < OLSL < WLMC < VQ OPE : TLD < OLSL < WLMC < VQ pre pre SRE : TLD < WLMC < OLSL < VQ TRE : TLD < WLMC < OLSL < VQ 其 中,s-r 为 准 确 率,pre 为 精 度. 由 结 果 可 以 看 出, 前 四 项 评 估 结 果 一 致, 第 四 项 和 第 五 项 中 WLMC 算 法 的 SRE 精 度 和 TRE 精 度 略 小 于 OLSL 算 法, 原 因 是 WLMC 算 法 在 蒙 特 卡 罗 跟 踪 的 样 本 输 入 过 程 中, 对 输 入 样 本 实 行 接 受 率 反 馈, 对 样 本 系 数 进 行 动 态 调 整, 虽 然 在 一 定 程 度 上 提 高 了 跟 踪 准 确 率, 但 跟 踪 系 统 的 鲁 棒 性 也 略 有 降 低. 即 便 如 此,WLMC 算 法 在 整 体 性 能 上 仍 然 好 于 OLSL 算 法. 四 中 算 法 的 综 合 评 估 结 果 如 下 : TLD < OLSL < WLMC < VQ 在 OPE 准 确 率 SRE 准 确 率 TRE 准 确 率 OPE 精 度 SRE 精 度 和 TRE 精 度 6 种 评 估 指 标 的 评 估 下,TLD 方 法 OLSL 方 法 与 WLMC 方 法 显 示 出 了 较 高 的 跟 踪 精 度 和 准 确 率, 也 显 示 出 了 较 好 的 鲁 棒 性 能. 相 比 之 下, 本 文 VQ 跟 踪 方 法 比 其 它 三 种 算 法 在 保 持 同 一 评 测 条 件 下 显 示 出 了 更 高 的 跟 踪 精 度 和 跟 踪 准 确 率, 同 时 相 比 其 它 三 种 方 法, 视 觉 量 子 跟 踪 方 法 不 需 要 进 行 在 线 学 习 在 线 分 类 及 特 征 融 合 等 相 关 操 作, 通 过 视 觉 量 子 熵 能 量 计 算 频 率 阶 跃 不 变 性 提 取 量 子 平 衡 跟 踪 以 及 目 标 状 态 预 测 四 个 步 骤 实 行 目 标 跟 踪, 在 时 间 鲁 棒 性 和 空 间 鲁 棒 性 上 凸 显 出 较 强 的 优 势. 同 时 由 图 5 可 知,Benchmark 性 能 评 估 体 系 提 供 测 试 的 视 频 数 据 在 目 标 运 动 速 度 形 状 变 化 幅 度 尺 度 伸 缩 强 度 相 似 背 景 / 目 标 遮 挡 与 干 扰 光 照 强 度 变 化 特 征 域 旋 转 系 统 与 环 境 噪 声 杂 波 等 多

作 者 名 等 : 题 目 3 种 复 杂 因 素 的 综 合 影 响 下, 对 目 标 跟 踪 方 法 的 测 试 具 有 全 面 性 和 客 观 性, 而 且 其 评 估 过 程 严 格, 视 频 数 据 环 境 贴 近 实 际 现 场, 评 估 指 标 较 为 公 正. 因 此 本 文 提 出 的 视 觉 量 子 跟 踪 方 法 在 跟 踪 的 准 确 性 稳 定 性 实 时 性 及 鲁 棒 性 上 都 显 示 出 了 较 强 的 优 势 和 很 好 的 跟 踪 性 能. 同 时 由 于 视 觉 量 子 跟 踪 方 法 在 进 行 量 子 频 率 阶 跃 计 算 量 子 平 衡 状 态 移 动 过 程 中, 对 图 像 采 集 设 备 的 采 集 频 率 具 有 较 强 的 依 赖 性, 较 高 的 图 像 采 集 频 率 对 本 文 视 觉 量 子 目 标 跟 踪 的 准 确 性 和 目 标 状 态 预 测 准 确 性 具 有 积 极 的 推 动 作 用, 因 此 如 果 能 在 提 升 图 像 采 集 设 备 的 采 集 频 率 前 提 下, 进 行 视 觉 量 子 跟 踪, 将 会 使 本 文 方 法 发 挥 出 更 好 的 跟 踪 性 能. 4.4 计 算 复 杂 性 与 数 据 量 分 析 在 Pentium4 3.06G CPU/1G 内 存 的 机 器 上 对 一 组 大 小 为 a b 长 度 为 l 的 视 频 进 行 目 标 跟 踪, 手 动 选 取 的 目 标 跟 踪 窗 大 小 为 m n, 视 觉 量 子 数 量 为 N. 本 文 方 法 的 时 间 计 算 量 包 含 三 个 部 分 : 第 一 部 分 是 量 子 频 率 计 算 时 间, 第 二 部 分 是 量 子 平 衡 跟 踪 的 计 算 时 间, 第 三 部 分 是 目 标 状 态 预 测 的 计 算 时 间. 计 算 量 子 频 率 信 息 的 时 间 复 杂 度 为 Ο ( N log N), 进 行 量 子 平 衡 跟 踪 的 时 间 复 杂 度 为 Ο ( Nlog N + N), 进 行 目 标 状 态 预 测 的 时 间 复 杂 度 为 Ο[( mn log N) / N], 因 此 本 文 方 法 的 时 间 复 杂 3 3 度 是 Ο [(N + mn / N)log N + N], 远 小 于 基 于 TLD 的 时 间 复 杂 度 Ο ( abm n N ), 也 远 小 于 基 于 OLSL 的 时 间 复 杂 度 Ο ( mnn + log N) 和 基 于 WLMC 的 时 间 复 杂 度 Ο ( mnn + mnn). 本 文 方 法 的 空 间 复 杂 度 为 Ο (3 N), 即 Ο ( N), 而 文 献 [31-33] 的 方 法 的 空 间 复 杂 度 都 是 Ο ( N ), 因 此 本 文 方 法 的 计 算 效 率 优 于 TLD 方 法, 也 优 于 OLSL 和 WLMC 的 方 法. 在 数 据 处 理 方 面, 本 文 方 法 需 要 处 理 的 数 据 主 要 集 中 在 目 标 混 合 边 缘 区 域 的 量 子 频 率 计 算 上, 数 据 量 较 小, 同 时 采 用 极 大 似 然 估 计 方 法 预 测 目 标 位 置, 无 需 对 候 选 目 标 进 行 全 局 搜 索 和 存 储 多 种 目 标 姿 态 模 型, 降 低 了 目 标 搜 索 范 围 和 待 处 理 的 数 据 总 量, 对 于 本 节 设 定 的 视 频 图 像, 其 处 理 的 数 据 总 量 远 远 小 于 abl 个 像 素, 而 文 献 [31-33] 方 法 需 要 处 理 的 数 据 总 量 均 为 abl 个 像 素. 因 此 本 文 方 法 处 理 的 数 据 量 小 于 其 他 三 种 方 法 的 数 据 量. 5 结 论 及 展 望 本 文 在 生 物 视 觉 单 元 协 同 工 作 的 方 向 上, 提 出 了 一 种 新 的 基 于 视 觉 量 子 的 目 标 跟 踪 方 法. 视 觉 量 子 目 标 跟 踪 方 法 是 建 立 在 子 空 间 目 标 协 同 分 析 的 整 体 框 架 之 上, 利 用 视 觉 量 子 采 样, 熵 能 量 计 算 频 率 阶 跃 不 变 性 提 取 量 子 平 衡 跟 踪 以 及 采 用 极 大 似 然 估 计 预 测 运 动 目 标 状 态, 重 复 验 证 移 动 后 的 视 觉 量 子 的 量 子 平 衡 状 态, 确 保 目 标 跟 踪 有 效 性. 与 现 有 目 标 跟 踪 方 法 相 比, 该 方 法 的 优 势 在 于 :(1) 抓 住 了 变 结 构 运 动 目 标 前 景 与 背 景 交 界 处 具 有 的 能 量 频 率 阶 跃 不 变 性 的 特 点 ;() 将 阶 跃 不 变 特 征 采 用 多 个 具 有 独 立 性 和 约 束 性 的 视 觉 量 子 进 行 描 述, 可 以 有 效 克 服 形 状 变 化 尺 度 变 化 等 变 结 构 因 素 对 运 动 目 标 跟 踪 的 影 响, 失 跟 率 较 低, 鲁 棒 性 能 较 高 ;(3) 视 觉 量 子 数 据 量 较 小, 同 时 不 需 要 存 储 目 标 多 种 姿 态 模 型, 计 算 复 杂 度 和 空 间 复 杂 度 低, 跟 踪 实 时 性 较 高. 通 过 IBM 评 估 测 试 和 Benchmark 评 估 测 试 表 明, 视 觉 量 子 在 多 种 复 杂 环 境 下, 特 别 是 速 度 较 高 的 变 结 构 运 动 目 标 跟 踪 中 保 持 了 较 强 的 稳 定 性, 对 环 境 变 化 和 目 标 自 身 变 化 具 有 很 好 的 鲁 棒 性 和 准 确 性, 准 确 率 平 均 为 91.5%, 在 高 速 变 结 构 机 动 目 标 跟 踪 IBM 评 估 数 据 库 和 Benchmark 评 估 数 据 库 上 跟 踪 的 实 时 性 平 均 为 7 帧 / 秒. 本 文 方 法 不 仅 对 视 频 目 标 跟 踪 有 效, 而 且 对 三 维 场 景 图 像 检 索 视 觉 场 景 分 析 也 具 有 普 遍 意 义, 为 计 算 机 视 觉 处 理 提 供 了 新 的 思 路. 视 觉 量 子 通 过 目 标 子 空 间 量 子 簇 的 协 同 分 析 进 行 目 标 跟 踪, 如 果 目 标 图 像 整 体 模 糊 程 度 较 高 ( 熵 分 布 趋 于 1) 时, 量 子 频 率 近 似 程 度 较 为 严 重, 影 响 了 目 标 跟 踪 效 果, 虽 然 模 糊 程 度 较 高 的 视 频 图 像 在 视 觉 意 义 上 已 经 失 去 作 用, 但 针 对 模 糊 图 像 跟 踪 做 进 一 步 分 析, 将 对 视 觉 量 子 跟 踪 性 能 的 完 善 起 到 很 好 的 推 动 作 用, 因 此 本 文 今 后 将 针 对 模 糊 图 像 的 目 标 跟 踪 做 进 一 步 研 究 工 作. 致 谢 在 此, 我 们 向 对 本 文 的 工 作 给 予 支 持 指 导 和 建 议 的 国 内 外 同 行, 尤 其 是 英 国 Surrey 大 学 Zdenek Kalal 学 者 韩 国 Seoul 大 学 Junseok Kwon 学 者 美 国 Carnegie Mellon 大 学 Robert T. Collins 教 授 表 示 感 谢.

4 Journal of Software 软 件 学 报 References: [1] David T, Matthew F, Atsushi N. Motion coherent tracking using multi-label MRF optimization. International Journal of Computer Vision, 01, 100(): 190-0.[doi: 10.1007/s1163-011-051-5] [] Xi L, Dick A, Chun HS, Van DHA, Han Z W. Incremental learning of 3D-DCT compact representations for robust visual tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(4):863-881.[doi: 10.1109/TPAMI.01.166] [3] Salmond DJ, Gordon NJ. Group and extended object tracking. In: Proc. of IEE Colloquium on Target Tracking. London, UK: IEE, 1999. 1611-1614.[doi: 10.1049/ic:19990517] [4] Waxmann MJ, Drummond OE. A bibliography of cluster (group) tracking. In: Proc. of the International Conference on Signal and Data Processing of Small Targets. Orlando, USA:SPIE, 004. 551-560.[doi: 10.1117/1.548357] [5] Bugeau A, Perez P. Detection and segmentation of moving objects in highly dynamic scenes. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Minnesota, USA:IEEE, 007.1-8.[doi: 10.1109/CVPR.007.38344] [6] Lu Z, Laurens VM. Structure preserving object tracking. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 1838-1845.[doi: 10.1109/CVPR.013.40] [7] Rizwan C, Gregory H, Rene V. Dynamic template tracking and recognition. International Journal of Computer Vision, 013, 105(1):19-48.[doi: 10.1007/s1163-013-065-0] [8] Huttenlocher DP, Klanderman GA, Rucklidge WJ. Comparing images using the Hausdorff distance. IEEE Transactions on Pattern Analysis Machine Intellelligence, 1993, 15(9):850-863.[doi: 10.1109/34.3073] [9] Huttenlocker DP, Noh JJ, Rucklidge WJ. Tracking nonrigid objects in complex scenes. In: Proc. of the 4th Int l Conference on Computer Vision, Berlin, Germany,1993.[doi: 10.1109/ICCV.1993.37831] [10] Haritaoglu I, Harwood D, Davis LS. W 4 : Real-time surveillance of people and their activities. IEEE Transactions on Pattern Analysis and Machine Intelligence, 008, (8):809-830.[doi: 10.1109/34.868683] [11] Stauffer C, Grimson WEL. Learning patterns of activity using real-time tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 006, (8):747-757.[doi: 10.1109/34.868677] [1] Rezaeian M, Vo BN. Error bounds for joint detection and estimation of a single object with random finite set observation. IEEE Transactions on Signal Processing. 010, 58(3):1493-1506.[doi: 10.1109/TSP.009.037665] [13] Yan XX, Han CZ. Multiple target tracking based on online estimation of clutter intensity. Control and Decision, 01, 7(4):507-51 (in Chinese with English abstract). [doi: 10.13195/j.cd.01.04.9.yanxx.013] [14] Juan R, Raul E, Victor A. A fuzzy inference approach to template-based visual tracking. Machine Vision and Applications, 01, 3(3):47-439.[doi: 10.1007/s00138-010-0314-8] [15] Airouche M, Bentabet L, Zelmat M, Gao G. Pedestrian tracking using color, thermal and location cue measurements: a DSmT-based framework. Machine Vision and Applications, 01, 3(5):999-1010.[doi: 10.1007/s00138-011-034-z] [16] Zhou HY, Yuan Y, Shi CM. Object tracking using SIFT features and mean shift. Computer Vision and Image Understanding,009, 113(3):345-35.[doi: 10.1016/j.cviu.008.08.006] [17] Maggio E, Cavallaro A. Learning scene context for multiple object tracking. IEEE Transactions on Image Processing, 009, 18(8):1873-1884.[doi: 10.1109/TIP.009.019934] [18] Carl YR, Victor P, Ian R. Regressing local to global shape properties for online segmentation and tracking. International Journal of Computer Vision, 013, 106(3):69-81.[doi: 10.1007/s1163-013-0635-y] [19] Vo BN, Ma WK. The Gaussian mixture probability hypothesis density filter. IEEE Transactions on Signal Processing, 009, 51(11):4091-4104.[doi: 10.1109/TSP.006.881190] [0] Mahler R. Detecting, tracking, and classifying group targets: a unified approach. In: Proc. of the International Conference on Signal and Data Processing of Small Targets. Orlando, USA: SPIE, 009. 17-8.[doi: 10.1117/1.436950] [1] Xi L, Wei MH, Chun HS, Zhong FZ, Anthony D, Anton VDH. A survey of appearance models in visual object tracking. ACM Transactions on Intelligent Systems and Technology, 013, 4(4):58(1-48).[doi: 10.1145/508037.508039] [] Comaniciu D, Ramesh V, Meer P. Real-time tracking of non-rigid objects using mean shift. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. South Carolina, USA, 000, : 14-149.[doi: 10.1109/CVPR.000.854761] [3] Comaniciu D, Ramesh V, Meer P. Kernel-based object tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 007, 5(5):564-577.[doi: 10.1109/TPAMI.003.1195991]

作 者 名 等 : 题 目 5 [4] Yang C, Duraiswami R, Davis L. Efficient means shift tracking via a new similarity measure. In: Proc. of the 005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. California, USA, 005, 1: 176-183.[doi: 10.1109/CVPR.005.139] [5] Jeong MH, You BJ, Oh YH, Oh SR, Oh SH. Adaptive mean-shift tracking with novel color model. In: Proc. of the IEEE International Conference on Mechatronics & Automation. Niagara Falls, Canada, 005, 3: 139-1333.[doi: 10.1109/ICMA.005.166746] [6] Davy M, Tourneret JY. Generative supervised classification using dirichlet process priors. IEEE Transactions on Pattern Analysis and Machine Intelligence, 010, 3(10):1781-1794.[doi: 10.1109/TPAMI.010.1] [7] Liam E, Nicholas D, Jiri M, Richard B. Linear regression and adaptive appearance models for fast simultaneous modeling and tracking. International Journal of Computer Vision, 011,95():154-179.[doi: 10.1007/s1163-010-0364-4] [8] Ying LT, Andrew S, Max L. Robust and efficient foreground analysis in complex surveillance videos. Machine Vision and Applications, 01, 3(5):967-983.[doi: 10.1007/s00138-011-0377-1] [9] Yi W, Jongwoo L, Hsuan Y. Online object tracking: a benchmark. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 411-418.[doi: 10.1109/CVPR.013.31] [30] Lv XB, Zhou QB, Chen ZM, Xiong YY, Cai K. The gaussian mixture probability hypothesis density filter and its application to multi-target tracking. Chinese Journal of Computers, 01, 35():397-403 (in Chinese with English abstract). [doi: 10.374/sP.J.1016.01.00397] [31] Kalal Z, Mikolajczyk K, Matas J. Tracking-learning-detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 01, 34(7):1409-14.[doi: 10.1109/TPAMI.011.39] [3] Rui Y, Qinfeng S, Chunhua S, Yanning Z, Vandenhengel A. Part-based visual tracking with online latent structural learning. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 013, 1: 363-370.[doi: 10.1109/CVPR.013.306] [33] Junseok K, Kyoung ML. Wang-landau monte carlo-based tracking methods for abrupt motions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(4): 1011-104.[doi: 10.1109/TPAMI.01.161] [34] Hu DK. The research on technology of image understanding based on biological visual perception[ph.d. Thesis].Chengdu: University of Electronic Science and Technology of China, 01 (in Chinese with English abstract). [35] Ali B, Laurent I. State-of-the-art in visual attention modeling. IEEE Transactions on Pattern Analysis and Machine Intelligence, 013, 35(1): 185-07. [36] Zhang JS, Xu ZB, Ruan YW. A new data processing method based on a biological model of compound eye: direction quantization representation and its theory. Chinese Journal of Computers, 000, 3(6): 609-614 (in Chinese with English abstract). [doi: 10.331/j.issn:054-4164.000.06.007] [37] Zhang JS, Xu ZB, Ruan YW. A new data processing method based on a biological model of compound eye: direction quantization representation in applications. Chinese Journal of Computers, 000, 3(6): 615-619 (in Chinese with English abstract). [doi: 10.331/j.issn:054-4164.000.06.008] [38] Goodman N. Statistical analysis based on a certain multivariate complex Gaussian distribution (an introduction). The Annals of Mathematical Statistics, 1963, 34(1): 15-177.[doi: 10.114/aoms/117770450] [39] Brown LM, Senior AW, Tian YL, Connell J, Hampapur A. Performance evaluation of surveillance systems under varying conditions. In: Proc. of the IEEE International Workshop on Performance Evaluation of Tracking and Surveillance, Colorado, USA, 005, 1-8.[doi: 10.1.1.83.9549] [40] Grabner H, Roth PM, Bischof H. Is pedestrian detection really a hard task. In: Proc. of the 10th IEEE International Workshop on Performance Evaluation of Tracking and Surveillance, Rio de Janeiro, 007.1-8.[doi: 10.1.1.144.9468] 附 中 文 参 考 文 献 : [13] 闫 小 喜, 韩 崇 昭. 基 于 杂 波 强 度 在 线 估 计 的 多 目 标 跟 踪 算 法. 控 制 与 决 策,01,7(4):507-51. [doi: 10.13195/j.cd. 01.04.9. yanxx.013] [30] 吕 学 斌, 周 群 彪, 陈 正 茂, 熊 运 余, 蔡 葵. 高 斯 混 合 概 率 假 设 密 度 滤 波 器 在 多 目 标 跟 踪 中 的 应 用. 计 算 机 学 报,01, 35():397-403. [doi: 10.374/sP.J.1016.01.00397]

6 Journal of Software 软 件 学 报 [34] 胡 德 昆. 基 于 生 物 视 觉 感 知 机 制 的 图 像 理 解 技 术 研 究 [ 博 士 学 位 论 文 ]. 成 都 : 电 子 科 技 大 学, 01. [36] 张 讲 社, 徐 宗 本, 阮 奕 文. 一 类 模 拟 生 物 复 眼 几 何 结 构 的 数 据 处 理 方 法 - 方 向 量 子 化 表 示 的 理 论. 计 算 机 学 报, 000, 3(6): 609-614.[doi: 10.331/j.issn:054-4164.000.06.007] [37] 张 讲 社, 徐 宗 本, 阮 奕 文. 一 类 模 拟 生 物 复 眼 几 何 结 构 的 数 据 处 理 方 法 - 方 向 量 子 化 表 示 的 应 用. 计 算 机 学 报, 000, 3(6): 615-619. [doi: 10.331/j.issn:054-4164.000.06.008]