第 33 卷 第 期 电 子 与 信 息 学 报 Vol.33No. 20 年 月 Journal of Electronics & Information echnology Jan. 20 一 种 基 于 二 值 粒 子 群 优 化 和 支 持 向 量 机 的 目 标 检 测 算 法 潘 泓 * 李 晓 兵 金 立 左 夏 良 正 ( 东 南 大 学 自 动 化 学 院 南 京 20096) 摘 要 : 针 对 复 杂 场 景 下 目 标 检 测 和 目 标 检 测 中 特 征 选 择 问 题, 该 文 将 二 值 粒 子 群 优 化 算 法 (BPSO) 用 于 特 征 选 择, 结 合 支 持 向 量 机 (SVM) 技 术 提 出 了 一 种 新 颖 的 基 于 BPSO-SVM 特 征 选 择 的 自 动 目 标 检 测 算 法 该 算 法 将 目 标 检 测 转 化 为 目 标 识 别 问 题, 采 用 wrapper 特 征 选 择 模 型, 以 SVM 为 分 类 器, 通 过 样 本 训 练 分 类 器, 根 据 分 类 结 果, 利 用 BPSO 算 法 在 特 征 空 间 中 进 行 全 局 搜 索, 选 择 最 优 特 征 集 进 行 分 类 基 于 BPSO-SVM 的 特 征 选 择 方 法 降 低 了 特 征 维 数, 显 著 提 高 了 分 类 器 性 能 实 验 结 果 表 明, 该 文 算 法 不 仅 有 效 提 高 了 复 杂 场 景 下 目 标 姿 态 尺 度 光 照 变 化 和 局 部 被 遮 挡 时 的 检 测 准 确 率, 还 大 大 缩 短 了 检 测 时 间 关 键 词 : 目 标 检 测 ; 二 值 粒 子 群 优 化 ; 支 持 向 量 机 ; 特 征 选 择 中 图 分 类 号 :P39.4 文 献 标 识 码 : A 文 章 编 号 :009-5896(20)0-07-05 DOI: 0.3724/SP.J.46.200.00260 A Binary Particle Swarm Optimization and Support Vector Machine-based Algorithm for Object Detection Pan Hong Li Xiao-bing Jin Li-zuo Xia Liang-zheng (School of Automation, Southeast University, Nanjing 20096, China) Abstract: his paper proposes a novel object detection method, namely the BPSO-SVM-based detection algorithm that combines Binary Particle Swarm Optimization (BPSO) and Support Vector Machine (SVM) techniques to cope with feature selection issue for object detection under complex scenarios. In the proposed algorithm, object detection is regarded as a two-class categorization problem and feature subset is selected using a wrapper model, in which the BPSO searches the whole feature space and a SVM classifier serves as an evaluator for the goodness of the feature subset selected by the BPSO. Using the proposed BPSO-SVM-based feature selection scheme, feature dimensionality is reduced and classification performance of the SVM classifier is greatly enhanced. Experimental results show the increase on detection accuracy of the proposed algorithm for object detection in complex backgrounds with pose, scale, illumination variations and partial occlusions as well as the significant improvement on detection speed. Key words: Object detection; Binary Particle Swarm Optimization (BPSO); Support Vector Machine (SVM); Feature selection 引 言 目 标 检 测 是 目 标 识 别 系 统 中 的 核 心 技 术 之 一, 它 利 用 图 像 处 理 算 法 对 复 杂 场 景 中 的 目 标 进 行 自 动 检 测, 为 后 续 目 标 识 别 算 法 提 供 相 关 信 息 一 个 好 的 目 标 检 测 算 法 既 要 能 提 取 目 标 本 质 特 征, 并 考 虑 外 部 环 境 变 化 尺 度 差 异 和 局 部 遮 挡 等 方 面 因 素 对 目 标 外 观 的 影 响, 解 决 好 检 测 器 与 特 征 集 之 间 的 配 合 程 度, 准 确 区 分 目 标 和 非 目 标 ; 又 要 能 对 特 征 进 行 有 效 选 择, 在 尽 可 能 短 的 时 间 内 检 测 出 目 标, 提 200-03-8 收 到,200-09-0 改 回 国 家 自 然 科 学 基 金 (60805002, 90820009), 航 空 科 学 基 金 (2008069003), 东 南 大 学 优 秀 青 年 教 师 教 学 科 研 资 助 计 划 和 国 家 留 学 基 金 资 助 课 题 * 通 信 作 者 : 潘 泓 enhpan@seu.edu.cn 高 检 测 器 的 处 理 速 度 目 前, 目 标 检 测 方 法 可 分 为 两 大 类, 即 传 统 的 [,2] 基 于 知 识 和 图 像 分 割 的 目 标 检 测 及 基 于 统 计 学 习 [3 6] 的 目 标 检 测 前 者 先 对 图 像 进 行 预 处 理, 根 据 上 下 文 知 识 和 目 标 的 先 验 信 息 及 特 征 搜 索 图 像 中 感 兴 趣 区 域 (Region of Interest, ROI), 再 用 图 像 分 割 技 术 将 这 些 ROI 提 取 出 来 这 种 方 法 简 单 快 速, 对 [] [2] 建 筑 物 和 桥 梁 等 特 定 目 标 取 得 了 较 好 的 检 测 效 果 但 对 目 标 先 验 知 识 的 依 赖 性 很 强, 缺 乏 推 广 性, 在 复 杂 场 景 下 目 标 姿 态 变 化 或 被 遮 挡 时, 通 常 无 法 准 确 检 测 到 目 标 后 者 利 用 机 器 学 习 技 术 建 立 起 样 本 和 对 应 属 性 之 间 的 正 确 映 射, 根 据 映 射 关 系 判 断 新 样 本 的 属 性, 检 测 图 像 中 是 否 含 有 待 检 测 目 标 基 于 统 计 学 习 的 目 标 检 测 方 法 能 有 效 克 服 传 统 目 标
8 电 子 与 信 息 学 报 第 33 卷 检 测 方 法 的 缺 点, 尤 其 对 因 尺 度 姿 态 光 照 变 化 和 局 部 遮 挡 等 造 成 的 目 标 外 观 变 化 具 有 较 好 的 鲁 棒 性, 因 此 该 方 法 代 表 了 未 来 目 标 检 测 技 术 的 发 展 趋 势, 并 在 人 脸 检 测 [3,4] [5] [6] 行 人 检 测 和 车 辆 检 测 等 应 用 中 得 到 广 泛 应 用 过 去 研 究 主 要 集 中 在 有 效 特 征 提 取 和 分 类 器 设 计 上, 对 特 性 选 择 关 注 较 少, 而 特 征 选 择 正 是 机 器 学 习 算 法 的 核 心 问 题 多 数 基 于 统 计 学 习 的 目 标 检 测 方 法 直 接 提 取 目 标 的 原 始 特 征 送 入 分 类 器 训 练 并 识 别 由 于 原 始 特 征 中 包 含 大 量 冗 余 信 息 和 对 分 类 结 果 起 反 作 用 的 不 稳 定 特 征, 如 果 不 加 筛 选 直 接 使 用, 不 仅 大 大 削 弱 了 分 类 器 的 分 类 性 能, 还 增 加 了 特 征 维 数, 降 低 了 检 测 速 度 因 此, 改 进 方 法 是 从 原 始 特 征 集 合 中 选 出 最 能 够 反 映 目 标 特 性 的 稳 定 特 征 子 集 训 练 分 类 器 可 见, 特 征 选 择 对 最 终 检 测 结 果 起 着 十 分 重 要 的 作 用 针 对 目 标 检 测 中 的 特 征 选 择 问 题, 本 文 将 其 转 化 成 组 合 优 化 问 题, 利 用 二 值 粒 子 群 优 化 (Binary Particle Swarm Optimization,BPSO) 技 术 求 解 优 化 问 题 的 能 力, 结 合 支 持 向 量 机 (Support Vector Machine, SVM) 的 强 大 分 类 能 力, 提 出 了 一 种 新 颖 的 基 于 BPSO-SVM 自 动 目 标 检 测 算 法 该 算 法 的 创 新 性 在 于 将 BPSO 的 自 动 寻 优 能 力 用 于 特 征 选 择, 采 用 wrapper 特 征 选 择 模 型, 利 用 BPSO 在 特 征 空 间 中 搜 索 全 局 最 优 解, 将 SVM 分 类 结 果 作 为 适 应 度 函 数, 检 验 BPSO 选 择 的 特 征 组 合 的 分 类 性 能, 并 动 态 调 整 特 征 组 合 得 到 最 优 分 类 特 征 集 通 过 对 复 杂 场 景 下 车 辆 检 测 结 果 表 明, 本 文 算 法 有 效 提 高 了 检 测 准 确 率, 大 大 加 快 了 检 测 速 度 2 算 法 描 述 图 给 出 了 本 文 算 法 的 框 架 图 提 取 图 像 关 键 处 SIF (Scale-Invariant Feature ransform) 描 述 子 作 为 图 像 特 征, 送 入 BPSO-SVM 特 征 选 择 模 块 选 取 最 优 分 类 特 征 集, 进 行 目 标 检 测 SVM 分 类 器 采 用 5-fold 交 叉 验 证 方 式 进 行 训 练 图 基 于 BPSO-SVM 特 征 选 择 的 目 标 检 测 算 法 框 架 图 2. 特 征 提 取 [7] SIF 算 子 是 一 种 对 图 像 仿 射 变 换 光 照 变 化 3 维 投 影 变 换 具 有 不 变 性, 对 噪 声 局 部 遮 挡 具 有 较 好 鲁 棒 性 的 局 部 特 征 描 述 子 SIF 算 法 通 过 搜 索 尺 度 空 间 中 DOG 图 像 的 极 值 点, 排 除 由 噪 声 引 起 的 极 值 点 和 不 稳 定 极 值 点 后, 得 到 图 像 中 关 键 点 及 其 位 置 和 尺 度 信 息 对 每 个 关 键 点, 计 算 其 附 近 邻 域 内 每 个 点 的 梯 度 方 向 和 模 值, 统 计 所 有 点 的 梯 度 方 向, 得 到 方 向 直 方 图, 并 用 模 值 加 权 后, 将 直 方 图 中 最 大 值 对 应 的 方 向 赋 予 该 关 键 点, 这 样 就 得 到 具 有 仿 射 不 变 性 的 含 28 维 特 征 向 量 的 SIF 描 述 子 对 每 个 关 键 点, 我 们 提 取 该 点 7 7 邻 域 内 每 点 的 SIF 描 述 子 作 为 特 征 描 述, 得 到 原 始 特 征 集 这 样, 每 个 关 键 点 提 取 了 49 个 SIF 特 征 ( 共 6272 维 ), 若 图 像 中 含 有 K 个 关 键 点, 则 整 幅 图 像 的 特 征 维 数 =K 6272 可 见, 如 此 高 维 的 特 征 集 合 极 大 地 增 加 了 分 类 器 的 计 算 量, 因 此 有 必 要 对 其 进 行 特 征 选 择, 以 降 低 特 征 维 数 并 选 取 最 优 特 征 组 合 进 行 目 标 检 测 2.2 特 征 选 择 本 文 提 出 的 BPSO-SVM 算 法 采 用 wrapper 特 征 选 择 模 型, 利 用 BPSO 的 自 动 寻 优 能 力 在 特 征 空 间 中 进 行 全 局 搜 索, 得 到 不 同 特 征 组 合 根 据 SVM 分 类 结 果 判 断 这 些 特 征 组 合 的 分 类 性 能, 并 不 断 更 新 选 取 的 特 征 集, 直 至 搜 索 到 取 得 最 佳 分 类 结 果 的 特 征 组 合 在 整 个 特 征 选 择 过 程 中, 粒 子 群 优 化 (Particle Swarm Optimization,PSO) 算 法 起 了 十 分 重 要 的 作 用, 与 神 经 网 络 遗 传 算 法 等 优 化 算 法 相 比,PSO 具 有 所 需 确 定 的 参 数 较 少, 收 敛 速 度 更 快 等 优 点 与 顺 序 选 择 算 法 等 常 用 特 征 选 择 方 法 相 比,PSO 不 易 陷 入 局 部 极 值, 能 得 到 全 局 最 优 解 2.2. 粒 子 群 优 化 (PSO) 算 法 PSO [8,9] 算 法 是 一 种 基 于 群 体 智 能 的 进 化 计 算 技 术 PSO 求 解 优 化 问 题 时, 群 体 中 每 个 粒 子 的 位 置 代 表 一 个 可 能 的 解 所 有 粒 子 都 有 自 己 的 位 置 速 度 和 一 个 由 适 应 度 函 数 决 定 的 适 应 值 来 评 价 当 前 解 的 好 坏 每 个 粒 子 根 据 自 身 记 忆 和 群 体 知 识 搜 索 整 个 解 空 间, 通 过 迭 代 方 式 寻 找 并 收 敛 到 最 优 解 迭 代 开 始 时, 所 有 粒 子 的 初 始 位 置 随 机 分 布 在 整 个 解 空 间 中, 迭 代 过 程 中, 每 个 粒 子 根 据 自 己 发 现 过 的 最 优 位 置 pbest 和 整 个 群 体 已 找 到 的 最 优 点 gbest 来 更 新 当 前 飞 行 速 度 和 位 置 随 着 迭 代 的 进 行, 整 个 群 体 逐 渐 向 最 优 解 位 置 逼 近 若 解 空 间 为 D 维, 在 第 n 次 迭 代 时, 群 体 中 第 i 个 粒 子 的 位 置 表 示 为 X n [ n, n 2,, n i = xi xi xid], 速 度 表 示 为 V n [ n, n 2,, n i = vi vi vid] 第 i 个 粒 子 对 应 的 自 身 最 优 点 pbest 表 示 为 P = [ p, p,, p ], i i i2 id
第 期 潘 泓 等 : 一 种 基 于 二 值 粒 子 群 优 化 和 支 持 向 量 机 的 目 标 检 测 算 法 9 整 个 群 体 已 找 到 的 最 优 点 gbest 表 示 为 P g = [ pg, pg2,, pgd ] 如 式 (), 式 (2) 所 示, 每 次 迭 代 时, 所 有 粒 子 通 过 跟 踪 两 个 最 优 点 P i 和 P g 来 更 新 自 己 的 速 度 和 位 置 n n n n v + = wv + c r ( p x ) + c r ( p x ) () id id id id 22 pd id n id id id x = x + v (2) 其 中 n 表 示 迭 代 次 数 ;i.=,2,,p, P 为 群 体 中 粒 子 总 数 ;d=,2,,d; w>0 是 惯 性 因 子 ;c >0, c 2 >0 分 别 用 来 调 整 P i 和 P g 对 速 度 影 响 的 权 重 r 和 r 2 是 区 间 [0,] 内 的 随 机 数 粒 子 在 每 一 维 的 飞 行 速 度 不 能 超 过 算 法 设 定 的 最 大 速 度 v max 式 () 表 明 粒 子 的 移 动 速 度 由 3 个 因 素 共 同 确 定, 即 当 前 速 度, 当 前 位 置 和 个 体 最 佳 位 置 的 偏 移 量 以 及 当 前 位 置 与 群 体 最 佳 位 置 的 偏 移 量 可 见, 粒 子 就 是 通 过 自 己 和 同 伴 中 最 好 的 经 验 来 决 定 下 一 步 的 运 动 随 着 迭 代 进 化 的 不 断 进 行, 粒 子 群 逐 渐 聚 集 到 最 优 点 处 2.2.2 基 于 BPSO-SVM 的 特 征 选 择 如 果 将 整 个 特 征 空 间 看 作 解 空 间, 不 同 特 征 组 合 看 作 解 空 间 中 不 同 位 置 处 的 粒 子, 粒 子 中 各 位 置 分 量 取 值 对 应 特 征 组 合 中 各 特 征 分 量 的 状 态, 则 可 利 用 PSO 算 法 进 行 特 征 选 择 由 于 一 种 特 征 组 合 中 单 个 特 征 分 量 的 状 态 只 能 取 两 种 : 选 中 ( 状 态 为 ) 和 丢 弃 ( 状 态 为 0), 因 此,PSO 算 法 需 要 从 实 数 空 间 推 广 至 二 值 空 间, 得 到 二 值 粒 子 群 优 化 算 法 (BPSO) [9] 在 BPSO 中, 每 个 粒 子 的 位 置 表 示 为 一 组 二 值 符 号 序 列, 如 第 i 个 粒 子 的 位 置 x i 可 表 示 为 x i,x i2,x id,x id,(d=,2,, D, x id ={0,}), 其 中, 粒 子 空 间 维 数 D 由 原 始 特 征 集 维 数 决 定 BPSO-SVM 算 法 中, 某 个 粒 子 的 位 置 矢 量 决 定 了 某 种 特 征 子 集 的 组 合 方 式, 而 整 个 群 体 最 优 点 P g 确 定 了 系 统 的 最 优 特 征 组 合 适 应 度 函 数 F 指 导 粒 子 群 搜 索 方 向, 特 性 选 择 的 目 的 是 使 用 尽 可 能 少 的 特 征 得 到 相 同 或 更 优 的 分 类 性 能, 因 此, 适 应 度 函 数 需 要 综 合 考 虑 分 类 准 确 性 (accuracy) 和 特 征 维 数 (feature_dim) 本 文 中 所 取 的 适 应 度 函 数 F 如 式 (3) 所 示 F = Accuracy + (3) 2 2 Feature_dim 表 给 出 了 基 于 BPSO-SVM 算 法 的 特 征 选 择 过 程 首 先, 初 始 化 粒 子 群, 设 置 粒 子 个 数 P, 粒 子 的 最 小 和 最 大 飞 行 速 度 V min, V max 随 机 生 成 各 粒 子 的 初 始 位 置 和 速 度 由 粒 子 初 始 位 置, 确 定 相 应 特 征 组 合, 送 入 SVM 分 类 器 得 到 识 别 率, 由 式 (4) 计 算 该 粒 子 适 应 度 函 数 根 据 所 有 粒 子 的 适 应 度 函 数, 选 出 个 体 最 优 值 P i 和 群 体 最 优 值 P g 每 次 循 环 时, 确 定 是 否 更 新 P i 和 P g, 并 按 式 (4) 更 新 每 个 粒 子 的 速 度 和 位 置 每 一 轮 迭 代 中 选 择 的 特 征 分 量 由 式 (4) 所 示 的 S 函 数 和 粒 子 速 度 v id 确 定, 当 S(v id ) 大 于 [0,] 之 间 的 某 个 随 机 数 r 时,x id 被 设 为, 表 示 第 i 个 特 征 组 合 中 的 第 d 维 特 征 分 量 被 选 中 进 行 下 一 轮 迭 代 ; 否 则,x id 被 设 为 0, 表 示 第 i 个 特 征 组 合 中 的 第 d 维 特 征 分 量 在 下 一 轮 迭 代 中 被 丢 弃 整 个 迭 代 过 程 一 直 进 行 下 去, 直 到 迭 代 次 数 达 到 最 大 迭 代 次 数 N 或 粒 子 适 应 值 达 到 阈 值 h, 停 止 迭 代 这 时 群 体 最 佳 位 置 P g 中 p gd =(d =,2,,D) 处 所 对 应 的 特 征 组 成 了 最 优 分 类 特 征 集 n n n vid = wvid + c r ( pid xid ) + c22 r ( pgd x ) id if vid ( Vmin, Vmax) then vid = max{min( Vmax, vid ), Vmin} (4) Sv ( id ) = vid + e f ( r < S( vid )), then xid = ; else xid = 0 表 基 于 BPSO-SVM 算 法 的 特 征 选 择 过 程 初 始 化 粒 子 位 置 和 速 度, 设 定 粒 子 数 量 P, 最 小 和 最 大 飞 行 速 度 V min,v max, 最 大 迭 代 次 数 N, 适 应 度 函 数 阈 值 h, 计 算 每 个 粒 子 适 应 度 函 数 F, 初 始 化 P i 和 P g, 初 始 化 迭 代 次 数 n=0 2 For i = to P If F(x i ) > F(P i ) P i = x i If F(x i ) > F(P g ) P g = x i 3 For i = to P For d = to D 根 据 式 (4) 更 新 每 个 粒 子 的 速 度 v id 和 位 置 x id n = n + 4 For i = to P If (l < N) and (F(x i ) < h) 返 回 2 Else 停 止 迭 代, 输 出 群 体 最 佳 位 置 P g 和 F(P g ) 3 实 验 结 果 和 分 析 本 节 用 提 出 的 基 于 BPSO-SVM 特 征 选 择 的 目 标 检 测 算 法 探 测 复 杂 场 景 下 的 汽 车 目 标 为 验 证 算 法 的 检 测 性 能, 本 文 比 较 了 不 进 行 特 征 选 择, 直 接 用 原 始 特 征 集 ( 表 2 所 示 的 FULL 一 列 ) 进 行 目 标 检 测 使 用 PCA 算 法 顺 序 前 向 搜 索 (SFS) 算 法 和 BPSO-SVM 算 法 分 别 进 行 特 征 选 择 的 目 标 检 测 方 案 还 比 较 了 不 同 特 征 描 述 子 对 检 测 性 能 的 影 响, 实 验 中 用 到 的 特 征 描 述 方 法 包 括 灰 度 特 征 (INEN) Haar 小 波 特 征 (HAAR) 和 SIF 特 征 将 不 同 特 征 选 择 方 法 和 特 征 空 间 组 合 起 来, 一 共 得 到 表 2 所 列 的 2 种 不 同 的 特 征 集
20 电 子 与 信 息 学 报 第 33 卷 表 2 实 验 中 用 到 的 2 种 特 征 集 FULL SFS PCA BPSO-SVM 灰 度 特 征 INEN-FULL INEN-SFS INEN-PCA INEN-BPSO-SVM Haar 小 波 特 征 HAAR-FULL HAAR-SFS HAAR-PCA HAAR-BPSO-SVM SIF 特 征 SIF-FULL SIF-SFS SIF-PCA SIF-BPSO-SVM 所 有 分 类 器 都 使 用 SVM 分 类 器, 核 函 数 采 用 高 斯 径 向 基 函 数 K(x,y) = exp(- β x-y 2 ) 经 过 多 次 实 验, 我 们 发 现 当 β =0.7 时 SVM 分 类 结 果 最 好 实 验 中,BSPO 算 法 的 参 数 设 置 如 下 :w=, c =c 2 =2, N=00, h = 0.9, V min = -6, V max = 6 实 验 中 用 到 的 数 据 来 自 UIUC car database [0], 该 数 据 库 由 一 个 训 练 集 和 两 个 测 试 集 组 成, 训 练 集 包 括 550 幅 含 汽 车 目 标 的 正 样 本 图 像 和 500 幅 不 含 汽 车 的 负 样 本 图 像, 所 有 训 练 集 图 像 大 小 为 00 40 两 个 测 试 集 为 Single-Scale 测 试 集 和 Multi-Scale 测 试 集, 分 别 用 来 测 试 单 一 尺 度 和 多 尺 度 下 算 法 的 检 测 性 能, 其 中 Single-Scale 测 试 集 中 目 标 大 小 和 训 练 集 中 目 标 大 小 基 本 相 同, 而 Multi-Scale 测 试 集 中 汽 车 大 小 是 训 练 集 中 目 标 大 小 的 0.8~2 倍 所 有 测 试 集 图 像 都 未 在 训 练 集 中 出 现 过 本 文 采 用 5-fold 交 叉 验 证 方 式 训 练 分 类 器, 取 5 次 SVM 分 类 结 果 的 平 均 值, 作 为 分 类 器 的 检 测 准 确 率 对 Single- Scale 测 试 集, 用 大 小 为 00 40 的 窗 口 在 图 像 中 滑 动, 检 测 每 个 窗 口 中 关 键 点, 提 取 关 键 点 附 近 邻 域 的 各 种 特 征 描 述 子 作 为 原 始 特 征 集, 由 不 同 特 征 选 择 算 法 得 到 相 应 的 分 类 特 征 集, 送 入 SVM 分 类 器 判 断 窗 口 中 是 否 含 有 待 检 目 标 对 Multi-Scale 测 试 集, 先 对 测 试 图 像 进 行 尺 度 变 换, 得 到 一 组 不 同 尺 度 级 图 像, 对 每 个 尺 度 级 图 像 再 分 别 采 用 上 述 方 法 进 行 目 标 检 测 在 所 有 基 于 PCA 特 征 选 择 的 算 法 中, 取 前 50 维 特 征 分 量 作 为 最 优 特 征 集 分 别 采 用 ROC 曲 线 PR (Precision-Recall) 曲 线 和 EER 指 标 来 比 较 不 同 特 征 选 择 算 法 和 特 征 描 述 子 的 检 测 性 能 图 2(a),2(b) 给 出 了 不 同 特 征 集 在 Single-Scale 测 试 集 上 的 ROC 曲 线 由 ROC 曲 线 可 见, 使 用 特 征 选 择 模 块 去 除 冗 余 不 稳 定 特 征 后, 检 测 算 法 的 性 能 得 到 了 明 显 提 升 与 不 采 用 特 征 选 择 的 方 法 相 比, 基 于 PCA 基 于 SFS 和 基 于 BPSO-SVM 的 特 征 选 择 算 法 的 检 测 准 确 率 分 别 提 高 了 8.0%, 2.428% 和 6.649% 此 外, 不 管 使 用 何 种 特 征 描 述 子, 本 文 提 出 的 基 于 BPSO-SVM 特 征 选 择 的 目 标 检 测 算 法 都 取 得 了 最 好 的 检 测 结 果 这 是 由 于 BPSO 在 搜 索 过 程 中 结 合 了 个 体 经 验 和 群 体 智 能, 因 此 能 很 快 找 到 全 局 最 优 特 征, 而 SFS 采 用 顺 序 搜 索 策 略, 容 易 陷 入 局 部 最 优 解 对 于 PCA 算 法, 它 可 以 得 到 重 构 意 义 上 的 最 优 特 征 集, 但 对 于 分 类 而 言, 重 构 误 差 最 小 的 特 征 组 合 未 必 是 最 优 分 类 特 征 集 在 各 种 特 征 描 述 方 法 中, SIF 描 述 子 始 终 显 示 了 最 好 的 检 测 性 能, 这 也 验 证 了 SIF 描 述 子 对 尺 度 旋 转 仿 射 变 换 的 不 变 性 和 对 噪 声 光 照 变 化 及 局 部 遮 挡 的 鲁 棒 性 图 2(c) 比 较 了 本 文 算 法 和 其 它 算 法 在 Multi-Scale 测 试 集 上 的 PR 曲 线 结 果 显 示, 本 文 提 出 的 基 于 SIF-BPSO-SVM 方 法 的 检 测 性 能 较 文 献 [6] 和 文 献 [] 提 出 的 算 法 有 较 大 改 进,EER 分 别 提 高 了 54% 和 7.6% 表 3 比 较 了 各 种 算 法 在 两 个 测 试 集 上 的 EER 指 标 在 Multi-Scale 测 试 集 上, 本 文 算 法 EER 达 到 94.96%, 显 著 高 于 其 它 算 法 在 Single-Scale 测 试 集 上, 本 文 算 法 仅 次 于 文 献 [2] 结 果, 但 文 献 [2] 算 法 复 杂 度 太 高, 检 测 时 间 较 长 表 3 本 文 算 法 与 其 它 算 法 在 两 个 测 试 集 上 的 EER 比 较 算 法 Single-Scale 测 试 集 Multi-Scale 测 试 集 文 献 [6] 77% 40% 文 献 [] / 87.8% 文 献 [2] 99.94% 90.6% 本 文 算 法 97.54% 94.96% 图 2 采 用 不 同 特 征 集 和 不 同 算 法 在 两 个 测 试 集 上 得 到 的 ROC 曲 线 和 PR 曲 线
第 期 潘 泓 等 : 一 种 基 于 二 值 粒 子 群 优 化 和 支 持 向 量 机 的 目 标 检 测 算 法 2 图 3 本 文 算 法 对 部 分 测 试 图 像 的 检 测 结 果 图 3 给 出 了 部 分 检 测 结 果 不 论 是 目 标 局 部 被 遮 挡 尺 度 变 化 较 大 目 标 与 背 景 灰 度 相 近 或 是 由 于 光 照 原 因 导 致 目 标 灰 度 不 均 匀, 本 文 算 法 均 能 准 确 检 测 到 目 标 位 置 这 表 明 在 实 际 检 测 时 BPSO- SVM 算 法 能 有 效 检 测 到 不 同 姿 态 尺 度 和 被 遮 挡 情 况 下 的 目 标 检 测 时 间 方 面, 在 Pentium-IV.6 GHz CPU 机 器 上, 本 文 算 法 对 Single-Scale 和 Multi- Scale 测 试 集 中 一 幅 图 像 的 平 均 检 测 时 间 分 别 为 500 ms 和 930 ms, 相 比 不 通 过 特 征 选 择 直 接 进 行 目 标 检 测 的 算 法, 检 测 速 度 分 别 提 高 了 95.77% 和 69.46% 4 结 论 针 对 复 杂 场 景 下 目 标 检 测 和 目 标 检 测 中 特 征 选 择 问 题, 本 文 提 出 了 一 种 基 于 BPSO-SVM 特 征 选 择 的 自 动 目 标 检 测 算 法 该 算 法 将 目 标 检 测 转 化 为 目 标 识 别 问 题, 提 取 目 标 SIF 描 述 子 作 为 特 征, 以 SVM 为 分 类 器, 根 据 分 类 结 果, 利 用 BPSO 算 法 在 样 本 特 征 空 间 中 进 行 全 局 搜 索, 动 态 更 新 并 选 择 最 优 分 类 特 征 集 进 行 目 标 检 测 实 验 结 果 表 明, 基 于 BPSO-SVM 的 特 征 选 择 方 法 不 仅 降 低 了 特 征 维 数, 有 效 提 高 了 分 类 器 的 检 测 精 度, 还 显 著 加 快 了 检 测 速 度 与 传 统 目 标 检 测 方 法 相 比, 本 文 提 出 的 目 标 检 测 算 法 较 好 地 解 决 了 目 标 在 姿 态 尺 度 光 照 变 化 及 局 部 遮 挡 情 况 下 的 检 测 问 题 参 考 文 献 [] Akcay G and Aksoy S. Automatic detection of geospatial objects using multiple hierarchical segmentations[j]. IEEE ransaction on Geoscience and Remote Sensing, 2008, 46(7): 2097-2. [2] Chaudhuri D and Samal A. An automatic bridge detection technique for multispectral images[j]. IEEE ransaction on Geoscience and Remote Sensing, 2008, 46(9): 2720-2727. [3] Viola P and Jones M J. Robust real-time face detection[j]. International Journal of Computer Vision, 2004, 57(2): 37-54. [4] Vilaplana V, Marques F, and Salembier P. Binary partition trees for object detection[j]. IEEE ransaction on Image Processing, 2008, 7(): 220-226. [5] Dalal N and riggs B. Histograms of oriented gradients for human detection[c]. Proc. IEEE International Conference on Computer Vision and Pattern Recognition, San Diego, CA, USA, Jun.20-25, 2005: 886-893. [6] Agarwal S, Awan A, and Roth D. Learning to detect objects in image via s sparse, part-based representation[j], IEEE ransaction on Pattern Analysis and Machine Intelligence, 2004, 26(): 475-490. [7] Lowe D G. Distinctive image features from scale-invariant keypoints[j]. International Journal of Computer Vision, 2004, 60(2): 9-0. [8] Kennedy J and Eberhart R C. Particle swarm optimization[c]. Proc. IEEE International Conference on Neutral Networks, Perth, Australia, Nov.27-Dec., 995: 942-948. [9] Kennedy J and Eberhart R C. A discrete binary version of the particle swarm algorithm[c]. Proceeding of IEEE International Conference on Systems, Man, and Cybernetics, Washington, USA, Oct.2-5, 997: 404-409. [0] UIUC Car dataset, website: http://l2r.cs.uiuc.edu/~cogcomp /Data/Car/, 2004. [] Fritz M, et al.. Integrating representative and discriminant model for object category detection[c]. Proceeding of IEEE International Conference on Computer Vision, Beijing, China, Jun. 20-26, 2005, (2): 363-370. [2] Mutch J and Lowe D G. Object class recognition and localization using sparse features with limited receptive fields [J]. International Journal of Computer Vision, 2008, 80(): 45-57. 潘 泓 : 男,974 年 生, 博 士, 副 教 授, 研 究 领 域 为 模 式 识 别 机 器 学 习 计 算 机 视 觉 多 媒 体 信 号 处 理. 李 晓 兵 : 男,967 年 生, 博 士 生, 研 究 领 域 为 自 动 目 标 识 别 计 算 机 视 觉. 金 立 左 : 男,972 年 生, 博 士, 副 教 授, 研 究 领 域 为 模 式 识 别 目 标 检 测 识 别 及 跟 踪 机 器 学 习 计 算 机 视 觉 多 媒 体 信 号 处 理. 夏 良 正 : 男,942 年 生, 教 授, 博 士 生 导 师, 研 究 领 域 为 图 像 处 理 计 算 机 视 觉 数 字 视 频 处 理 自 动 目 标 识 别.