实验室研究方向

Similar documents
视频场景重建的流程 运动恢复结构 深度恢复 三维重建

2, : 257,, ; Pollefeys [4 ],,,,, ; [526 ],, ; Snavely [728 ], (500 ),,, EXIF, EXIF,, 2, ; Pollefeys [9 ],,,, (3),,,. X = [ X Y Z ] T, x = [ x y ] T, x

40 8 Vol. 40, No ACTA AUTOMATICA SINICA August, ,,,.,.,,,.,.,,,.,,,. DOI,, L-M (Levenberg-Marquardt),,,.., 2014, 40(8):

Journal of Northwestern Polytechnical University Apr. Vol No. 2 ICM ICM ICM ICM ICM ICM TP A

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

(Pattern Recognition) 1 1. CCD

Microsoft Word - scribe_1_.doc

JOURNAL OF APPLIED SCIENCES Electronics and Information Engineering Vol. 28 No. 6 Nov DOI: /j.issn

清 潔 機 器 人 覆 蓋 率 分 析 之 研 究 A Study of Coverage Analysis for Cleaning Robot 研 究 生 : 林 育 昇 撰 指 導 教 授 : 陳 智 勇 博 士 樹 德 科 技 大 學 電 腦 與 通 訊 研 究 所 碩 士 論 文 A Th

70 Harris SIFT Harris SIFT HSV hue saturation value Harris SIFT RGB red green blue HSV 11 1 if α I v x y B v x y β shadow x y = 1 &I s x y - B s x y t


1 引言

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

Cinemagraph 透 過 網 路 社 群 在 近 幾 年 迅 速 引 起 網 路 使 用 者 們 的 注 意 與 回 響, 儼 然 成 為 網 路 視 覺 設 計 的 新 潮 流 雖 然 Cinemagraph 目 前 在 廣 告 界 還 不 盛 行, 大 部 分 網 路 行 銷 的 動 態

92 湖 南 工 业 大 学 学 报 2014 年 基 于 特 征 的 方 法 是 现 今 图 像 匹 配 的 主 要 研 究 与 发 展 方 向 这 种 匹 配 方 法 的 原 理 是, 寻 找 待 处 理 图 像 某 区 域 中 的 特 征 点 或 者 关 键 点, 在 计 算 特 征 点 周

P(x,y) P(x-1,y) P(x,y-1) P(x,y+1) P(x+1,y) Sobel LaplacePrewittRoberts Sobel [2] Sobel [6] 0 1 1: P(x,y) t (4-connectivity) 2: P(x,y) t 3:

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 研 究 方 向 数 据 处 理 近 三 年 来

Microsoft Word - KSAE06-S0262.doc

soturon.dvi

Sep (SCI) 10. Jiann-Ming Wu, Annealing by two sets of interactive dynamics, IEEE Trans. on Systems Man and Cybernetics Part B-Cybernetics 34 (3)

Improved Preimage Attacks on AES-like Hash Functions: Applications to Whirlpool and Grøstl

Microsoft PowerPoint SSBSE .ppt [Modo de Compatibilidade]

穨control.PDF

2 139 Hough (R, T ) [5] Hough. Fourier-Mellin. Fourier Fourier- Mellin (R, T ) Hausdorff ICP T. 2 3 Hough 4 Fourier-Mellin [2, 3] P 1, P

Welch & Bishop, [Kalman60] [Maybeck79] [Sorenson70] [Gelb74, Grewal93, Maybeck79, Lewis86, Brown92, Jacobs93] x R n x k = Ax k 1 + Bu k 1 + w

标题

1,: 69, 36, Groebner [2] 3 {x 1,x 2,,x m } 2 m,, π11,π12,,πm 1,πm 2, ( x 3, ) ;, π11 烄 T 烌烄 (1,0,-x 1 )P 1 烌 LM(Levenberg-Marquardt) π12 T (1,0,-y1)P

COCO18-DensePose-BUPT-PRIV

标题

68 ( ) 2006,,,,,,,,,, (narrative history),,, [1 ] (P ),,,,,,, [ 2 ] ( P ), ;,,,,,,,,,,,,,, (1917),, 30,,,, :,, ;,,,,, ( ) ( ), :,,,,,,,,,,

Dan Buettner / /

永遠的革新號--側論《筆匯》遺漏在文學史上的密碼

VASP应用运行优化

傳 播 與 管 理 研 究 第 四 卷 第 二 期 壹 研 究 背 景 與 研 究 目 的 貳 文 獻 探 討 58

108 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract To satisfy the audiences' pursuing of image realism and content imagination, the combination of live footage

<4D F736F F D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>


Microsoft Word doc

Microsoft PowerPoint - NCBA_Cattlemens_College_Darrh_B

The Development of Color Constancy and Calibration System

, :., (Scale-invariant feature transform, SIFT) [2] (Speeded up robust features, SURF) [3],.,, (Principal component analysis-sift, PCA- SIFT) [


MAXQ BA ( ) / 20

System Design and Setup of a Robot to Pass over Steps Abstract In the research, one special type of robots that can pass over steps is designed and se

PowerPoint 演示文稿

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

Microsoft Word - 18-p0402-c3.doc

<4D F736F F D20ABCAADB1A142A5D8BFFDBB50A4A4AD5EBA4BAD6E2E646F63>

Microsoft PowerPoint - ATF2015.ppt [相容模式]

摘要

綠色產業、生活風格與健康論述:有機食品消費之社會文化分析

紀智超碩士論文.PDF

Microsoft Word - 11月電子報1130.doc

Microsoft Word - 00-巻頭言.doc

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

系統功能語言的理論及其在國小國語讀寫教學的應用

效 率 的 評 估 準 則 1.1 研 究 動 機 和 背 景 常 見 於 數 位 相 機 的 自 動 對 焦 系 統, 分 為 主 動 式 和 被 動 式 自 動 對 焦 兩 種 技 術 主 動 式 對 焦 系 統, 必 需 藉 助 測 量 距 離 裝 置 主 動 元 件, 測 量 拍 攝 物 體

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

˘ªF¶Î

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

untitled

27 10 Vol. 27 No , : Oct., 2015 [4,6-7] [3,5,8-10] [1] [11-13] [7] [14] [15-16] 1 [17] [18] Loading v

Microsoft Word 孙丰-作者校.doc

72 (2001) group waves. Key words: Correlation coefficient for consecutive wave heights, mean run length (1993) (1996) (1998) (1999) (1993) (

34 www. cjig. cn wavelet transform 1 2 JPEG LIVE E s o = 1 T Σ log 2 C s o + 1 E T C s o Lu Wen contourlet C 0 7 N

2/80 2

基于分段化结构重建的2D/3D转换技术

(6-1) (6-2) (6-3)

1 : 29, ;,. 1., ;,,, ;, ( ) ( ), ( ) ;, (Support vector machine, SVM)., ( ) ( ) [11].,,, L-K [15 16] ,. 2 Fig. 2 Schematic diagram of e

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

Microsoft Word - ED-774.docx

RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

Stochastic Processes (XI) Hanjun Zhang School of Mathematics and Computational Science, Xiangtan University 508 YiFu Lou talk 06/

穨 PDF

穨2-06.doc

Oracle Database 10g: SQL (OCE) 的第一堂課

2006中國文學研究範本檔

United Nations ~ ~ % 2010

Microsoft Word doc

,.,, [9] Harris, Hausdorff, ; [10],,,. [11],,,,,., [12 13] ; [14], ;,,.,,., ( ), [15 17],. Tsang [15],,,. Tsang [16] (Simple genetic algorithm

國立中山大學學位論文典藏.PDF

5 / ~

Wuhan Textile University M. A. S Dissertation Emotional Design of Home Textile Based on the Chinese Traditional Culture Wedding Bedding for Example Ca

关于2007年硕士研究生培养方案修订几点要求的说明

8 戲劇學刊 The Interrelation between Peking opera and Modern Drama in Shanghai during the Isolated Island Period: Two Different Kinds of MingmoYihen and t

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

Z-I A b Z-I A b Z Z-I A A b Z-I Miller [5] Z i I i Z-I [6] Z-I Z-I Z-I Z-I Z I Wilson [7] 1970 [8] [9] 20.32% Sasaki [10] Nino- miya [11] [12]


I

(Microsoft PowerPoint - UML\302\262\244\266_use case.ppt)

<4D F736F F D20B3C2B9FAD5D7C2DBCEC4C5C5B0E62E646F63>

《红楼梦》中茗烟与李贵的对比分析

:,,,,,, :,,,,,,,, (, 2007), ( Scott, 1985),,,,,,, : :,, ;, (L i & OgB rien, 1996) (policy2based resistance) ( rightful resistance),,,,, 35


A Dissertation Submitted to Zhejiang University in partial fulfillment of the requirements for the degree of Bachelor of Engineering TITLE Markerless

Microsoft Word - 104蔡孟珍.doc

<4D F736F F D D312DC2B2B4C2AB47A16DC5AAAED1B0F3B5AAB0DDA144A7B5B867A16EB2A4B1B4A277A548AED1A4A4BEC7A5CDB0DDC344ACB0A8D2>

untitled

A dissertation for Master s degree Metro Indoor Coverage Systems Analysis And Design Author s Name: Sheng Hailiang speciality: Supervisor:Prof.Li Hui,

Transcription:

多视图几何与 运动恢复结构 章国锋 浙江大学 CAD&CG 国家重点实验室

视频场景重建的流程 运动恢复结构 深度恢复 三维重建

针孔相机模型 投影方程 : 齐次坐标表示 : Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

1 0 1 0 1 0 1 1 Z Y X f f Z fy fx 针孔相机模型 K [R t] Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

主点的偏移 1 0 1 0 0 ~ 1 / / 0 0 0 0 0 0 Z Y X y f x f Z Zy fy Zx fx y Z fy x Z fx Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

相机的外部参数 Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

透视相机模型 K f x x 0 f y cy 0 s 0 c 1 P K R t 11 DoF (5+3+3)

径向畸变 比如鱼眼镜头 : 数学模型 : R R 2 2 2 2 2 ( x, y) (1 K ( x y ) K ( x y )...) x 1 2 y (Marc Pollefeys)

径向畸变矫正例子 (Marc Pollefeys)

Multi-View Geometry Structure-from-Motion Automatically recover the camera parameters and 3D structure from multiple images or video sequences. Noah Snavely, Steven M. Seitz, Richard Szeliski. "Photo tourism: Exploring photo collections in 3D". 2016.

Two-View Geometry 3D???

Two-View Geometry 3D???

Two-View Geometry 3D: Epipolar Geometry

极线几何

基础矩阵 只跟两个视图的相对相机姿态和内参有关 F 是一个 3 3 秩为 2 的矩阵 Fe = 0 7 个自由度 最少 7 对匹配点就可以求解 F 七点法八点法 K [ t T 2 ] RK 1 1 OpenCV: cvfindfundamentalmat()

八点法求解基础矩阵 根据对极几何关系, 基本矩阵 F 满足 若设 那么对极几何关系又可以写作 : 若存在 n 对对应点,F 应满足如下的线性系统 :

八点法求解基础矩阵 f 为 9 维向量, 若要有解,rank(A) 至多为 8 在 rank(a) = 8 时,f 的方向是唯一的 通过至少 8 对对应点, 可恰好得到使 f 方向唯一的 A f 为 A 的右零空间的基向量, 可用 svd(a) 求得 真实数据存在噪音, 大于 8 组对应点得到的 A 满秩即 rank(a) = 9 此时同样可计算 (U,Σ,V) = svd(a) 令 f 为 V 中对应最小奇异值的列向量

多视图几何 投影函数

Structure from Motion Pipeline Feature Tracking Obtain a set of feature tracks Structure from Motion Solve the camera parameters and 3D points of tracks

图像特征 图像中显著 容易区分和匹配的内容 不变性 点角点线 : 直线, 曲线, 边 : 二维边, 三维边形状 : 长方形, 圆, 椭圆, 球, 纹理 视角不变 ( 尺度, 方向, 平移 ) 光照不变 物体变形 部分遮挡

Harris 角点检测 核心思想 : 统计图像梯度的分布 平滑区域 : 梯度不明显 边缘区域 : 梯度明显, 方向一致 角落区域 : 梯度明显, 方向不一致 方法 : 计算像素邻域的梯度二阶矩 计算上述矩阵的角点响应指标 对 R 进行阈值过滤和非极大值抑制

FAST 通过直接的阈值和判断来加速角点提取 考虑中心点周围的 16 个像素, 设中心点亮度为 p 如果有连续 n 个像素亮度都大于 p+t, 或者都小于 p-t ( 如图中的 14~16, 1 ~ 6) 检查 1 5 9 13 四个位置, 如果是角点, 四个位置中应当有三个满足上面的条件 速度快, 但对噪音不鲁棒 Edward Rosten, Tom Drummond. Machine Learning for High-Speed Corner Detection. ECCV (1) 2006: 430-443.

SIFT Scale-Invariant Feature Transform SIFT 通过在不同级别的图像 DoG 上寻找极大 / 极小值来确定特征的位置和对应的尺度, 后续的特征提取在与其尺度最邻近的图像 DoG 上进行 这使它有良好的尺度不变性 David G. Lowe.Distinctive Image Features from Scale-Invariant Keypoints. International Journal of Computer Vision 60(2): 91-110 (2004).

More Invariant Features SIFT 之后陆续出现了各种尺度不变特征描述量提取算法 如 RIFT GLOH SURF 等 其中 SURF 性能上接近 SIFT SURF 使用了 Haar 小波卷积替代 SIFT 中的高斯核 用积分图像进行了加速, 使得计算速度达到 SIFT 的 3~7 倍 ORB 由于其良好的匹配性能和极快的提取速度也得到了广泛使用

特征提取 精度高 SIFT SURF ORB 速度快 SIFT 极佳的尺度不变性, 能一定程度上适应视角变化和亮度变化 SURF 能够处理严重的图像模糊, 速度要高于 SIFT, 但精度不如 SIFT ORB 极快的提取速度, 在实时应用中常用来替代 SIFT 以上三种特征提取算法均在 OpenCV 中有实现

特征匹配 模板匹配直接在目标图像中寻找给定的图像块

特征匹配 在小运动假设下, 可以采用 KLT 跟踪方法 : I(x,y,t) I(x,y,t+1) 一个等式, 两个未知量

特征匹配 进一步假设 : 相邻像素运动一致 ( 单个像素 ) ( 邻域窗口 )

特征匹配 大运动情况下的匹配 通过比较特征描述量的距离进行匹配 SIFT = 128 维 SURF = 64 维 ORB = 256bits 暴力匹配 快速最近邻匹配 OpenCV 中提供了相应的匹配算法

Loopback Sequences and Multiple Sequences How to efficiently match the common features among different subsequences?

Non-Consecutive Feature Tracking

Framework Overview 1. Detect SIFT features over the entire sequence. 2. Consecutive point tracking: 2.1 Match features between consecutive frames with descriptor comparison. 2.2 Perform the second-pass matching to extend track lifetime. 3. Non-consecutive track matching: 3.1 Use hierachical k-means to cluster the constructed tracks. 3.2 Estimate the matching matrix with the grouped tracks. 3.3 Detect overlapping subsequences and join the matched tracks.

Two-Pass Matching for Consecutive Tracking SIFT Feature Extraction First-Pass Matching by Descriptor Comparison Global distinctive

Two-View Geometry 3D???

Two-View Geometry 3D: Epipolar Geometry

Not enough! How to handle image distortion? Naïve window-based matching becomes unreliable! How to give a good position initializaton? Whole line searching is still time-consuming and ambiguous with many potential correspondences.???

Second-Pass Matching by Planar Motion Segmentation Estimate a set of homographies Using inlier matches in first-pass matching frame t 1 2 H t H, t1 t, t1 frame t+1 Alignment 3 H t, t1 4 H t, t1

Second-Pass Matching by Planar Motion Segmentation Guided matching Epipolar constraint Homography constraint

Second-Pass Matching with Multi- Homographies First-Pass Matching (53 matches) Direct Searching (11 matches added) Our Second-Pass Matching (346 matches added)

Non-Consecutive track matching Fast Matching Matrix Estimation Detect overlapping subsequences and join the matched tracks.

Fast Matching Matrix Estimation Each track has a group of description vectors Track descriptor Use a hierarchical K-means approach to cluster the track descriptors

Fast Matching Matrix Estimation

Non-Consecutive Track Matching Simultaneously Match Images and Refine Matching Matrix Refine the matching matrix after matching the common features of the selected image pairs. More reliably find the best matching images with the updated matching matrix.

Traditional SfM Framework Feature tracking over whole sequence Structure & motion initialization Compute F between two initial images Compute P 1 and P 2 Triangulate 3D points of the matched features For each additional view Compute the camera pose Refine and extend 3D points Self-Calibration Upgrade the projective reconstruction to metric one. Refine structure and motion Bundle adjustment

三角化 已知 F, 计算 P 和 P 已知 x 和 x 计算 X: x= PX x'= P 'X Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

有噪声情况下的三角化 由于存在噪声, 反投到三维空间上的射线并不会严格相交 优化投影点到对应极线的距离 Richard Hartley and Andrew Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, Second Edition 2004.

线性三角化方法 给定方程 x= PX x'= P 'X p it 表示 P 的第 i 行. 写成矩阵和向量相乘的形式 直接解析求解. 没有几何意义 不是最优.

优化几何误差 Cost function 用 Levenberg-Marquart 算法求解

Knowing 3D points, Compute Camera Motion Compute Projection Matrix Decomposition for Metric Projection Matrix P K[ R t] [ KR Kt] [ M Kt] Decompose M into K, R by QR decomposition 1 t K p, p, p ) ( 14 24 34 T

Bundle Adjustment Definition Refining a visual reconstruction to produce jointly optimal 3D structure and viewing parameter (camera pose and/or calibration) estimates. B. Triggs, P. F. McLauchlan, R. I. Hartley, and A. W. Fitzgibbon. Bundle adjustment - a modern synthesis. In Workshop on Vision Algorithms, pages 298-372, 1999.

Geometric Ambiguities Projective Self-Calibration Metric Reconstruction Reconstruction Marc Pollefeys. Visual 3D Modeling from Images

Self-Calibration State-of-the-Art References R.I. Hartley and A. Zisserman, Multiple View Geometry in Computer Vision, second ed. Cambridge Univ. Press, 2004. M. Pollefeys, L.J. Van Gool, M. Vergauwen, F. Verbiest, K. Cornelis, J. Tops, and R. Koch, Visual Modeling with a Hand-Held Camera, Int l J. Computer Vision, vol. 59, no. 3, pp. 207-232, 2004. G. Zhang, X. Qin, W. Hua, T.-T. Wong, P.-A. Heng, and H. Bao, Robust Metric Reconstruction from Challenging Video Sequences, Proc. IEEE CS Conf. Computer Vision and Pattern Recognition, 2007.

推荐 SfM 开源系统 ENFT-SFM or LS-ACTS http://www.zjucvg.net/ls-acts/ls-acts.html OpenMVG https://github.com/openmvg/openmv VisualSFM http://ccwu.me/vsfm/