实验室研究方向

Similar documents
实验室研究方向

2 g g g g g g g

Improved Preimage Attacks on AES-like Hash Functions: Applications to Whirlpool and Grøstl

Microsoft Word - KSAE06-S0262.doc

Subspace Gradient Domain Mesh Deformation

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2


Move Component Object selection Component selection UV Maya Hotkeys editor Maya USING MAYA POLYGONAL MODELING 55

coverage2.ppt

17 Prelight Apply Color Paint Vertex Color Tool Prelight Apply Color Paint Vertex Color Tool 242 Apply Color, Prelight Maya Shading Smooth

(Pattern Recognition) 1 1. CCD

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

untitled

彩色地图中道路的识别和提取

Real-time Human Detection and Security System

2/80 2

The Development of Color Constancy and Calibration System

08_toukei03.dvi

Microsoft PowerPoint - STU_EC_Ch02.ppt

Microsoft PowerPoint - IAS 21 - IFRS宣導會.pptx

3 (s05q6) The diagram shows the velocity-time graph for a lift moving between floors in a building. The graph consists of straight line segments. In t

Microsoft Word - 专论综述1.doc

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

新婚夫妇必读(二).doc

热设计网

VASP应用运行优化

國立中山大學學位論文典藏.PDF

Microsoft Word - A doc

Essential procedures of stereological (morphometric( morphometric) ) study / / / / / / /

2, : 257,, ; Pollefeys [4 ],,,,, ; [526 ],, ; Snavely [728 ], (500 ),,, EXIF, EXIF,, 2, ; Pollefeys [9 ],,,, (3),,,. X = [ X Y Z ] T, x = [ x y ] T, x

<4D F736F F D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

Microsoft PowerPoint - ryz_030708_pwo.ppt

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

第一章 前言

Microsoft Word - scribe_1_.doc

2008年1月11日に岩手県釜石沖で発生した地震(M4.7)について

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

(Microsoft PowerPoint - 07_2_20_SP8\203\217\201[\203N\203V\203\207\203b\203v\217\254\227\321\220\263\230a.ppt)

和文タイトル

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

入 指 令 如 : 鍵 盤 鼠 標 多 點 觸 控 重 力 感 應 陀 螺 儀 等 4. 圖 形 用 戶 接 口 掌 握 引 擎 API 中 GUI 與 GUILayout 類 中 方 法 和 變 量 的 使 用, 能 夠 通 過 GUI Skin 為 應 用 的 界 面 定 制 不 同 風 格 主

40 8 Vol. 40, No ACTA AUTOMATICA SINICA August, ,,,.,.,,,.,.,,,.,,,. DOI,, L-M (Levenberg-Marquardt),,,.., 2014, 40(8):

<4D F736F F D C4EAC0EDB9A4C0E04142BCB6D4C4B6C1C5D0B6CFC0FDCCE2BEABD1A15F325F2E646F63>

2 137 [5]. [6].. [7]. [8-9].. (PCA) PCA HIS C1C2C3.. RGB Hotelling. [1-11]. R G B 3. RGB 1) RGB M N 3 x = [x R x G x B ] T. RGB 3 3 C x (1)

12-2 プレート境界深部すべりに係る諸現象の全体像

COCO18-DensePose-BUPT-PRIV

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 小 別 勝 新 婚? 久 別 要 離 婚? 影 響 遠 距 家 庭 婚 姻 感 情 因 素 之 探 討 Separate marital relations are getting better or getting worse? -Exp

/3 CAD JPG GIS CAD GIS GIS 1 a CAD CAD CAD GIS GIS ArcGIS 9. x 10 1 b 1112 CAD GIS 1 c R2VArcscan CAD MapGIS CAD 1 d CAD U

EC( )18 第 2 頁 (c) 刪 除 以 下 常 額 職 位 2 個 顧 問 醫 生 職 位 第 4 / 第 3 / 第 2 點 ) ( 145,150 元 至 149,600 元 /127,900 元 至 135,550 元 /113,520 元 至 120,553 元 ) (

院系▲

Microsoft PowerPoint - Aqua-Sim.pptx

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

symmetrical cutting patterns with various materials for visual designing; ii. This part combined costumes, bags and oilpaper umbrellas with the tradit

Fun Time (1) What happens in memory? 1 i n t i ; 2 s h o r t j ; 3 double k ; 4 char c = a ; 5 i = 3; j = 2; 6 k = i j ; H.-T. Lin (NTU CSIE) Referenc

Gerotor Motors Series Dimensions A,B C T L L G1/2 M G1/ A 4 C H4 E

Value Chain ~ (E-Business RD / Pre-Sales / Consultant) APS, Advanc

/ / Turnkey Test & Automation Solution Provider

基于矩阵分解和矩阵变换的多义词向量研究

SuperMap 系列产品介绍

视频场景重建的流程 运动恢复结构 深度恢复 三维重建

E622_402.indd

08_729.dvi

Microsoft Word - Final Exam Review Packet.docx

[1] [4] Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins)

untitled

bnbqw.PDF

Microsoft Word - 發布版---規範_全文_.doc

概 述 随 着 中 国 高 等 教 育 数 量 扩 张 目 标 的 逐 步 实 现, 提 高 教 育 质 量 的 重 要 性 日 益 凸 显 发 布 高 校 毕 业 生 就 业 质 量 年 度 报 告, 是 高 等 学 校 建 立 健 全 就 业 状 况 反 馈 机 制 引 导 高 校 优 化 招

鱼类丰产养殖技术(二).doc

疾病诊治实务(一)

名人养生.doc

<4D F736F F D2040B9C5B871A661B0CFABC8AE61C2A7AB55ACE3A8735FA7F5ABD8BFB3B9C5B871A661B0CFABC8AE61C2A7AB55ACE3A8732E646F63>


中老年保健必读(十).doc

27 i

% % ,542 12,336 14,53 16,165 18,934 22,698 25, ,557 7,48 8,877 11, 13,732 17,283 22,

海淀区、房山区(四)

穨ecr1_c.PDF

穨2005_-c.PDF

北京理工大学.doc

尲㐵.⸮⸮⸮⸮⸮

东城区(下)

果树高产栽培技术(一).doc

物质结构_二_.doc

第一節 研究動機與目的

i

水力发电(九)

中国古代文学家(八).doc

景观植物(一)

Microsoft Word - 目录.doc

园林植物卷(三).doc

19q indd

厨房小知识_一_

中南财经大学(七).doc


赵飞燕外传、四美艳史演义

厨房小知识(五)

最新监察执法全书(十八).doc

园林植物卷(十二).doc

Transcription:

RGB-D SLAM 章国锋 浙江大学 CAD&CG 国家重点实验室

RGB-D 相机跟踪 RGB-D Sensor 双目 结构光 TOF 相机跟踪 特征点法 ICP RGB-D 对齐

RGB-D 相机跟踪 RGB-D 传感器 Kinect, Xtion, ZED, Intel RealSense, Kinect Xtion 图片来自微软 华硕官网

RGB-D 传感器 按工作原理分类 ; 双目方案 ZED 结构光方案 Kinect v1 Xtion Intel RealSense Camera SR300 TOF 方案 Kinect v2 https://www.pcmag.com/news/356997/microsoft-is-ending-kinect-production

双目 立体匹配

结构光 主动投影已知图案的方法来实现快速鲁棒的匹配特征点 陈彦军, 左旺孟, 王宽全, 等. 结构光编码方法综述 [J]. 小型微型计算机系统, 2010 (9): 1856-1863.

TOF 测量发射与反射红外信号的相位延迟, 计算每个 sensor 像素到目标物体的距离 https://my.oschina.net/abcijkxyz/blog/788647

RGB-D 传感器 各方案的优劣 双目 : 成本最低, 但深度信息依赖纯软件算法得出, 算法复杂度高, 计算性能要求高, 受光照等影响 结构光 : 技术成熟, 深度图像分辨率可以做得比较高, 但容易受光照影响, 室外环境基本不能使用 TOF: 抗干扰性能好, 视角更宽, 深度图像分辨率较低, 不适合高精度场合 受环境影响小, 传感器芯片并不成熟, 成本很高

RGB-D 传感器 使用 RGB-D 传感器优点是不需要计算特征点和描述子, 就可以直接得到稠密或半稠密的深度图 框架也相对传统 SLAM 简单, 可分为前端 RGB-D 相机跟踪与后端模型重建

RGB-D 相机跟踪 特征点法 包含了传统的 RGB 信息, 也可以使用特征点匹配求解相机位姿 一般场景都能提供丰富的特征点, 场景适应性较好, 能够利用特征点进行重定位 缺点是特征点计算法耗时 ; 特征点利用到的信息太少, 丢失了图像中的大部分信息和深度信息, 在弱纹理环境下特征少等

RGB-D 相机跟踪 直接法 包含了传统的 RGB 信息, 也可以使用直接法求解相机位姿 优点是不需要计算特征描述子, 可以得到稠密或半稠密的地图 ; 在特征缺失时也可正常使用 缺点灰度不变假设在实际环境中不一定成立, 要求像机运动速度不能太快, 不能自动曝光等

RGB-D 相机跟踪 迭代最邻近算法 (ICP) 该算法重复进行选择对应关系点对, 计算最优刚体变换, 然后应用变换, 再寻找对应关系点对, 计算新的最优变换, 直到满足正确配准的收敛精度要求 充分利用了深度图点云信息, 利用点云的几何结构特征, 不依靠 RGB 特征与光度

ICP(Iterative Closest Point) 目标 给定两组点云 P = {p 1, p 2,, p m }, Q = {q 1, q 2,, q n }, 求解两组点云之间的变换 T 使得下式得到最优解 cost 是代价函数, 度量匹配的误差 http://pointclouds.org/documentation/tutorials/interactive_icp.php#interactive-icp

ICP 步骤 固定相对变换 T, 求解最优的对应关系 A, 这一步即所谓的数据关联 (data association) 固定匹配关系 A, 求解最优的相对变换 T:

ICP 取样 : 选择一个或两个网格上的部分点作为样本 匹配 : 建立样本点的数据关联关系 置权 : 给关联样本点对设置权重 过滤 : 对不符合条件的关联点对做删除 误差度量 : 给关联点对设置误差度量 最优化 : 最优化误差度量

ICP Variants 取样 Uniform Sampling Random Sampling Normal Space Sampling 选择样本点使得样本点法向散布最大

ICP Variants Data association Closet point K-D Tree Normal shooting https://en.wikipedia.org/wiki/k-d_tree

ICP Variants Data association project project and walk x u d, vd, 1 = KMX s K 是相机内参数,X s 是待求匹配点的三维空间坐 标,x 是匹配点像素坐标,M 是两帧之间的位姿变 换, 在 ICP 算法中通过不断迭代求得 https://blog.csdn.net/fuxingyin/article/details/51425721

ICP Variants 权值设置 Constant weight Linear with distance Compatibility of normals Uncertainty 基于相机噪声的权值设置

ICP Variants 过滤准则 距离超过固定门限的关联点对删除 距离最大的 n% 关联点对删除 距离超过 2.5 倍标准差的关联点对删除

ICP Variants 误差度量 point-to-point point-to-plane Low K L. Linear least-squares optimization for point-to-plane icp surface registration[j]. Chapel Hill, University of North Carolina, 2004, 4: 1.

ICP 缺点 对位姿初值很敏感, 需要有较好的初值 只利用了深度信息, 没有利用 RGB 信息

RGB-D 对齐 通过最小化逆深度误差和光度误差来求解两帧之间的相对相机姿态 几何误差 E z = x i ρ z 1 z X j Z j x j z X j 代表点 X j 在第 i 帧上的深度,Z j (x j ) 代表第 j 帧的深度图上点 X j 的投影位置 x j 对应的深度 ρ z 是相应的鲁棒化函数

RGB-D 对齐 相对于 ICP 算法,RGB-D 对齐不仅考虑到了深度信息的几何误差, 还考虑了光度误差 光度误差 E I = x i ρ I I i x i I j x j I i (x i ) 代表第 i 帧上 x i 对应的光度 ρ I 是相应的鲁棒化函数 总能量函数 arg min T E align = E z + α E I

模型表示与重建 渐进式在线重建 可以支持在线高效更新 网格表达不适合在线更新 两种常见模型表示 TSDF Surfel 一些代表性算法

TSDF 带符号距离函数 (Signed Distance Function): sdf: R 3 R 对于点 p, sdf(p) 记录了把它映射到最近表面的距离 sdf(p) 为 0 的集合即为表面 截断带符号距离函数 (Truncated Signed Distance Function) 实际上, 对于三维重建而言, 我们仅仅需要找到 SDF 为 0 的点, 因此只有表面附近的点是有用的, 因此通常会对 SDF 进行截断, 不再存储离表面较远处点的 SDF

TSDF: rendering by raycasting 渲染一个像素 x 时 从相机中心投射一条射线, 寻找它和模型的交点 这个交点的 TSDF 函数值为 0 一个简单的实现 : 采用固定步长 但是我们可以用 TSDF 来加速 : 渲染时间近似与图像的尺寸线性相关 http://flafla2.github.io/2016/10/01/raymarching.html

Surfel Surfel: 表面的一个小的面元 几何属性 位置 法向 半径... 反射属性 颜色... model: 面元的集合 Pfister H, Zwicker M, Van Baar J, et al. Surfels: Surface elements as rendering primitives[c]//proceedings of the 27th annual conference on Computer graphics and interactive techniques. ACM Press/Addison-Wesley Publishing Co., 2000: 335-342.

http://www.cs.rug.nl/~roe/courses/acg/gpurendering Surfel: splat rendering 渲染一个 Surfel 是非常简单的 : 直接单独渲染一个 Surfel 是不行的, 因为面元之间可能有重叠!

http://www.cs.rug.nl/~roe/courses/acg/gpurendering Surfel: splat rendering (cont.) 使用高斯核卷积 取加权和

Algorithms KinectFusion Kintinous InifiniTAM ElasticFusion RKD SLAM

KinectFusion

KinectFusion The first algorithm using a commodity RGBD sensor to do 3D scanning GPU based pipeline Only the depth image is used, both for tacking and model update Newcombe R A, Izadi S, Hilliges O, et al. KinectFusion: Real-time dense surface mapping and tracking[c]//mixed and augmented reality (ISMAR), 2011 10th IEEE international symposium on. IEEE, 2011: 127-136.

KinectFusion TSDF based model representation Discretize the space into uniform grid Call each grid voxel struct Voxel { float sdf; float weight; };

KinectFusion: pipeline Iterating Pose estimation Model update (depth integration) Raycasting (visualization)

KinectFusion: pose estimation Convert the depth image into Vertex map Normal map Pyramid ICP Projective data association Remove outliers by normal direction and distance Minimize point to plane distance

KinectFusion: integration (model update) For each voxel Project the voxel to image space Compute the TSDF observation d(x) Update by weighted sum http://ifp.uni-stuttgart.de/lehre/diplomarbeiten/korcz/index.html

KinectFusion: limitations Only use depth image Robust to lighting Works on dark environment But not works on structureless scene High memory consumption Each voxel takes 8 byte A 2mx2mx2m scene, takes ~0.5GB at 5mm resolution (geometry only, double if add color) Improvement Moving volume Hash table Octree...

Kintinous

Kintinous KinectFusion Huge memory consumption Suitable for very small workspace Kintinous Only part of the model is active Move inactive part out of GPU Loop closure detection and online model adjustment

Kintinous: pipeline (i) Camera moves, (ii) Red region becomes inactive, swap out (iii) Convert red region to point cloud by raycasting (iv) Blue region becomes active

Kintinous: online map adjustment The swapped out TSDF volume is called point slice Associate each point slice with Pose BOW, to find loop On loop closure, use pose graph to do pose optimization, adjust the map by deformation graph

Kintinous https://blog.csdn.net/fuxingyin/article/details/51647750

Kintinous Whelan T, Kaess M, Fallon M, et al. Kintinuous: Spatially extended kinectfusion[j]. 2012.

ElasticFusion

ElasticFusion Surfel based representation Support loop closure, online model adjustment Thomas Whelan, Stefan Leutenegger, R Salas-Moreno, Ben Glocker, Andrew Davison. Elasticfusion: Dense slam without a pose graph[c]. Robotics: Science and Systems, 2015.

ElasticFusion The model is an unordered list of Surfels Each surfel contains: Position p Normal n Radius r Color c Confidence (how often it s observed) Crate timestamp t0, most recent update timestamp t

ElasticFusion A time window divides the model into active/inactive part A surfel is active if it is most recent update time t Only active surfels are used to do camera pose estimation and depth map fusion

ElasticFusion At each frame, try to register active and inactive part to find a local loop closure Only active surfels are used to do camera pose estimation and depth map fusion Use place recognition to find global loop closure On loop closure, correct model by non-rigid transformation

Deformation Graph Problem: non-rigidly align two models

Deformation Graph Construct a graph in space Each node represents an affine transformation The affine transformation should: Satisfies the alignment constraint (constraint term) As rigid as possible (rotation term) Neighboring node has similar transformations (regulation term)

ElasticFusion: system pipeline RGB-D image preprocess Camera pose estimation Depth image fusion Try find local loop closure Try find global loop closure Refine the map using deformation graph (in a separate thread)

ElasticFusion: camera pose estimation Render the active part into a colored depth image (splat rendering) using last camera pose Register the rendered image with current image by ICP Hierarchical, coarse to fine Projective data association Optimize both geometric error and photometric error

ElasticFusion: depth image fusion A surfel is stable if its confidence is above the threshold Render the active part into an index map, the index map is used to associate surfels in active model with current depth image For each point in current image If a stable correspondence surfel found, then update the surfel by weighted sum else create a new surfel, add it to map

ElasticFusion: local loop detection Render the active, inactive part using latest camera pose into color depth image Try to register the two images If a high quality registration found, then build a deformation graph to align the two part

ElasticFusion: global loop detection Ferns: encode an RGB-D image as a string of codes Maintain a fern database On each frame, query the database to find the closure candidates Align current frame with the candidates If a high quality alignment found, then use the constraints to build deformation graph, and update the model

Robust Keyframe-based Dense SLAM with an RGB-D Camera https://arxiv.org/abs/1711.05166

RKD-SLAM 系统框架 非常快速鲁棒的基于 RGB-D 的跟踪方法 ( 单 CPU 下约 70-200 fps) 非常快速的增量集束调整算法 非常高效的基于关键帧的深度表达和融合方法 支持快速运动 回路闭合 重定位和长时间运行

Efficient Incremental BA 提出了一个非常高效的 Incremental Schur complement 计算方法 ; 采用 Preconditioned Conjugated Gradient 进行求解, 比 Factorization 的方法要快 ; 速度比 isam2 快一个数量级

Efficient Incremental BA 与 isam2 的对比 运行时间 Reprojection Error

Integration & De-integration 使用 de-integration 可以将模型复原到 integration 前 + -

Re-integration 原模型 Dai A, Nießner M, Zollhöfer M, et al. Bundlefusion: Real-time globally consistent 3d reconstruction using on-the-fly surface reintegration[j]. ACM Transactions on Graphics (TOG), 2017, 36(4): 76a.

Re-integration 使用错误姿态 integrate 后的模型 Dai A, Nießner M, Zollhöfer M, et al. Bundlefusion: Real-time globally consistent 3d reconstruction using on-the-fly surface reintegration[j]. ACM Transactions on Graphics (TOG), 2017, 36(4): 76a.

Re-integration 使用 de-integrate 还原模型 Dai A, Nießner M, Zollhöfer M, et al. Bundlefusion: Real-time globally consistent 3d reconstruction using on-the-fly surface reintegration[j]. ACM Transactions on Graphics (TOG), 2017, 36(4): 76a.

Re-integration 使用正确姿态 integrate 后的模型 Dai A, Nießner M, Zollhöfer M, et al. Bundlefusion: Real-time globally consistent 3d reconstruction using on-the-fly surface reintegration[j]. ACM Transactions on Graphics (TOG), 2017, 36(4): 76a.

Keyframe-based Fusion 对于新来的一帧 F i 如果是关键帧, 则 integrate 到 TSDF 如非关键帧, 则选出重合度最大的关键帧 F ki 进行 de-integrate 然后将该帧深度 fuse 到 F ki 上 然后将 fuse 后的关键帧 re-integrate 到 TSDF

Keyframe-based Fusion 当关键帧的姿态发生改变 (EIBA 优化后 ) 根据 EIBA 的优化结果, 对姿态改变的关键帧进行 re-integration. 维护一个关键帧更新队列 优先更新姿态改变最大的关键帧 ; 每个时刻只对固定数量的关键帧进行 re-integration, 没有更新的关键帧会在放在后面的时刻更新

Comparison of ATE RMSE on all of the sequences on TUM RGB-D Benchmark

Reconstruction Result

Comparations without/with Re-integration

鲁棒处理快速运动

在线的回路闭合和三维表面调整

推荐开源系统 Kintinuous https://github.com/mp3guy/kintinuous ElasticFusion https://github.com/mp3guy/elasticfusion BundleFusion https://github.com/niessner/bundlefusion

Thank you!