对多视觉几何中出现的运算做出分析和解释

对多视觉几何中出现的运算做出分析和解释,第1张

在多视角几何中,特别是在一些恢复相机运动轨迹的模型中,我们需要将相机的旋转和平移表示出来。通常情况下,我们都是在欧几里得空间中用R和t来进行相应的运算得到相机轨迹。然而,在很多论文中,作者们却喜欢用Lie algebra se(3)、so(3) 以及 Lie group SE(3)、SO(3) 之类的表示。紧接着,出现了很多术语,比如twist, tangent space,也出现了一些运算,比如exp(),log()之类的,看得我是云里雾里。

自然要问为啥通过指数运算能够把角速度映射到旋转矩阵,它的背后又有什么样的物理意义,这中间是否有一些尽量直观的解释。

本篇博客将从最基础的内容出发,用直观的容易理解的方式对旋转矩阵和李代数之间的关系进行推导,如有错误,请指出,希望共同进步。

预备知识:

在进入正题之前,我们先需要复习下向量叉积(cross product),以及反对称矩阵(skew symmetric matrix),在计算机视觉中最初遇到这些概念应该是在求解本征矩阵时,然而,他们在沟通刚体变换矩阵和李代数之间扮演着十分重要的作用。

 

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第2张

 

至于什么是刚体变换,什么是旋转矩阵,旋转矩阵有哪些性质这些更基础的知识在这里不再一一补充。

下面的内容中,都是基于3维空间,所以没有特别说明时,所说的旋转矩阵都是3*3的,平移向量也是3维的。并且所有向量上带一个帽子的表示的是它的反对称矩阵形式。

旋转矩阵与 so(3):

我们知道对于旋转矩阵,旋转矩阵本身乘以它的转置等于单位矩阵:

 

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第3张

 

上式中的约束表示R是旋转矩阵。由前面的推导公式三知道如果R是单位矩阵,那它的导数就是一个反对称矩阵,所以只有反对称矩阵组成的空间,即 so(3),我们称之为在在单位矩阵处的正切空间tangent space.为什么称为正切呢?回忆二维曲线在某处的导数是一条切线。对于这个三维球面,那么它的导数应该是个切面。如下图所示,图片来源于tangent space 的 wiki:

 

可是对于那些不是单位矩阵的旋转矩阵R该怎么找在他们位置处的正切空间呢?由公式3我们知道,在反对称矩阵的右边乘以R就能够得到R的导数,所以在非单位矩阵的R处的正切空间就是反对称矩阵乘以R就行了。
指数映射:

回到公式(3),把旋转矩阵R用x替换掉,如下:

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第4张

 

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第5张

 

刚体变换和SE(3):

前面还只说了旋转,实际上刚体变换还有平移。所以,和只有旋转矩阵构成的李群SO(3) 一样,我们也可以有由刚体变换得到的李群SE(3) :

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第6张

 

对多视觉几何中出现的运算做出分析和解释,李群、李代数在计算机视觉中的应用,第7张

 

到这里基本理清了SE,SO之类的与刚体变换之间的关系,看视觉SLAM类的论文以及相应代码中有关lie部分应该没啥压力了。

各种论文里涉及到的求解位姿矩阵时的非线性最小二乘优化(牛顿法,LM法),其中增量都是在单位矩阵处的tangent space se(3)上计算,获得的增量(即相邻位姿变换关系)通过指数映射映射回多面体SE(3)上。

通过这种方式,能够避免奇异点,保证很小的变换矩阵也能够表示出来。这一段引用自论文《Scale Drift-Aware Large Scale Monocular SLAM》。

这篇博文可以说是我看慕尼黑工大(TUM)多视角几何教学视频的笔记,YouTube链接点击这里,这位牛的飞老师的英语吐字清晰,大家应该能够听懂。当然,老师也是参看的别人的文档,这里我也把讲lie 和计算机视觉的两个文档传到了csdn上,供大家下载

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2605326.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-09
下一篇 2022-08-09

发表评论

登录后才能评论

评论列表(0条)

保存