用 opencv 进行过双目相机标定的同学都知道,单目标定 calibrateCamera() 函数能够对每一张标定图像计算出一对 rvec 和 tvec,即旋转平移向量,代表世界坐标系到相机坐标系的转换关系。而 stereoCalibrate() 函数则可以计算出旋转矩阵 R 和平移向量 T,代表左右相机坐标系之间的转换关系。同样是坐标变换,平移倒总是向量,但旋转怎么有时是向量,有时又是矩阵呢?
旋转矩阵
参考csxiaoshui的博客,三维旋转变换可以看成是矩阵乘法运算,即:
⎡⎣⎢⎢x′y′z′⎤⎦⎥⎥=R∗⎡⎣⎢⎢xyz⎤⎦⎥⎥
其中 R 就是三阶的旋转矩阵。仅仅考虑绕 X、Y 或 Z 单个轴旋转 θ (右手螺旋),R 分别为:
RX=⎡⎣⎢⎢1000cosθsinθ0−sinθcosθ⎤⎦⎥⎥RY=⎡⎣⎢⎢cosθ0−sinθ010sinθ0cosθ⎤⎦⎥⎥RZ=⎡⎣⎢⎢cosθsinθ0−sinθcosθ0001⎤⎦⎥⎥
绕任意轴旋转则可以分解成绕三个坐标轴旋转的叠加,最终得到的旋转矩阵 R 便是上述三个矩阵的乘积。
矩阵运算显然是计算机三维坐标变换最简单方便的计算方法,因此在 opencv、opengl、工业机器人等开发中,提到位姿旋转变换,多半用的是旋转矩阵。然而,用矩阵来表示一个旋转关系有两个缺点:
首先,通过旋转矩阵不能直观地看出旋转的方向和角度,假设给定一个旋转矩阵,要求旋转方向不变,旋转角度变成一半,那么新的旋转矩阵计算起来就比较麻烦了。
另一方面,旋转变换本身只有3个自由度,但旋转矩阵有9个元素,因此旋转矩阵中的元素不是相互独立的,这在非线性优化中会带来问题。
旋转向量
向量旋转公式最早由 Rodrigues 提出,用一个三维向量来表示三维旋转变换,该向量的方向是旋转轴,其模则是旋转角度。百度百科中有其详细的介绍与推导,我在这边只列一下最重要的公式。
设旋转向量的单位向量为 r
,模为 θ。三维点(或者说三维向量)p 在旋转向量 r 的作用下变换至 p′
,则:
p′=cosθ⋅p+(1−cosθ)(p⋅r)r+sinθ⋅r×p
显然,旋转向量代表的变换关系十分直观,但运算上要比矩阵形式更加复杂。
相互转换
用矩阵形式和向量形式表示旋转变换各有优劣势,因此经常需要来回转换,这里跟数学中的李群与李代数有所关联,本人目前还一知半解,可以参考半闲居士的博客。
opencv 中有函数 Rodrigues() 用于旋转矩阵和旋转向量的转换。参照opencv文档,设旋转向量的单位向量 r=[rx ry rz]T
,旋转角度为 θ,对应的旋转矩阵为 R,则 r 到 R
的转换是:
R=cosθI+(1−cosθ)rrT+sinθ⎡⎣⎢⎢⎢0rz−ry−rz0rxry−rx0⎤⎦⎥⎥⎥
其中 I 是三阶单位矩阵。反过来 R 到 r 的转换则可以利用等式:
R−RT2=sinθ⎡⎣⎢⎢⎢0rz−ry−rz0rxry−rx0⎤⎦⎥⎥⎥
opencv 官方文档中的原话是:
A rotation vector is a convenient and most compact representation of a rotation matrix (since any rotation matrix has just 3 degrees of freedom). The representation is used in the global 3D geometry optimization procedures like calibrateCamera, stereoCalibrate, or solvePnP .
称旋转向量是旋转矩阵方便而且最紧凑的表示方法,被用于一些需要全局三维几何优化的函数中。