文章目录

  • 概要
  • 刚体空间旋转的描述
  • 旋转矩阵
  • 欧拉角
  • 四元数
  • 刚体空间平移的描述
  • 总结


概要

  Kinect2.0是微软推出的一款RGB-D相机,它即支持普通相机的拍摄,也支持脉冲测量深度信息。本系列文章基于该传感器给出基本的环境搭建、原理讲解、点云数据捕捉、三维点云拼接等开发源码,当然也会总结经验帮大家排雷避坑。本小节介绍相机外部参数相关的理论,为后续文章打基础。

刚体空间旋转的描述

  在深度相机Kinect2.0三维点云拼接实验(一)的式(6)中,深度学习如何拼图 深度图拼接_计算机视觉是在相机坐标系下的坐标,由于拼接的两幅图像是相机不同的姿态进行获取的,所以在进行拼接的时候需要通过相机的姿态信息把图像变换到同一坐标系下进行处理,所以需要一种数据格式用来描述相机坐标系的变换。描述相机在三维空间运动的数据格式有很多种比如:旋转矩阵、旋转向量、欧拉角、四元数等。这里讨论计算机易于存储的四元数格式和易于计算的旋转矩阵格式以及它们之间的相互变换,为之后的点云拼接作铺垫。

旋转矩阵

  旋转矩阵是在乘以一个向量的时候有改变向量的方向但不改变大小的效果并保持了手性的矩阵。由于推导过程比较繁琐,这里我们直接给出三维空间内绕xyz三个轴旋转时的旋转矩阵,如下图所示:

深度学习如何拼图 深度图拼接_算法_02


如果是反向旋转,就是相应旋转矩阵的逆矩阵,由于旋转矩阵是正交矩阵,也就是相应的旋转矩阵的转置矩阵。坐标系的正向旋转实际就是该坐标系里的向量绕相应的轴做反向旋转,根据上面的结论,也就是三个向量的旋转矩阵的转置矩阵。坐标系的反向旋转时正向旋转下的转置,与向量绕轴正向旋转一样。

PS: 旋转矩阵的推导,推荐3维旋转矩阵推导与助记这篇文章讲的很棒!

欧拉角

欧拉角也是一种表示三维旋转的描述方法,欧拉角的计算需要借助旋转矩阵,它的描述方式是按照绕三个轴的旋转的角度进行表示,设绕深度学习如何拼图 深度图拼接_算法_03轴的旋转角度分别为深度学习如何拼图 深度图拼接_旋转矩阵_04,假设描述一个刚体旋转按照深度学习如何拼图 深度图拼接_算法_05次序的一组欧拉角为深度学习如何拼图 深度图拼接_计算机视觉_06,同理,别的次序也一样,一共有六种次序,即:XYX、XYZ、YXZ、YXY、ZXY、ZYX。一般我们确定下描述的次序,那么就可以用三个角度来描述刚体的旋转。

四元数

旋转矩阵用矩阵的方式描述旋转便于计算机运算,但是如果按照旋转矩阵存储则会显得冗余,考虑到单位复数可以描述二维平面的旋转,那么在三维空间中可以用类似于复数的形式描述旋转,即单位四元数,它只有四个数即可描述刚体的旋转信息,所以非常适合计算机存储。四元数的格式为:
深度学习如何拼图 深度图拼接_矩阵_07

假设某个旋转绕单位向量深度学习如何拼图 深度图拼接_旋转矩阵_08进行了角度为 的旋转,那么用四元数可以表示为:

深度学习如何拼图 深度图拼接_旋转矩阵_09

刚体空间平移的描述

刚体空间的平移可以用方向+距离的方式进行描述,在深度学习如何拼图 深度图拼接_计算机视觉_10空间中,用一个向量深度学习如何拼图 深度图拼接_矩阵_11的方向表示平移的方向,用它的模长表示平移的距离,即距离深度学习如何拼图 深度图拼接_算法_12

总结

   获取相机外部参数的传感器有很多,如里程计、陀螺仪等,只有获取相机外参我们才知道拍摄的角度,这在后面的图像拼接非常重要。