python实现五张图片的全景拼接 python 全景拼接

转载

mob64ca1401b651 2024-01-15 15:29:43

文章标签 python实现五张图片的全景拼接 python opencv pytorch 柱面 文章分类 Python 后端开发

参考资料

概述

图像全景拼接技术对于商用和艺术领域都有很高的价值。自从摄影术诞生以来，人们发明了许多特定的设备来制作全景图像，但由于价格低廉的数码相机也可以胜任，使得人们对自动全景图像拼合的需求度大大增加。在我们这个示例项目中，我们使用圆柱形扭曲创建全景图像。圆柱形翘曲是最容易实现的，但它有严格的要求，所有的图像必须采取相机放置或已知的倾斜角度。而使用这种方法，我们不需要进行完全单应性计算，只需要沿角度方向进行平移即可创建全景图像。技术路线图如下图所示：

python实现五张图片的全景拼接 python 全景拼接_python

正向翘曲：

根据图像坐标 $python实现五张图片的全景拼接 python 全景拼接_柱面_02$ ，获得柱面投影坐标 $python实现五张图片的全景拼接 python 全景拼接_python_03$ 可以按照下式计算：

$python实现五张图片的全景拼接 python 全景拼接_柱面_04$

反向翘曲：

从柱面投影坐标 $python实现五张图片的全景拼接 python 全景拼接_python_03$ 计算图像坐标 $python实现五张图片的全景拼接 python 全景拼接_柱面_02$ 可以按照下式计算：

$python实现五张图片的全景拼接 python 全景拼接_pytorch_07$

在前向翘曲中，源图像映射到柱面上，但它可以在目标图像中产生空洞（因为某些像素可能永远不会映射到那里）。因此，我们使用反向映射，将目标图像中的每个像素映射到源图像。由于这两种映射都不可能精确到像素值，因此使用双线性插值来计算目标像素处的颜色。

径向畸变

由于相机中经常使用厚镜头，因此有必要校正图像中的径向畸变。一种常用的简化畸变模型如下式表达：

$python实现五张图片的全景拼接 python 全景拼接_柱面_08$

其中 $python实现五张图片的全景拼接 python 全景拼接_pytorch_09$ 是失真图像像素的位置， $python实现五张图片的全景拼接 python 全景拼接_pytorch_10$ 是失真修正后（非失真）的图像位置。 $python实现五张图片的全景拼接 python 全景拼接_柱面_11$ 取决于相机本身，并且可以通过相机标定技术获取。反向映射和镜像畸变矫正都需要插值技术进而计算目标图像像素的颜色值。插值技术比较容易实现，可以实现对特征的平滑，因此这步要得到高质量的最终目标图像。在应用中有两个地方需要进行插值，一是反向翘曲阶段从柱面图像变换到源图像；二是从非失真图像灰度变换到失真图像灰度。我们可以把上述两步骤和计算柱面图像灰度值直接结合起来，进而避免中间的插值过程。源图像如下图所示：

python实现五张图片的全景拼接 python 全景拼接_pytorch_12

畸变图像如下图所示：

python实现五张图片的全景拼接 python 全景拼接_柱面_13

SIFT特征检测

我们直接使用SIFT特征检测算法去在每张图片里面生成特征，每个SIFT描述子是128个字符长度，这些特征与相邻图像进行匹配以估计平移量。由于可能出现一定数量可能使最终图像错位的离群点，我们使用RANSAC算法去消除最终估计里产生的离群点，如下图所示：

python实现五张图片的全景拼接 python 全景拼接_python实现五张图片的全景拼接_14

随机抽样一致性平移变换（Ransac Translation）

随机抽样一致性（RANSAC：Random sample consensus）算法是一种可用于计算现存异常值中完全单应性的通用算法。柱面翘曲方法的使用具备只需要计算翘曲图像中平移运动的优势。同样适用于平移估计，只需一个特征就足够了。RANSAC估计方法给予容差值去计算非离群点数量，容差值基于图像噪声确定。由于我们的图像获取质量较高，为取得较好的估计效果，两个像素的容差值就足够了（我们发现图像中只有5-10%数量的离群点）。