iOS 立方体 iphone立体图

转载

mob6454cc6f6c1c 2023-12-04 19:44:48

文章标签 iOS 立方体基线计算机视觉 3c 文章分类 iOS 移动开发

摄像头和计算机视觉技术已经成为智能手机技术创新的重要战场。

苹果上个月发布的iPhone XS中计算机视觉技术可谓其重要亮点（详见：iPhone Xs发布会其实是苹果计算机视觉技术发布会！），昨天谷歌刚刚开源的SIGGRAPH 2018会议论文《Stereo Magnification: Learning view synthesis using multiplane images》的代码则又把手机双摄玩出了新花样。

作者信息

iOS 立方体 iphone立体图_基线

文中提出了一种叫“立体放大”（Stereo Magnification）的新技术，使用深度神经网络学习并构建双目立体相机拍摄的两幅图像的多平面图像表示（multiplane images），然后基于此合成立体感更明显的立体图像。

先来看看谷歌发布的视频，直观感受下（强烈推荐横屏全屏观看，效果更加明显）：

w可以看到，这个所谓的立体放大技术即将基线距较近的双目相机拍摄的两幅图像，转换成看来起是基线距较远的双目相机拍摄的图像！

请看这幅图：

iOS 立方体 iphone立体图_3c_02

图中下面两幅子图中轮胎和转盘处明显比上面两幅图视差更加明显，立体感更强！其将基线距1.4cm的手机双目相机拍摄的图像转化成基线距6.3cm的立体图像。

为什么要6.3cm？因为大部分人类左右眼的距离是6.3cm左右，基线距6.3cm拍摄的立体图像可以直接显示到虚拟现实头盔中，使用户能感受更接近真实场景的视觉体验。

这里面的关键问题是，视图外差值（views extrapolating）。一般的视图差值只能是内差值（views interpolating），即基线距D的立体双目相机拍摄的图像只能合成基线距小于D的图像，论文中提到的视图外差值则是要通过深度神经网络分解立体图像成多平面图像，再合成外差值后的新立体视图。

请看下图：

iOS 立方体 iphone立体图_计算机视觉_03