多视图几何三维重建实战系列- Cascade-MVSNet
作者:浩南
来源:公众号|计算机视觉工坊(系投稿)
MVSNet在2018年提出后 , 在估计深度图的应用中取得了非常好的结果 。 应用CNN于立体匹配的技术也使得传统的匹配效率整体提高 。 但是因为使用3D卷积神经网络进行深度正则化处理 , 所以即便在比较低的分辨率(900*600)下 , 也需要比较高的GPU消耗 。 针对该问题 , 该团队在CVPR2019上提出利用循环神经网络对3D代价体进行切片处理 , 大幅度减少GPU消耗 , 使得该网络框架不仅可以估计更大范围的场景 , 且估计精度更高 。
本篇文章仍将就MVSNet内存消耗大的问题 , 介绍CVPR2020的一篇文章:Cascade Cost Volume for High-Resolution Multi-View Stereo and Stereo Matching. 该文章沿用MVSNet深度估计的框架 , 具体创新在于改进Cost Volume的构造方式 , 使得利用深度学习估计深度时 , 在较低GPU消耗上估计高分辨率、大场景的深度 。
1、背景介绍
基于深度学习的多视图立体 , 例如经典的MVSNet网络架构 , 通常会构造一个三维的代价体去回归场景的深度值 , 但MVSNet常受限于显存限制而无法对高分辨率的影像进行深度估计 。
在MVSNet框架的基础上 , 多种方法对显存增长问题提出了改进方案 , 上一篇文章我们介绍了R-MVSNet , 该方法利用循环神经网络GRU , 对三维代价体进行切片 , 这样不仅保留了靠前的深度和纹理信息 , 也减少了GPU的消耗 , 深度估计精度和深度估计范围要优于MVSNet , 不同方法的比较结果可通过图1体现 。
文章插图
图1 效果比较图
不同于R-MVSNet , 本篇文章(以下简称“Cascade-MVSNet”)则仍旧使用了MVSNet网络框架中的3D卷积神经网络对深度代价体进行正则化 , 但不同于其代价体的构造 , Cascade-MVSNet利用链式代价体构造的策略 , 先估计较为粗糙的深度值 , 然后再进一步缩小深度估计范围 , 提高深度估计精度 , 实现了在较小的GPU消耗的条件下 , 得到较高分辨率和较高精度的深度图 , 经过稠密重建后 , Cascade-MVSNet的结果也比之前所提到的方法要更为完整(图2) 。
文章插图
图2 稠密重建结果比较
2、代价体构造回顾
沿用立体匹配的视差估计框架 , 通常深度学习方法都会构造一个沿深度方向的代价体 , 例如MVSNet借鉴平面扫描算法的原理 , 构造由沿不同深度而前视平行的平面组成一个相机椎体 , 然后每一个相机椎体经过采样 , 变成长宽一致的特征体 , 通过可微分化的单应性变换将不同视角下的特征扭曲到参考视角上 , 构成代价体 。
一般来说 , 代价体的长宽则是由输入影像分辨率提供的 , 深度范围则是通过稀疏重建后的结果提供先验条件 。 这样的构造方式 , 使得代价体正则化时 , 三维代价体的内存消耗会以三次指数的速率增长(图3) 。
文章插图
图3 代价体构造示意图
上一篇文章中R-MVSNet使用循环神经网络 , 对将代价体沿深度切成不同的深度图 , 利用GRU结构进行正则化处理 , 相比较MVSNet , 能减少GPU的消耗 。 可是循环神经网络会涉及一个遗忘的过程 , 导致网络不能很好地保留像素周围的纹理信息 , 所以点云完整度不能得到很好地保留(图4) 。
文章插图
图4 RNN代价体正则化过程
3、Cascade-MVSNet
为了解决信息保留和GPU消耗的两个问题 , Cascade-MVSNet提出一种级联的代价体构造方法 , 并输出从粗到细的深度估计值 。
首先来看其整个网络的架构(图5) 。
文章插图
图5 Cascade网络框架示意图
可以看到 , 整个网络的结构还是沿袭了MVSNet框架(图6) , 还是以多视图的影像作为输入 , 然后经过可微分单应性变换形成不同视角下的特征体 , 在通过代价体构造 , 形成一个代价体 , 之后通过回归估计深度值 。 这里不再对MVSNet作更多的赘述 , 感兴趣的朋友可以回顾之前的文章:MVSNet 。
文章插图
图6 MVSNet深度估计框架
此篇文章不同的是:整个网络利用级联式代价体的构造策略 。 首先 , 原始输入影像 , 利用特征金字塔网络先对原始影像进行降采样 , 降低特征体的分辨率 , 使得可以拥有较为精确的深度估计范围 。 通过初始的MVSNet框架估计出低分辨率下的深度图后 , 进入下一阶段 。
- GB|备货充足要多少有多少,5000mAh+128GB,红米新机首销快速现货
- 占营收|华为值多少钱
- 查询|数据太多容易搞混?掌握这几个Excel小技巧,办公思路更清晰
- 商品|问道自有品牌,山姆多方博弈
- 垫底|5G用户突破2亿:联通垫底,电信月增700万,中国移动有多少?
- 色卡|双人场景/多机位色彩匹配,色卡很重要
- 砍单|iPhone12之后,拼多多又将iPhone12Pro拉下水
- 打响|拼多多打响双12首枪,iPhone12降到“mini价”,苹果11再见
- 不到|苹果赚了多少?iPhone12成本不到2500元,华为和小米的利润呢?
- 机器人|网络里面的假消息忽悠了非常多的小喷子和小机器人
