【48812】单目3D方针检测之入门（1）_五星体育预告节目表今天直播_五星体育赛事预告节目表

为了更直观，我画了一个思维导图，点击链接后，留意需求切换一下思维导图状况。

这类办法都是直接在点云数据上进行特征的提取和RPN操作，将2D方针检测中的网络结构和思维迁移到3D点云中。

这儿的Pseudo-LiDAR（也叫为激光雷达）这篇文章对后来的单目3D方针查验测验范畴的开展起到了促进的效果。

这儿使用了双目图画来生成深度图，依据深度图得到点云数据，再进行方针检测使命。

Stereo Image-based办法中，主要是根据双目图画的3D方针检测，这一范畴我不太了解，今后再做弥补。

而在单目3D方针查验测验范畴，又可细分为三类办法。关于单目3D方针检测的分类翻译自CaDNN这篇文章

所谓直接法便是直接从图画中估量出3D检测框，也无需猜测中心的3D场景表明[9,52,4,32]。

更进一步的说便是，直接法能结合2D图画平面和3D空间的几许联络来辅佐检测[53,12,40,3]。

引进深度感知卷积，它按行区分输入并学习每个区域的no-shared kernels，以学习3D空间中坐落相关区域的特定特征。

形状估量能够从3D CAD模型的符号极点中被监督[5,24]，或从LiDAR扫描[22]，或直接从输入数据以自我监督的办法[2]。

直接法的缺陷是检测框直接从2D图画中生成，没有发生清晰的深度信息，相关于其它办法，定位功能较差。

将估量的深度图与原图画结合，再履行3D检测使命的论文有许多[38,64,36,13]。

深度图能转换成3D点云，这种办法被称为伪激光雷达（Pseudo-LiDAR）[59]，或许直接用[61,65]，或许结合图画信息[62,37]来生成3D方针检测成果。

根据深度的办法在练习阶段将深度估量从三维方针检测使命中别离，导致还需求学习用于三维检测使命的次佳的深度地图。

怎么了解上边这句话呢？**关于归于感兴趣的方针的像素，应该榜首先考虑获取准确的深度信息，而关于布景像素则不那么重要，假如深度估量和方针检测是独立练习的，则无法捕捉到这一特点。

根据网格的办法经过猜测BEV网格表明（BEV grid representation）[48,55]，来防止估量用做3D 查验测验结构输入的原始深度值。

具体来说，OFT[48]经过将体素投射到图画平面和采样图画特征来填充体素网格，并将其转换为BEV表明。

多个别素能够投影到同一图画特征上，导致特征沿着投影射线重复呈现，降低了检测精度。

*博客内容为网友个人发布，仅代表博主个人自己的观念，如有侵权请联络工作人员删去。

【48812】单目3D方针检测之入门（1）