计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集( 四 )


计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
本文插图
PASCAL3D+
官网链接:https://cvgl.stanford.edu/projects/pascal3d.html
该数据集是对PASCAL数据的一个3D模型重建 , 更像是一个分类和POS检测数据集 。
计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
本文插图
The Stanford Track Collection
官方链接:https://cs.stanford.edu/people/teichman/stc/
数据量比较少 。 发布时间也很早(2011) 。
计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
本文插图
IQmulus & TerraMobilita Contest
官网链接:http://data.ign.fr/benchmarks/UrbanAnalysis/#
该数据集是一个非常的dense的室外数据集 。 包括分割和检测多项任务 , 更偏向于语义分割任务 , 采用移动激光(MLS)在巴黎扫描出超过100个场景 。 该数据集更多的是为激发来自不同领域(例如计算机视觉 , 计算机图形学 , 地理信息学和遥感)的研究人员 , 共同致力于处理3D数据 , 对3D MLS数据进行基准划分和分类为目标 。
计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
本文插图
项目
这里主要介绍3D点云目标检测的几个重要项目 , 都是目前比较流行的codebase , 如下 。
second.pytorch
项目链接:https://github.com/traveller59/second.pytorch
主要优点:
(1)包含了kitti和nuscence两个点云3D目标检测数据集的实现
(2)含有Kitti_viewer网页版可视化工具
(3)实现了second,voxelnet,pointpillars三种点云目标检测算法 。
缺点:
应该是该领域的先行者 , 具有一定的阅读难度 , 不支持多模态 。
计算机视觉工坊汇总|基于激光雷达的3D目标检测开源项目&数据集
本文插图
Det3D
项目链接:https://github.com/poodarchu/Det3D
主要优点:
(1)代码在second.pytorch重构后显得清晰易读
(2)包含多个数据集的实现 , 包括KITTI,Nuscence,lyft三个数据集 , waymo在进行中
(3)目前实现的算法包括voxelnet,sencod,pointpillars和CBGS(second_multihead)
(4)apex训练加速
缺点:
不支持多模态和可视化 , 较长时间未更新 。
OpenPCDet
项目链接:https://github.com/open-mmlab/OpenPCDet
优点:
(1)集成了nusecne,kitti数据集 , waymo在进行中
(2)包含算法有pointRCNN,PartA2,voxelnet,PointPillar,SECOND,PV-RCNN , SECOND-MultiHead (CBGS) 。
(3)更多的特征提取结构 , 包括了点和voxel两个方面的特征提取器都有 。
(4)具有可视化demo
(5)代码风格清晰易读
缺点:
无多模态
mmdetection3d
项目链接:https://github.com/open-mmlab/mmdetection3d
主要优点:
(1)支持多模态融合 , 二维网络和三维网络可结合 。
(2)支持多种算法和模型 , 超过40多种算法 , 300多个模型 , 包括有VoteNet , PointPillars , SECOND , Part-A2 。 (不包含PVRCNN)
(3)更快的训练速度 , 比前面介绍到的codebase都要更快 。
(4)支持多种数据集 , 包括室内和室外数据集 。
笔者总结
这一篇博客主要介绍了目前在3D点云目标检测中的数据集和目前比较流行的针对自动驾驶场景的科研项目 , 就项目而言 , 笔者最先看的是second.second 。 不过代码阅读比较困难 , 比较推荐openpcdet和mmdetection3d , 二者各有优缺 , openpcdet更加专注于点云室外场景 , 包含多种点云特征提取模型 。 mmdetection3d则是一个比较新的模型结构 , 多个模块组装简单 , 同时支持多模态 , 就科研来说 , 更具有开发空间 。