3d目标检测调研

如题所述

第1个回答 2022-06-02

在达摩院做3d目标检测，简单调研一下。

使用RGB图像、RGB-D深度图像和激光点云，输出物体类别及在三维空间中的长宽高、旋转角等信息的检测称为3D目标检测。

在无人驾驶、机器人、增强现实的应用场景下，普通2D检测并不能提供感知环境所需要的全部信息，2D检测仅能提供目标物体在二维图片中的位置和对应类别的置信度，但是在真实的三维世界中，物体都是有三维形状的，大部分应用都需要有目标物体的长宽高还有偏转角等信息。例如下图Fig.1中，在自动驾驶场景下，需要从图像中提供目标物体三维大小及旋转角度等指标，在鸟瞰投影的信息对于后续自动驾驶场景中的路径规划和控制具有至关重要的作用。

3DOP这篇文章是当下使用双目相机进行3D bounding-box效果做好的方法，其是Fast RCNN方法在3D领域之内的拓展。由于原论文发表于NIPS15，出于Fast RCNN的效果并没有Faster RCNN和基于回归的方法好，且远远达不到实时性，因此其处理一张图片的时间达到了4.0s。

它使用一个立体图像对作为输入来估计深度，并通过将图像平面上像素级坐标重新投影回三维空间来计算点云。3DOP将候选区生成的问题定义为Markov随机场(MRF)的能量最小化问题，该问题涉及精心设计的势函数(例如，目标尺寸先验、地平面和点云密度等)。

随着获得了一组不同的3D目标的候选框，3DOP利用FastR-CNN[11]方案回归目标位置。

论文主要基于FCOS无锚点2D目标检测做的改进，backbone为带有DCN的ResNet101，并配有FPN架构用于检测不同尺度的目标，网络结构如图1所示：

基于iou 3d，可以定义出TP和FP

通过绘制精确性×召回率曲线（PRC），曲线下的面积往往表示一个检测器的性能。然而，在实际案例中，"之 "字形的PRC给准确计算其面积带来了挑战。KITTI采用AP@SN公制作为替代方案，直接规避了计算方法。

NuScenes consists of multi-modal data collected from 1000 scenes, including RGB images from 6 cameras, points from 5 Radars, and 1 LiDAR. It is split into 700/150/150 scenes for training/validation/testing. There are overall 1.4M annotated 3D bounding boxes from 10 categories. In addition, nuScenes uses different metrics, distance-based mAP and NDS, which can help evaluate our method from another perspective.

相似回答

3D目标检测,第一步要做的是什么?答：论文中，F-PointNet通过结合2D检测构建视锥区域，实现点云预处理，具有显著的性能提升。该方法将网络分解为三个关键步骤：视锥提议、3D实例分割和3D不规则边界框估计。核心优势在于：通过2D检测器的精确定位，视锥有效减小搜索范围，每个2D边界框对应一个单独的物体。视锥内信息丰富，每个视锥对应一个物体...

3D目标检测(教程+代码)答：ARCore/ARKit的加入，使得智能手机能够实时捕捉3D点云，我们设计的AR注释工具则能快速、准确地标注3D边界框，通过分屏视图进行高效验证。对于静态对象，只需一次标注，姿态信息的实时更新使其适用于实时应用和毕业设计。总的来说，3D目标检测是一个融合了深度学习智慧与创新技术的领域，每个环节都需要精细的设...

kitti数据集在3D目标检测中的入门答：尽管Kitti数据集提供了2D和3D的可视化，但3D点云的2D展示目前未实现。理解3D相机坐标和点云映射关系至关重要，尤其是在训练模型时。最后，官方的3D目标检测评估工具可在官网下载或从GitHub克隆：https://github.com/prclibo/kitti_eval.git，评估过程包括安装评估程序、组织数据文件和执行`evaluate_object_...

3D目标检测深度学习方法之voxel-represetnation内容综述(一)答：While voxel-representation presents challenges, the quest for speed optimization has mainly been explored in point-based methods, with examples like 3D-SSD in VPR20. As for accuracy enhancement, we find improvements in refinement, loss functions, fusion, backbone structures, and more, ...

自动驾驶采标系列三:基于图像的目标检测技术答：3D世界的深度洞察2D仅限于位置识别，3D目标检测如RGB-D和Stereo R-CNN引入深度信息和3D边界框，利用预训练CNN提取几何和深度特征，为车辆、行人等物体的三维定位提供了关键支持。车道线与2D拉框：细致标注包括实线、虚线、斑马线等，强调遮挡程度和车辆类别。像素级语义分割：道路区域、行人、障碍物的...

什么是3D视觉检测?相比传统2D视觉检测有什么优势?答：3D视觉检测，是相对于2D视觉检测而言的。随着机器视觉技术的发展，2D视觉检测因其自身局限性，越来越难以适应企业对精确度和自动化的要求，3D视觉检测技术也因此越来越受欢迎。综合对比来看，3D视觉检测技术具有以下优势：一、不受目标物体对比度的影响，测量更加精准 2D视觉检测严重依赖于被测物体表面的对比...

阿里巴巴自动驾驶新突破:3D物体检测精度与速度实现兼得答：据了解，自动驾驶检测器是自动驾驶具备感知能力的核心组件，检测器需要快速处理、分析传感器、激光雷达等采集的多维信息，使车辆识别周围环境物体，并对物体在三维空间中的位置进行精准定位，这个过程需要3D目标检测的辅助。与使用RGB图像进行目标检测，以输出物体类别和在图像上2D bounding box的2D检测方式不同...

大家正在搜

3D目标检测 3d目标灯光怎么调整 3d目标灯光参数怎么调 3d目标灯光怎么调亮度确定调研目标调研目标是什么调研目标的方法调研目标的方法有哪些调研目标一般可以分为