自动驾驶环境感知——永恒之塔武器技能怎么用激光雷达物体检测(chapter4)     DATE: 2023-11-23 21:26:11

1. 基本概念

相比于视觉间接地获取3D信息,自动激光雷达可以直接获取目标及场景的驾驶激光检测3D信息,但是环境激光雷达不能获取纹理、颜色等特征,感知因此激光雷达和相机是雷达互补的

90bd42fc-8525-11ee-939d-92fbcf53809c.png

调频连续波是毫米波雷达测距的原理。

90ee93f2-8525-11ee-939d-92fbcf53809c.png

随着自动驾驶级别的物体提高,对于激光雷达的自动需求也逐渐提高。

911aeaec-8525-11ee-939d-92fbcf53809c.png

9145eb34-8525-11ee-939d-92fbcf53809c.png

激光雷达不仅可以做到多视图融合,驾驶激光检测还能进行多传感器融合(此时是环境一个状态估计问题,将不同传感器的感知感知结果看成是观测)。

2. 点云数据库

9170c91c-8525-11ee-939d-92fbcf53809c.png

随着工业界落地需求的雷达增加,数据集的物体规模也越来越大。

91a9663c-8525-11ee-939d-92fbcf53809c.png

91cc50ca-8525-11ee-939d-92fbcf53809c.png

3. 物体检测算法

91ed8e70-8525-11ee-939d-92fbcf53809c.png

3.1点视图

920937c4-8525-11ee-939d-92fbcf53809c.png

9228fb4a-8525-11ee-939d-92fbcf53809c.png

PointNet直接处理无序点云,自动因此在最后需要借助一个操作(例如max_poolingaverage_pooling)来消除最终的驾驶激光检测结果与点云输入顺序间的关联

PointNet++逐层提取特征扩大感受野。PointNet++可以将聚类结果作为候选框生成的环境依据:对聚类结果中的每个点关联一组锚框,并且进行分类与回归的操作(类似RPN网络)

9256d1e6-8525-11ee-939d-92fbcf53809c.png

926f2b56-8525-11ee-939d-92fbcf53809c.png

92959aca-8525-11ee-939d-92fbcf53809c.png

Point-RCNN通过前景分割的方式来避免耗时的聚类过程,但是也会存在较为耗时的全局搜索过程。

92b6ce84-8525-11ee-939d-92fbcf53809c.png

3D-SSD通过改进聚类的质量,直接在聚类结果上生成候选框。

92e5961a-8525-11ee-939d-92fbcf53809c.png

3.2俯视图

93002214-8525-11ee-939d-92fbcf53809c.png

9320d64e-8525-11ee-939d-92fbcf53809c.png

934a0b2c-8525-11ee-939d-92fbcf53809c.png

9377190a-8525-11ee-939d-92fbcf53809c.png

VoxelNet通过将三维空间划分成体素,并在每个体素内进行特征提取,形成四维张量(D, H, W, C)。

利用3D-CNN对四维张量进行特征提取,并将高度方向上压缩为1D,得到三维张量(H', W', C')。最后,利用2D视觉感知算法进行检测任务。

939347e2-8525-11ee-939d-92fbcf53809c.png

VoxelNet在划分体素时,由于点云是稀疏的,会导致大量体素是空白的,这样在进行3D卷积时会造成很多无效计算。

93a7b7ae-8525-11ee-939d-92fbcf53809c.png

93c8b30a-8525-11ee-939d-92fbcf53809c.png

SECOND采用稀疏卷积避免空白体素区域的无效计算

93ebb832-8525-11ee-939d-92fbcf53809c.png

PIXOR将高度方向划分为H个等级,如果有点云落在某个格子里,此处的Occupancy为1,且Intensity为格子里点云强度的均值。

9412a5fa-8525-11ee-939d-92fbcf53809c.png

942f8c6a-8525-11ee-939d-92fbcf53809c.png

945c9174-8525-11ee-939d-92fbcf53809c.png

948a4600-8525-11ee-939d-92fbcf53809c.png

AFDet经过轻量级的点云特征提取,首先将点云体素化,并且每个体素的特征为点云反射强度的均值,再用稀疏3D卷积进行特征提取。这样,可以将四维张量变为伪图像的三维张量。

AFDet中的自校准卷积其实就是对三维张量施加了注意力机制。

AFDet与CenterNet比较类似:先预测中心点的objectiveness,然后结合z轴方向的预测,可以得到物体在三维坐标系中的位置;接着预测物体框的大小和朝向,以及物体中心点的偏移;同时,会加入物体框的IOU置信度预测(衡量框的质量好坏,因为中心点objectiveness不包含框质量的信息)和关键点预测

94ae2c96-8525-11ee-939d-92fbcf53809c.png

点视图的精度一般较高,因为没有量化损失

俯视图可以并行优化,一般速度较快

3.3 前视图

94d67052-8525-11ee-939d-92fbcf53809c.png

94fc6e88-8525-11ee-939d-92fbcf53809c.png

前视图虽然是网格结构,但是编码了三维空间信息,因此需要设计额外的操作来提取空间信息。

9526f3b0-8525-11ee-939d-92fbcf53809c.png

9541a124-8525-11ee-939d-92fbcf53809c.png

采用普通卷积提取特征,会损失空间信息

955aed5a-8525-11ee-939d-92fbcf53809c.png

95856670-8525-11ee-939d-92fbcf53809c.png

95a8d7c2-8525-11ee-939d-92fbcf53809c.png

Meta-Kernel是动态变化的:1)对于同一样本的不同位置是不同的;2)对于不同样本相同位置也是不同的。普通卷积对于不同样本的相同位置都是一样的。因此,Meta-Kernel可以看作是对样本和位置的一种注意力机制。

95c2abac-8525-11ee-939d-92fbcf53809c.png

3.4 多视图融合

95e58c62-8525-11ee-939d-92fbcf53809c.png

961496d8-8525-11ee-939d-92fbcf53809c.png

Voxel特征可看作粗粒度的特征,而点特征可看作细粒度特征

963a567a-8525-11ee-939d-92fbcf53809c.png

9662f9a4-8525-11ee-939d-92fbcf53809c.png

每个Pillar内部采用PointNet进行特征提取,并采用MaxPooling将同一个Pillar内部多个点的特征压缩成一个全局特征,从而形成伪图像

968051a2-8525-11ee-939d-92fbcf53809c.png

96a9d66c-8525-11ee-939d-92fbcf53809c.png

96cce774-8525-11ee-939d-92fbcf53809c.png

当预测的角度与真实的角度相差180°时,Δθ的损失值一样,因此加入L_dir弥补这一缺点,但是权重要小一点。

97048530-8525-11ee-939d-92fbcf53809c.png

97392cb8-8525-11ee-939d-92fbcf53809c.png

976da54c-8525-11ee-939d-92fbcf53809c.png

979bc648-8525-11ee-939d-92fbcf53809c.png

97c31fae-8525-11ee-939d-92fbcf53809c.png

粗粒度与细粒度特征的融合

97df8892-8525-11ee-939d-92fbcf53809c.png

对候选框中的稀疏点集进行扩展

980bf526-8525-11ee-939d-92fbcf53809c.png

98329b86-8525-11ee-939d-92fbcf53809c.png

将3D proposal分别向bevfront viewimage上投影

9853ad30-8525-11ee-939d-92fbcf53809c.png

98787868-8525-11ee-939d-92fbcf53809c.png

98a070a2-8525-11ee-939d-92fbcf53809c.png

在俯视图上通过自车运动的补偿,融合多帧信息进行检测(可以将多帧图像拼接在一起送入检测网络提取特征,并进行检测)

98c99d38-8525-11ee-939d-92fbcf53809c.png

98ef1252-8525-11ee-939d-92fbcf53809c.png

990ffe5e-8525-11ee-939d-92fbcf53809c.png

993607d4-8525-11ee-939d-92fbcf53809c.png

995e9e2e-8525-11ee-939d-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。