Abstract:
在自动驾驶技术的领域中,利用鸟瞰图(bird’s eye view, BEV)进行3D目标检测任务已经引起了广泛的关注.针对现有相机至鸟瞰视图转换方法,实时性不足、部署复杂度较高的难题,提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法.首先,针对完整图像特征存在大量冗余信息,引入宽度特征提取器并辅以单目3D检测任务,提炼图像的关键特征,确保过程中信息损失的最小化;其次,提出一种特征引导的极坐标位置编码方法,增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力;最后,通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互,从而生成高质量的BEV特征.实验结果表明:在nuScenes验证集上该网络架构与LSS (lift, splat, shoot)相比mAP从29.5%提升到32.0%,提升了8.5%, NDS从37.1%提升到38.0%,提升了2.4%,表明该模型在自动驾驶场景下的3D目标检测任务的有效性.同时相比于LSS在延迟上降低了41.12%.
Keyword:
Reprint 's Address:
Email:
Source :
计算机系统应用
Year: 2025
Issue: 02
Volume: 34
Page: 246-253
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: