Abstract:
针对当前三维目标检测由于数据增强导致点云和图像无法有效对齐,点与点对齐方法会丢失图像特征以及定位和分类置信度不一致的问题,提出一种多模态融合的三维目标检测方法.首先,采用PointNet++提取点云的特征;采用卷积神经网络提取图像特征;其次,在点云与图像融合阶段,采用语义对齐方法以及图像球特征,实现点云与图像更好的跨模态对齐.同时采用基于注意力的方法来指导点云与图像特征的融合,以获取更可靠的图像特征;最后引入DIoU损失来平衡置信度不一致的问题.实验结果表明:所采用的方法明显优于baseline,在简单、中等和困难任务下,Car类别的mAP达85.6%.
Keyword:
Reprint 's Address:
Email:
Source :
光电子技术
ISSN: 1005-488X
Year: 2025
Issue: 1
Volume: 45
Page: 75-81
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 2