Abstract:
针对多模态信息在三维空间融合过程中数据一致性和有效性的问题,提出鸟瞰视角(BEV)下图像与雷达融合的编码模块BEVIRF.与传统的透视视角下深度信息缺失的方案相比,本方法利用可变注意力的改进方案聚合图像和雷达信息,解决不同模态信息的统一表示问题,生成语义丰富且包含空间位置信息BEV特征图.同时在基于Transformer的网络结构中提出动态位置编码,旨在通过感知物体的空间信息来生成对应的位置编码,让模型专注于目标的回归,减少查询与匹配的不稳定性.所提出的方案在nuScenes数据集上取得了优秀结果.
Keyword:
Reprint 's Address:
Email:
Source :
福州大学学报(自然科学版)
ISSN: 1000-2243
Year: 2024
Issue: 6
Volume: 52
Page: 659-666
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: