Abstract:
随着遥感技术和人工智能的深度融合,人类对遥感数据的应用需求日益精细化。然而,单一模态数据在复杂场景解译中存在局限性,难以充分挖掘遥感图像中的深层信息。为此,多模态数据协同分析成为提升遥感解译能力的关键途径,并推动着遥感领域的进一步发展。图文跨模态理解通过文本描述建立遥感图像和人类认知的联系,借助文本语义信息增强视觉特征表征,实现跨模态信息互补,显著提升了遥感解译的性能。本文以遥感图文跨模态理解为主线,将遥感图文跨模态理解划分为遥感图像描述、文本生成图像、遥感图文对齐和遥感图像问答4个任务。首先概述了国内外图文跨模态研究的发展状况;然后对遥感图文跨模态理解常用的公开数据集和评价指标进行介绍;最后,总结了遥感图文跨模态理解面临的技术挑战,并对未来研究方向进行展望。
Keyword:
Reprint 's Address:
Email:
Source :
遥感学报
Year: 2025
Issue: 06
Volume: 29
Page: 1566-1586
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: