• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

郑向涛 (郑向涛.) [1] | 赵郑营 (赵郑营.) [2] | 宋宝贵 (宋宝贵.) [3] | 李浩 (李浩.) [4] | 卢孝强 (卢孝强.) [5]

Abstract:

随着遥感技术和人工智能的深度融合,人类对遥感数据的应用需求日益精细化。然而,单一模态数据在复杂场景解译中存在局限性,难以充分挖掘遥感图像中的深层信息。为此,多模态数据协同分析成为提升遥感解译能力的关键途径,并推动着遥感领域的进一步发展。图文跨模态理解通过文本描述建立遥感图像和人类认知的联系,借助文本语义信息增强视觉特征表征,实现跨模态信息互补,显著提升了遥感解译的性能。本文以遥感图文跨模态理解为主线,将遥感图文跨模态理解划分为遥感图像描述、文本生成图像、遥感图文对齐和遥感图像问答4个任务。首先概述了国内外图文跨模态研究的发展状况;然后对遥感图文跨模态理解常用的公开数据集和评价指标进行介绍;最后,总结了遥感图文跨模态理解面临的技术挑战,并对未来研究方向进行展望。

Keyword:

图像描述 图像问答 图文对齐 文本生成图像 遥感图文跨模态 遥感跨模态数据集

Community:

  • [ 1 ] 福州大学物理与信息工程学院
  • [ 2 ] 西安理工大学计算机科学与工程学院
  • [ 3 ] 平顶山学院软件学院
  • [ 4 ] 空军预警学院

Reprint 's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

遥感学报

Year: 2025

Issue: 06

Volume: 29

Page: 1566-1586

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 0

Affiliated Colleges:

Online/Total:1279/13886334
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1