Abstract:
文本到图像生成是一项极具挑战性的跨模态任务,目标是根据给定文本描述生成对应的图像.尽管现阶段相关研究在视觉呈现方面效果优异,但仍存在细节表达不够精细、语义一致性欠佳等问题.基于此,文章提出了一种基于语义增强的生成对抗模型,将文本进行编码后送入条件增强模块进行处理,丰富文本语义特征.在生成网络中,添加一个自适应块,在仿射变换前将上一层的输出和文本语义信息输入自适应块进行进一步的信息增强.并通过引入对比损失,提高文本与生成图像之间的语义一致性.将这一方法在MSCOCO和CUB birds 200 两个数据集上进行训练测试,实验结果表明,与其他模型相比,性能得到了较高提升.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
信息技术与信息化
ISSN: 1672-9528
Year: 2025
Issue: 1
Page: 5-9
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: