• 简体   /   繁体
反向聚焦细粒度多模态语义对齐的视频字幕模型-计算机应用研究2025年07期

反向聚焦细粒度多模态语义对齐的视频字幕模型

作者:蔡霞 罗会兰 万斯奇 字体:      

中图分类号:TP391 文献标志码:A 文章编号:1001-3695(2025)07-009-1986-08

doi:10.19734/j. issn.1001-3695.2024.11.0492

Abstract:Existingvideocaptioningoftenintroducemultimodal informationtoassistmode(试读)...

计算机应用研究

2025年第07期