家庭教师av

学术科研
家庭教师av当前位置: 家庭教师av > 学术科研 > 正文
罗俊课题组在视觉图像增强领域取得新进展
家庭教师av发布日期 2025-07-07 家庭教师av浏览次数

(图文 | 王烁、信息 编辑 | 辛西 审核 | 罗俊)近日,家庭教师av 2024级研究生王烁(导师:罗俊)撰写的题为 “DRMix: Decomposition-Recomposition Data Augmentation with Diffusion Model”的论文被第33届ACM MM 2025大会录用。

当现代人工智能研究与中国传统文化碰撞会激起怎样的火花?研究者认为,苏轼的哲理诗行“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中”提醒我们,“整体认知”和“局部观察”具有辩证关系,局部像素与整体图像的视角联合可从多方面更好理解图像本质。毕昇的“活字印刷”将文字从固定的雕版中解放出来,更启发我们:图像整体风格、区域组件和关键部件所对应的像素单元,可通过自由组合实现无限表达。

罗俊团队受到中国传统文化“整体-局部”辩证思维和毕昇“活字印刷”动态重组思想的深刻启发,创新性地提出解构重构范式的类内生成式数据增强方法DRMix,旨在破解生成式模型在视觉图像任务中高效应用的难题。

图像是人们日常生活中最常见的数据,其包含丰富的像素内容,每张图片的前景和背景形成了高效的信息分层结构,前景包含主体目标,背景提供额外的环境信息。通过全面增强图像中的前景和背景信息,有助于准确理解图像类别、语义和空间关系,对于提升图像识别算法的场景适应性具有重要意义。

传统数据增强和现代生成式数据增强方法,在同时保证前景目标真实性与背景环境多样性方面,均存在显著局限。罗俊研究团队聚焦该前沿挑战,提出一种高效的类内数据增强方法DRMix。该方法通过两阶段的分解与重组机制,首先采用前景-背景分解策略,使用扩散模型替换背景,提升生成样本的背景多样性。进一步利用分割模型将前景分解为部件,通过灵活组合这些部件,实现类内前景部件的组合多样化,前景部件的类内重组策略具备类别一致性特点。该方法在保证样本真实性的同时显著提升数据多样性,使模型能在有限真实数据条件下进行学习,并推断出未见过的新组合,解决了真实世界图像目标多样性与复杂性高效组合的问题。

DRMix进行了大量实验,本方法在图像分类、小样本学习、迁移学习、弱监督目标定位(WSOL)等多项任务上均全面超越现有所有方法。DRMix在多样性与保真度之间实现了更优平衡,并能在样本数量更少的情况下获得更好性能,是一种高效且低成本的生成式数据增强方法。

家庭教师av 2024级研究生王烁为论文第一作者,罗俊为论文通讯作者。ACM MM(ACM International Conference on Multimedia)是多媒体处理、多模态分析与计算领域最具影响力的国际顶级学术会议,由国际计算机协会(ACM)发起,是中国计算机学会(CCF)推荐的人工智能方向A类会议。这是家庭教师av 独立完成并作为唯一通讯单位首次在ACM MM上发表论文。