88858cc永利官网

我校研究成果被国际计算机视觉与模式识别会议CVPR 2026录用

首页 发布时间:2026年03月04日 作者:童童 编辑:李德万 来源:信息与通信工程学院

88858cc永利官网新闻网讯  近日,我校电子信息专业学位类别2024级硕士研究生张国辉以第一作者身份完成的学术论文“Seeing Both Sides: Towards Bidirectional Semantic Alignment for Open-Vocabulary Camouflaged Object Segmentation”,被计算机视觉与模式识别CCF-A顶级会议CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)录用,指导教师为信息与通信工程学院孙福明教授。


该研究聚焦开放词汇伪装目标分割(OVCOS)中的关键挑战,主要包括现有单向交互策略导致的图像级文本语义与像素级分割线索之间的语义鸿沟,以及复杂伪装场景下视觉与文本模态特征匹配失衡引发的严重语义混淆问题。针对上述问题,论文提出BaCLIP框架,从跨模态双向语义对齐的角度出发,对视觉—文本特征的交互与融合机制进行系统性重构。框架中,相互细化增强模块(MREM)在视觉与文本特征间构建双向交叉注意力,生成相互校准的增强特征并实现语义歧义消解,同时显式强化跨模态特征的一致性对齐,使模型能够兼顾文本描述的类别语义引导与视觉特征的像素级细节表征,从而提升对伪装目标的定位准确性与分割边界的精细刻画能力。与此同时,伪装线索提取器(CCE)与自适应文本提示机制采用“视觉精修—语义适配”策略,对伪装目标的视觉特征进行多频率、多尺度的分层建模,同时将精化后的文本嵌入转化为适配SAM的语义感知提示并完成融合解码,强调伪装目标的纹理、形态等关键视觉线索与文本语义的精准匹配,有效抑制背景区域的噪声干扰并避免语义相关区域的误分割。研究团队在OVCamo基准数据集上对方法进行了全面验证,结果表明BaCLIP在cSm、cIoU等精度指标上取得state-of-the-art性能,同时以紧凑架构在参数量与推理效率等指标上保持良好表现,从而为开放词汇场景中伪装目标的鲁棒分割提供了一条兼顾性能与效率的可行路径。




CVPR为中国计算机学会(CCF)推荐的最高级CCF-A类国际会议,是计算机视觉与模式识别领域最具权威性的国际会议之一,与ICCV、ECCV并称为计算机视觉领域三大顶级国际会议。

分享
检测到当前浏览器版本过低,这会影响网站的显示效果, 请升级浏览器以获得更好的浏览体验。