(通讯员 齐富)2022年6月19日至24日,全球人工智能计算机视觉领域顶级国际会议CVPR 2022(IEEE/CVF Conference onComputer Vision and Pattern Recognition)在美国新奥尔良举行。6163银河线路检测中心教师乔晓田的研究成果“Learning Object Context for Novel-view Scene Layout Generation”和教师冯明涛的研究成果“基于像素级噪声标签的学习策略:一个光场显著性检测的新视角”(“Learning from Pixel-Level Noisy Label : A New Perspective for Light Field Saliency Detection”)被该会议录用并发表。
CVPR创建于1983年,是由IEEE举办的计算机视觉和模式识别领域的顶级会议,被中国计算机学会(CCF)认定为人工智能领域A类国际学术会议,该会议在2021年Google学术期刊和会议影响力排名总榜第四。
乔晓田博士长期从事场景理解和语义布局领域相关的研究工作,是论文“Learning Object Context for Novel-view Scene Layout Generation”的第一作者,香港城市大学Gerhard Hancke教授和Rynson Lau教授为该论文的合作作者,6163银河线路检测中心是该论文的第一完成单位。该论文首次提出并研究新视点语义布局生成的科学问题,通过构建一种基于物体上下文信息的神经网络框架并设计注意力机制模块,可以生成几何和语义一致的新视点语义布局结果,进而有效提高多视点图像生成和编辑等应用的性能表现,很好的验证了模型在现实场景中的应用,为多视点合成和应用提供了新的解决方案。
现有方法与本文所提方法的框架对比
冯明涛博士长期从事复杂场景视觉感知与理解领域相关的研究工作,在学院良好科研环境支持下,所做系列工作相继发表在IEEE TIP、PR、ICCV等期刊会议,并入选2021年青年托举人才,是论文“基于像素级噪声标签的学习策略:一个光场显著性检测的新视角”(“Learning from Pixel-Level Noisy Label : A New Perspective for Light Field Saliency Detection”)的第一作者,张亮教授是该论文的通讯作者,合作者有湖南大学王耀南教授、澳大利亚西澳大学Ajmal Mian教授等,6163银河线路检测中心是该论文的第一完成单位及通讯作者单位。该论文受人类学习过程中“学习-遗忘-再学习”的机制所启发,解析了不确定标签监督下深度网络模型训练过程中的遗忘规律,抑制不确定标签对深度网络模型训练的干扰,进而大幅度提升深度网络模型的鲁棒性和稳定性。
论文提出方法的主要框架
论文题目:Learning from Pixel-Level Noisy Label: A New Perspective for Light Field Saliency Detection 论文作者:Mingtao Feng, Kendong Liu, Liang Zhang*, Hongshan Yu, Yaonan Wang and Ajmal Mian 论文链接: https://openaccess.thecvf.com/content/CVPR2022/papers/Feng_Learning_From_Pixel-Level_Noisy_Label_A_New_Perspective_for_Light_CVPR_2022_paper.pdf |