西电主页 English 宣传部
西电要闻
表格等宽内容时,请左右滑动 <>
西电学子获CVPR 2022图像压缩挑战赛图像质量感知赛道季军
时间:2022-07-04 10:19:05来源:通信工程学院点击:

西电新闻网讯(通讯员 何刚)近日,一年一度的计算机视觉学术盛宴CVPR(IEEE Conference on Computer Vision and Pattern Recognition)刚刚落下帷幕。在本届CVPR大会中,为了促进机器学习与计算机视觉技术在图像和视频压缩领域的发展,由Google、Apple、Netflix等公司联合举办的第五届CVPR-CLIC2022(The 5th Workshop and Challenge on Learned Image Compression)竞赛吸引了全球大量的队伍参与,其中也包括阿里巴巴、字节跳动、商汤等在业内处于领先地位的科技公司及清华、北大、中科大等顶尖高校。

在历经两个多月的激烈角逐后,通信工程学院何刚老师带领团队Kingslayer(团队成员:王勇、徐莉、张文莉)和北京快手科技有限公司合作在图像质量感知赛道(Perceptual Quality Track)中获得全球第三(季军),高校排名第二的优异成绩。何刚老师是通信工程学院图像传输与处理研究所(图像所)骨干成员,图像所隶属于ISN国家重点实验室,负责人为李云松教授。

团队在CVPR-CLIC2022竞赛全球第三的获奖证书

团队发表于CVPR2022 Workshop的FFDN质量评价论文相关信息

当今图像与视频成为人们获取信息的最主要方式,然而图像视频从采集、压缩、存储到传输,都可能发生失真,从而导致接收到的视觉信息丢失,因此评价图像视频的质量好坏对图像恢复、图像检索、图像质量监控系统等各个方面有着重要的作用及广泛的应用。同时,构建更加准确高效的客观质量评价模型代替较为费时费力的主观质量评价已成为研究与发展的趋势。在今年举办的CVPR-CLIC2022图像压缩竞赛中,图像质量感知赛道旨在让参赛选手设计更加准确高效的有参考质量评价模型(FR-IQA)来对压缩受损的图像进行客观质量评价。但由于图像压缩受损的多种算法未知,且大多数不同失真图与参考图十分相似导致差异化不明显,甚至包含很多人眼主观难以给出评价的失真图像。因此对搭建有参考质量评价模型提出较高的挑战难度。

针对这一具有挑战的任务,何刚老师带领团队Kingslayer设计了一个聚焦特征差异化网络的质量评价模型(Focused Feature Differentiation Network for Image Quality Assessment,FFDN),模型针对失真图与参考图相似导致差异化不明显的情况使用通道注意力聚焦失真图与参考图的差异化特征图。同时,使用多尺度特征融合,在不同感受野下进行特征融合,使聚焦后的差异化特征得到最大化利用。此外,针对单一评价指标在质量评价中存在的部分局限性,使用多评价指标融合的方式来提升评价效果。最终在比赛测试集上准确率为79.6%,获得了第三名的优异成绩,且前三名差距较小,准确率均高于79%,大幅超出第四名。在其他评价指标ELO SRCC和ELO PLCC上得分分别为0.95和0.96,均位于第三名。ELO SRCC和ELO PLCC指标用于反映模型打分与人类主观打分的相近程度,从指标结果来看,FFDN质量评价模型很大程度上接近人眼主观评价水平。

提出的FFDN质量评价网络的模型结构图

获奖团队简介:

何刚,副教授,现工作于西安电子科技大学通信工程学院图像传输与处理研究所(图像所)。图像所是ISN国家重点实验室成员单位,负责人是李云松教授。本科毕业于西安交通大学,博士毕业于日本早稻田大学,师从后藤敏教授(IEEE Life Fellow),研究方向是基于人工智能的未来高效视频编码,基于深度学习卷积网络和对抗技术的图像增强处理,视频编码算法及VLSI结构设计等研究,发表包括AAAI、CVPR、T-CSVT等顶级人工智能及计算机视觉领域会议期刊在内的SCI论文及国际会议50余篇。主持了国家自然科学基金,陕西省自然基金,及国家一等博士后基金。同时与工业界多次合作促进产学研结合,包括联合开发AI视频图像增强系统,联合开发4K编解码系统,联合开发高动态视频处理等。此外,曾开发AI视频增强2019年被CCTV13《朝闻天下》采访报道,于2021年参与编解码项目受《陕西新闻》采访报道等。

王勇,硕士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)成员,指导老师是何刚老师。研究方向为视频图像质量评价与增强处理。

徐莉,博士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)博士研究生,博士期间的指导老师为雷杰老师和何刚老师。研究方向为深度学习在图像视频压缩与增强、评价等领域上的应用,目前已在AAAI、T-CSVT等国际顶级会议期刊发表多篇论文。

张文莉,硕士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)成员,指导老师是何刚老师。研究方向为视频图像质量评价与增强处理。

相关链接:

比赛链接:

http://compression.cc/

论文链接:

https://openaccess.thecvf.com/content/CVPR2022W/CLIC/html/He_Focused_Feature_Differentiation_Network_for_Image_Quality_Assessment_CVPRW_2022_paper.html

上一条:西电举行陕西省西安市文明交通主题实践活动试点高校揭牌仪式
下一条:组图|2020级本科生军训掠影(五)

请遵守《互联网电子公告服务管理规定》及中华人民共和国其他有关法律法规。
用户需对自己在使用本站服务过程中的行为承担法律责任。
本站管理员有权保留或删除评论内容。
评论内容只代表网友个人观点,与本网站立场无关。
 匿名发布 验证码 看不清楚,换张图片
0条评论    共1页   当前第1
西电学子获CVPR 2022图像压缩挑战赛图像质量感知赛道季军
发布时间:2022-07-04 10:19:05来源:通信工程学院点击:我要评论: 0

西电新闻网讯(通讯员 何刚)近日,一年一度的计算机视觉学术盛宴CVPR(IEEE Conference on Computer Vision and Pattern Recognition)刚刚落下帷幕。在本届CVPR大会中,为了促进机器学习与计算机视觉技术在图像和视频压缩领域的发展,由Google、Apple、Netflix等公司联合举办的第五届CVPR-CLIC2022(The 5th Workshop and Challenge on Learned Image Compression)竞赛吸引了全球大量的队伍参与,其中也包括阿里巴巴、字节跳动、商汤等在业内处于领先地位的科技公司及清华、北大、中科大等顶尖高校。

在历经两个多月的激烈角逐后,通信工程学院何刚老师带领团队Kingslayer(团队成员:王勇、徐莉、张文莉)和北京快手科技有限公司合作在图像质量感知赛道(Perceptual Quality Track)中获得全球第三(季军),高校排名第二的优异成绩。何刚老师是通信工程学院图像传输与处理研究所(图像所)骨干成员,图像所隶属于ISN国家重点实验室,负责人为李云松教授。

团队在CVPR-CLIC2022竞赛全球第三的获奖证书

团队发表于CVPR2022 Workshop的FFDN质量评价论文相关信息

当今图像与视频成为人们获取信息的最主要方式,然而图像视频从采集、压缩、存储到传输,都可能发生失真,从而导致接收到的视觉信息丢失,因此评价图像视频的质量好坏对图像恢复、图像检索、图像质量监控系统等各个方面有着重要的作用及广泛的应用。同时,构建更加准确高效的客观质量评价模型代替较为费时费力的主观质量评价已成为研究与发展的趋势。在今年举办的CVPR-CLIC2022图像压缩竞赛中,图像质量感知赛道旨在让参赛选手设计更加准确高效的有参考质量评价模型(FR-IQA)来对压缩受损的图像进行客观质量评价。但由于图像压缩受损的多种算法未知,且大多数不同失真图与参考图十分相似导致差异化不明显,甚至包含很多人眼主观难以给出评价的失真图像。因此对搭建有参考质量评价模型提出较高的挑战难度。

针对这一具有挑战的任务,何刚老师带领团队Kingslayer设计了一个聚焦特征差异化网络的质量评价模型(Focused Feature Differentiation Network for Image Quality Assessment,FFDN),模型针对失真图与参考图相似导致差异化不明显的情况使用通道注意力聚焦失真图与参考图的差异化特征图。同时,使用多尺度特征融合,在不同感受野下进行特征融合,使聚焦后的差异化特征得到最大化利用。此外,针对单一评价指标在质量评价中存在的部分局限性,使用多评价指标融合的方式来提升评价效果。最终在比赛测试集上准确率为79.6%,获得了第三名的优异成绩,且前三名差距较小,准确率均高于79%,大幅超出第四名。在其他评价指标ELO SRCC和ELO PLCC上得分分别为0.95和0.96,均位于第三名。ELO SRCC和ELO PLCC指标用于反映模型打分与人类主观打分的相近程度,从指标结果来看,FFDN质量评价模型很大程度上接近人眼主观评价水平。

提出的FFDN质量评价网络的模型结构图

获奖团队简介:

何刚,副教授,现工作于西安电子科技大学通信工程学院图像传输与处理研究所(图像所)。图像所是ISN国家重点实验室成员单位,负责人是李云松教授。本科毕业于西安交通大学,博士毕业于日本早稻田大学,师从后藤敏教授(IEEE Life Fellow),研究方向是基于人工智能的未来高效视频编码,基于深度学习卷积网络和对抗技术的图像增强处理,视频编码算法及VLSI结构设计等研究,发表包括AAAI、CVPR、T-CSVT等顶级人工智能及计算机视觉领域会议期刊在内的SCI论文及国际会议50余篇。主持了国家自然科学基金,陕西省自然基金,及国家一等博士后基金。同时与工业界多次合作促进产学研结合,包括联合开发AI视频图像增强系统,联合开发4K编解码系统,联合开发高动态视频处理等。此外,曾开发AI视频增强2019年被CCTV13《朝闻天下》采访报道,于2021年参与编解码项目受《陕西新闻》采访报道等。

王勇,硕士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)成员,指导老师是何刚老师。研究方向为视频图像质量评价与增强处理。

徐莉,博士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)博士研究生,博士期间的指导老师为雷杰老师和何刚老师。研究方向为深度学习在图像视频压缩与增强、评价等领域上的应用,目前已在AAAI、T-CSVT等国际顶级会议期刊发表多篇论文。

张文莉,硕士研究生,西安电子科技大学通信工程学院图像传输与处理研究所(图像所)成员,指导老师是何刚老师。研究方向为视频图像质量评价与增强处理。

相关链接:

比赛链接:

http://compression.cc/

论文链接:

https://openaccess.thecvf.com/content/CVPR2022W/CLIC/html/He_Focused_Feature_Differentiation_Network_for_Image_Quality_Assessment_CVPRW_2022_paper.html

责任编辑:admin
相关阅读:
    读取内容中,请等待...