近日,计算机视觉和模式识别领域顶级学术会议CVPR2020论文录用名单出炉,学部6篇论文被该会议录用。
CVPR的全称为IEEE Conference on Computer Vision and Pattern Recognition,由IEEE主办,被中国计算机学会(CCF)列为A类会议。此次会议总投稿量达6656篇,录用1470篇,录用率约为22%。
录用论文列表如下(按照论文首字母排序):
题目 |
作者 |
A Multi-task Mean Teacher for Semi-supervised Shadow Detection |
陈峙灏,朱磊,万亮,冯伟,王平安等 |
ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks |
王旗龙, 伍邦谷, 朱鹏飞, 李培华, 左旺孟, 胡清华 |
Neural Blind Deconvolution Using Deep Priors |
任冬伟, 张凯, 王旗龙, 胡清华, 左旺孟 |
Polishing Decision-based Adversarial Noise with a Customized Sampling |
石育澄,韩亚洪,田奇 |
Training Noise-Robust Deep Neural Networks via Meta-Learning |
王振,胡国圣,胡清华 |
What Deep CNNs Benefit from Global Covariance Pooling: An Optimization Perspective |
王旗龙, 张立, 伍邦谷, 任冬伟, 李培华, 左旺孟, 胡清华 |
录用论文简介:
题目:A Multi-task Mean Teacher for Semi-supervised Shadow Detection
作者:陈峙灏,朱磊,万亮,冯伟,王平安等
简介:阴影检测是计算机视觉领域中一个基础性问题,可用于辅助许多视觉任务(如:场景理解,机器人定位,变化监测等)。然而现有的阴影检测方法受限于标注数据集的质量和规模,在复杂场景下的检测效果不甚理想。本文提出了一种基于半监督学习的多任务阴影检测方法,通过利用未标注的带阴影图像数据以及学习阴影的多种相关信息,增强对复杂场景阴影检测的鲁棒性。具体而言,除了预测阴影区域的任务之外,本工作从全局和局部两个层面考量阴影的质量,并在框架中结合了mean-teacher半监督学习,让三个任务的预测结果在未标注数据集上也维持一致性损失。本文在广泛使用的公开数据集上与15种算法进行实验比较,结果表明本文提出的方法在性能上取得了显著提升。
题目:ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks
作者:王旗龙, 伍邦谷, 朱鹏飞, 李培华, 左旺孟, 胡清华
简介:通道注意机制在改善深层卷积神经网络的性能方面显示出了巨大的潜力。然而,大多数现有的方法致力于研究更复杂的注意力模块以获得更好的性能,这不可避免地增加了模型的复杂度。为了克服性能和复杂度之间的悖论,本文提出了一种高效的通道注意模块,该模块只涉及少量的参数,却能带来明显的性能增益。通过对SENet中通道注意模块的剖析,揭示了避免降维对于学习通道注意是非常重要的,同时适当的跨通道交互可以在显著降低模型复杂度的同时保持性能。因此,本文提出了一种无降维的局部跨信道交互策略,该策略可以通过一维卷积进行高效地实现。在此基础上,本文提出了一种自适应的方法选择一维卷积核的大小。大量的实验表明本文的方法优于同类方法并具有更高的效率。
题目:Neural Blind Deconvolution Using Deep Priors
作者:任冬伟,张凯,王旗龙,胡清华,左旺孟
简介:图像盲反卷积又称图像盲去模糊是底层计算机视觉任务中的基础问题。一方面,传统优化方法过度依赖手工设计先验;另一方面,深度去模糊网络需要大量训练数据,但通常难以处理更加复杂的模糊类型。本文提出了一种针对图像盲反卷积的深度先验的无监督学习方法,通过采用两个生成式网络分别建模图像先验和模糊核先验,提出了无约束的深度盲反卷积优化模型及算法。基于卷积神经网络的编码器可有效学习图像先验以生成清晰图像,而对于模糊核先验简单的全连接层更为有效。实验结果表明本文提出的方法取得了更好的定量指标和视觉质量。
题目:Polishing Decision-based Adversarial Noise with a Customized Sampling
作者:石育澄,韩亚洪,田奇
简介:基于决策的对抗攻击通过查询目标模型来优化对抗噪声,是一类有效的黑盒攻击方法。其中边界攻击因其强大的噪声压缩能力受到广泛的应用,尤其是在与基于迁移的攻击方法相结合的场景下。边界攻击将噪声压缩分为了几个独立的采样过程,以一个不变的采样设置重复每一次查询。在本文中,我们证明了在边界攻击中使用当前噪声和历史查询对采样分布的均值和方差进行定制对于噪声优化的优势。进一步,我们揭示了边界攻击中初始噪声与压缩噪声之间的关系。本文提出定制对抗边界攻击(CAB),利用当前的噪声对每个像素的灵敏度进行建模,并通过定制的采样设置对每张图像的对抗噪声进行优化。定制对抗边界攻击以当前噪声为先验,对采样的高维高斯分布进行定制,同时保证将新的采样偏离历史失败的采样,以避免类似的错误。在多个图像分类数据集上的实验结果表明了该方法的有效性。
题目:Training Noise-Robust Deep Neural Networks via Meta-Learning
作者:王振,胡国圣,胡清华
简介:得益于大规模数据集(如ImageNet)深度神经网络在计算机视觉方面表现出了优秀的性能。但是如此大规模高质量的标记精确的数据集需要花费大量的时间和人工成本,现实中研究者往往借助于自动标注软件,众包技术等,这不可避免的在样本标签中引入噪声(错误的标签),从而降低深度模型的性能。Loss Correction(LC)方法是一种有效的noise-against方法,其假设正确标签和噪声标签之间服从一个未知的噪声转移矩阵(概率)。当前的LC方法通过先验知识估计噪声转移矩阵,比如,堆叠同类样本预测值的最大值或者平均值作为该类的转移概率。本报告中,我们提出一种基于meta-learning的自适应的Loss Correction方法,同时估计噪声转移矩阵和网络权重。该方法是model-agnostic的,而且可以直接从数据中估计噪声转移矩阵而不是依赖于启发式的先验知识。
题目:What Deep CNNs Benefit from Global Covariance Pooling: An Optimization Perspective
作者:王旗龙, 张立, 伍邦谷, 任冬伟, 李培华, 左旺孟, 胡清华
简介:最近的研究表明全局协方差池化(GCP)能够显著提升深层卷积神经网络在视觉分类任务中的性能。尽管如此,GCP在深层卷积神经网络中的作用机理尚未得到很好的研究。本文试图从优化的角度来理解GCP为深层卷积神经网络带来了哪些好处。具体地,本文从优化损失的利普希茨平滑性和梯度的可预测性两个方面探讨了GCP对深层卷积神经网络的影响,同时讨论了GCP与二阶优化之间的联系。更重要的是,本文的发现可以解释一些GCP以前尚未被认识到或充分探索的优点,包括显著加快了网络收敛,对图像破坏和扰动产生的失真样本具有较强的鲁棒性,对不同的视觉任务具有较好的泛化能力。通过利用不同网络架构在多种视觉任务上进行大量的实验,为本文的发现提供了有力的支持。