在测试集上训练，还能中CVPR？这篇IEEE批判论文是否合理？

zzzwwwmmm

2018-12-24

今日，一篇论文帖子在 Reddit 的机器学习版块引起了大家的关注。该论文表示 Concetto Spampinato 等人 2017 年的 CVPR 论文存在错误。但从讨论来看，这篇批评论文同样引起了网友的质疑。

Reddit 讨论地址：https://www.reddit.com/r/MachineLearning/comments/a8p0l8/p_training_on_the_test_set_an_analysis_of/

该论文对 Concetto Spampinato 等人 2017 年的 CVPR 论文《Deep Learning Human Mind for Automated Visual Classification》进行了分析，得出结论：这篇论文以及该实验室随后的 7 篇论文的结果都有误。

论文标题：Deep Learning Human Mind for Automated Visual Classification
论文地址：http://perceive.dieei.unict.it/deep_learning_human_mind.php

在围观 Reddit 讨论之前，让我们先看看批评者们都怎么说：

在测试集上训练，还能中CVPR？这篇IEEE批判论文是否合理？

论文地址：https://arxiv.org/abs/1812.076

以前 CVPR 2017 有一篇论文学习对受试者观察 ImageNet 图像时记录到的 EEG 数据进行分类，且使用学习到的分类器来训练一个纯粹的计算机视觉模型。在此论文中，ImageNet 中的图片做为刺激信号展示给接受 EEG 记录的受试者，然后训练一个结合全连接层和 ReLU 层的 LSTM 来预测记录到的 EEG 信号的图像刺激类别。其中 ReLU 的输出反映了人类对认知的神经编码。为了得到一种能产生同样认知编码的计算机视觉系统，这篇论文又把已有目标分类器的输出回归到论文声称的这种人类认知神经编码中。

那篇论文作出了三个声明：

我们提出了一种能对图像激活脑电波的 EEG 数据进行分类的深度学习方法，这种方法在处理目标类别的数量与分类准确率上都超越了顶尖方法。
我们提出首个由大脑信号驱动的计算机视觉方法，也就是首个利用视觉描述符进行自动分类的方法。这种视觉描述符直接提取自人类进行视觉场景分析时的神经处理过程。
我们将会公开这一最大的视觉目标分析 EEG 数据集，且附上相关开源代码与训练模型。

特别是他们的论文近一步声明：

相比于先前的研究，我们的方法能够分类大量（40）目标类别，特别是在 EEG 信号上。
相比于先前分类 EEG 信号的研究，我们方法的分类准确率高的多（82.9%)。

此外，此论文更是用盛赞之词表达其声明的结果：

在本论文中，我们希望在经典 BCI 方面取得重大突破，即旨在探索一种新型和直接的人类参与形式，并用于自动视觉分类。这个方法潜在的观点是学习一种大脑信号对视觉类别的判别性流形，这可以通过分类 EEC 信号实现。也就是说读取大脑信号，并将图像映射到这样的流形上以允许机器执行自动视觉分类，这一过程可以说是将人类的视觉能力迁移到机器。解码对象类别相关的 EEG 信号以用于计算机视觉方法，这种方法的影响是很巨大的。首先，识别基于 EEG 的判别性特征可能会提供一些关于人类视觉感知系统的洞见，其中这些判别性特征可用于视觉分类。因此，它将极大地提高基于 BCI 的应用性能，并实现新形式基于脑的图像标注。其次，将图像有效地投影到新的基于生物学的流形中将彻底改变对象分类器的开发方式（主要是在特征提取方面）。[31，§1pp.6809-6810]

我们做了很多实验与分析，且分析结果不禁让我们怀疑上面 CVPR 2017 原论文的声明。具体的，我们发现采用的分类器会让长期静态脑激活的使用会比独立刺激的时间长。由于前面那篇 CVPR 2017 论文采用了块设计（block design），所有给定类别图像的刺激都连续呈现给受试者，因此所采用的分类器倾向于在「块」期间内对大脑的活动进行分类，这似乎与刺激的图像类别很大程度上并不相关。

分类器对 EEG 信号中的 DC 和极低频（VLF）分量的依赖性加剧了这种情况，这些分量反映了「块」期间的任意长期静态心理状态，而不是动态的大脑活动。由于测试集中的试验与训练集样本试验都来自相同的「块」，这相当于在测试时获取了相同静态心理状态，从而「窃取」了训练信息。因此那篇 CVPR 2017 论文能获得极高的分类准确率，它隐性地在测试集上做训练！

当我们使用快速事件重新设计实验时，发现用不同图像刺激获得的信号完全是随机的，分类准确率下降到了随机选择。因此，这使得我们怀疑随后 7 篇论文的结果与声明（完整的名单读者可查阅原论文）。我们的实验最终表示潜在任务远远要比表面看起来难得多，并且远远超出现有的技术水平。同样，实验结果最终也表明了那 8 篇广泛发表的论文过于乐观了，它们的结果同样也是有误的。

Reddit 讨论

这篇帖子昨日发布之后，引起了多位研究者的讨论，有从标题开始批评论文《Training on the test set? An analysis of Spampinato et al. [31]》的，也有从技术层面对这两篇论文进行讨论的。机器之心编译介绍了部分评论，感兴趣的读者查看原帖。

网友 singularineet 表示：

怎么直观理解这篇论文要表达的意思呢？我们来打个比方。比如，你想训练一个分类器来分析 X 光片以检测癌症。这些 X 光片会显示其拍摄的时间（假设 X 射线机器会在早上进行校正，并在一天内随时间逐渐漂移，并且这种漂移效应会立刻出现在 X 光片中）。并且，有高度优先权的已知得了癌症的病人会在早上拍 X 光片，其他人安排在下午。那么，你的模型就能仅通过拍摄时间来准确地预测癌症。同理，Spampinato 等人的研究中使用了 EEG 电极，导电霜是干燥的，电极接触不良等。因此，他们的实验引入了很多噪声，种种完全无关因素导致 EEG 的系统性漂移，并展示在图像中。此外还有外部噪声的干扰，比如空调温度等。由于图像类是在同一类的块中呈现的，因此网络所要做的就是根据其他偶然要素进行预测，而不是寻找与图像类本身有关系的要素。这些效应在脑成像领域中是众所周知的，这就是为什么实验方案总是平衡的，并且尝试通过消除有害信号来去除伪像。因此，批评论文中的所有注意力都集中在信号过滤问题上。

jande8778 更是直接批评《Training on the test set? An analysis of Spampinato et al. [31]》一文是他读过的最糟糕的论文。

我读过的最糟糕的论文。让我们从标题开始，其表明 [31] 的作者在测试集上训练，这是不对的。另一方面，[31] 的作者使用的 DL 技术是有意义的，如果他们证明使用不同数据集的那些方法的有效性，他们的研究应该没问题。尽管如此，旨在发现 EEG 数据集偏差的批评部分还是有意义的。

jande8778 继续说这篇批判论文最浅显、最糟糕的部分是试图拒绝采用 DL 方法进行脑电波的分类与生成。他说：「评论他人的研究可能要比做研究更难，需要更严谨一些。」

其中，论文的一作 C. Spampinato 也对此帖作出了回复。他表示虽然批判论文的标题选了一个众所周知的禁忌，但他自己不是特别在乎，除了自己的名字出现在标题上。

此外，关于讨论中一些技术细节，Spampinato 也给出相应的解释。例如批判文章最大的质疑，即 CVPR 2017 的那篇论文采用块分析，连续地将相同类别的训练集与测试集给受试者，因此分类器学到的可能只是静态脑电波。Spampinato 表示这可能是一个假设，但是移除极低频和 DC 等可能影响的噪声后，分类器还是能实现很好的性能。此外，Spampinato 表示他们会做更多的研究与调查弄清楚这一假设。

zzzwwwmmm

0 关注 0 粉丝 0 动态

相关推荐

斯坦福AI Lab主任、NLP大师Manning：我的第一次CVPR

斯坦福大学AI实验室主任、人工智能和计算语言学领域的权威专家Christopher Manning教授，在美国长滩CVPR大会现场分享了人工智能研究的最新趋势和挑战，以及他参加本次大会的思考。Christopher Manning是斯坦福大学计算机与语言学

乖兔子 2019-07-03

计算机视觉不是智能，只是记忆：CVPR 2019程序主席开炮

计算机视觉顶会 CVPR 2019 刚刚落下帷幕，近日 CVPR 2019 程序主席 Derek Hoiem 发表了一篇文章，认为计算机视觉正处于黄金时代，但它依靠的只是记忆，并非真正的智能。随着人工智能的火热，近年来 AI 学术会议正受到人们越来越多的关

huangjie0 2019-07-01

CVPR 2019：北邮提出新AI模型压缩算法，显著降低计算复杂度

来自北京邮电大学的研究人员开发了一种AI模型压缩算法，可以让深度学习的运算不再依赖高昂的计算和存储设备，保持模型的识别精度无损的前提下，显著降低模型的计算复杂度，本文带来技术解读。研究人员称，模型压缩算法能够有效降低参数冗余，从而减少存储占用、通信带宽和计

xgxyxs 2019-06-29

CVPR 2019：微软最新提出ObjGAN，输入一句话秒生成图片

微软和京东最近出了一个黑科技：说一句话就能生成图片！在这项研究中，研究人员提出了一种新的机器学习框架——ObjGAN，可以通过关注文本描述中最相关的单词和预先生成的语义布局来合成显著对象。不会PS还想做图？近期，由纽约州立大学奥尔巴尼分校、微软研究院和京东

ximingri 2019-06-23

你说话时的肢体动作，AI仅凭声音就能预测 | CVPR 2019

所预测的动作十分自然、流畅，本文带来技术解读。人在说话的时候，常常伴随着身体动作，不管是像睁大眼睛这样细微的动作，还是像手舞足蹈这样夸张的动作。最近，来自UC Berkeley和MIT的研究人员开发了一种AI算法，可以根据说话声音来预测说话人将作出怎样的肢

suiling 2019-06-22

CVPR！你凭什么收录我3篇论文！？

在近日举行的年度计算机视觉和模式识别盛会CVPR上，阿里云ET城市大脑的三项视觉技术论文成功入选。别急着找原因，咱们先了解下什么是CVPR。这个由专业技术学会IEEE主办的组织全称叫Conference on Computer Vision and Pat

ktmhate 2019-06-27

CVPR 2019 | 夺取6项冠军的旷视如何筑起算法壁垒

旷视，这家来自中国的计算机视觉独角兽公司，竟然「霸占」了全世界顶尖学术会议的 C 位。CVPR，全称 IEEE 国际计算机视觉与模式识别会议，在计算机视觉领域是和 ECCV、ICCV 并称的三大顶尖会议。今年的 CVPR 于当地时间 6 月 16 日在美国

zonglinzonglin 2019-06-21

104篇CVPR 2019论文列表追踪谷歌、Facebook、英伟达研究课题

人工智能顶级会议CVPR刚刚公布了最佳论文，谷歌、Facebook和英伟达也随后公布了自家发表的论文共计104篇，本文列出了三家大厂论文的完整列表。CVPR 2019：谷歌论文完整列表作为计算机视觉研究领域的领导者和白金赞助商，谷歌有超过250名员工出席会

nature 2019-06-21

CVPR声明力挺华为：同属IEEE，论文评审、参加会议无限制

作为计算机视觉领域内最负盛名的学术会议，每年 6 月举行的 CVPR 大会都会吸引全球学者和从业人员参加。即将开幕的大会当然也会成为「史上最大一届」。例如 NeurIPS 2018 的参会人数超过了 8000 人次、AAAI 2019 的论文摘要提交达到

木瓜子 2019-06-03

微软提出高分辨率深度神经网络HRNet | CVPR 2019

他的研究兴趣包括人体姿态估计、语义分割、图像分类等，曾在BMVC、ICCV、CVPR等国际顶级会议上发表过论文。最近几年，用于图像分类的卷积神经网络成为解决视觉识别问题的标准结构，比如图1所示的LeNet-5。

yunpiao 2019-05-27

斯坦福&Adobe CVPR 19 Oral：全新通用深度网络架构CPNet

在三大视频分类数据集上取得了优于之前结果的性能。相关论文获CVPR 2019 oral。现有的视频深度学习架构通常依赖于三维卷积、自相关、非局部模块等运算，这些运算难以捕捉视频中帧间的长程运动/相关性。近日，来自斯坦福和Adobe的研究人员，受到点云上深度

静 2019-05-22

腾讯58篇论文入选CVPR 2019，两年增长超200%

全球计算机视觉顶级会议 IEEE CVPR 2019 即将于6月在美国长滩召开。本届大会总共录取来自全球论文1299篇。中国团队表现不俗，此次，腾讯公司有超过58篇论文被本届CVPR大会接收，其中腾讯优图实验室25篇、腾讯AI Lab 33篇，相比过去两年

锈铁工作室 2019-03-08

CVPR 2019 ：百度17篇论文入选，AI巨头都在关注什么？（附下载）

本文共6400字，建议阅读10+分钟。本文整理了百度入选CVPR的17篇论文的内容及应用场景。CVPR官网显示，今年有超过5165篇的大会论文投稿，最终录取1299篇，录取率约为25%。据了解，去年的CVPR 2018共有979篇论文被主会收录，录用率约为

guxiagendieshuo 2019-05-04

CVPR 2022大会主席、港科大教授权龙：计算机视觉的现状与未来

权龙教授发表了题为《三维视觉重新定义人工智能安防》的演讲。近日，由雷锋网主办的第二届中国人工智能安防峰会在杭州召开。峰会现场，香港科技大学教授，CVPR 2022、ICCV 2011大会主席，Altizure创始人权龙教授发表了题为《三维视觉重新定义人工智

Ysp 2019-04-12

苹果机器学习博客解读CVPR论文：通过对抗训练从模拟的和无监督的图像中学习

苹果公司通过试验证明，使用细化后的图像进行训练可以大幅提高多种机器学习任务中模型的准确度。为了克服这种缺陷，他们制定了一种细化合成图像的方法，用以提高图像的真实度。在AI科技大本营微信公众号会话中回复“苹果”，下载苹果《Learning from Simu

yyHaker 2017-07-20

腾讯AI Lab多篇论文入选CVPR、ACL及ICML等顶级会议（附论文下载）

CVPR是近十年来计算机视觉领域全球最有影响力、内容最全面的顶级学术会议，由全球最大的非营利性专业技术学会IEEE主办。2017学术指标按论文引用率排名， CVPR位列计算机视觉领域榜首。今年CVPR审核了2620篇文章，最终收录783篇，录取率29%，口

血色浪漫 2017-07-19

CVPR 2019 | PointConv：在点云上高效实现卷积操作

3D 点云是一种不规则且无序的数据类型，传统的卷积神经网络难以处理点云数据。来自俄勒冈州立大学机器人技术与智能系统研究所的研究者提出了 PointConv，可以高效的对非均匀采样的 3D 点云数据进行卷积操作，该方法在多个数据集上实现了优秀的性能。点云通常

寸先生的AI道路 2019-04-22

旷视联合智源发布全球最大物体检测数据集，举办CVPR DIW2019比赛

4 月 16 日，北京智源人工智能研究院在北京会议中心召开了「智源学者计划暨联合实验室发布会」。北京智源人工智能研究院是在科技部和北京市委市政府的指导和支持下，由北京市科委和海淀区政府推动成立，依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团

LinLinHou 2019-04-22

CVPR 2019审稿第一满分论文：机器人也能问路的视觉语言导航方法

CVPR 2019 将于 6 月 15 日 – 6 月 21 日在加利福尼亚州长滩举办，会议论文录取结果也已于近日公布。其中，来自加州大学圣塔芭芭拉分校王威廉组的王鑫在微软研究院实习期间的研究项目以满分成绩获「审稿得分排名第一」。该论文提出的新方法结合了强

chongdajerry 2019-03-04

1300篇！CVPR 2019论文接收结果公布，你上榜了吗？

今日，计算机视觉顶会 CVPR 2019 的论文接收结果公布：在超过 5100 篇投稿中，共有 1300 篇被接收，达到了接近 25.2% 的接收率。CVPR 是首屈一指的年度计算机视觉盛会，在机器学习领域享有盛名。今年的 CVPR 将于 6 月 16 日

Samurai 2019-02-26

zzzwwwmmm

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号