为什么这些照片连最强大的视觉AI也无法准确识别？

syumilai

2019-07-24

为什么这些照片连最强大的视觉AI也无法准确识别？

▲ 桌子上面的到底是井盖还是蜻蜓?(图片提供：Dan Hendrycks)

为什么这些照片连最强大的视觉AI也无法准确识别？

▲ 照片中的是一只绿鬣蜥，还是一只松鼠?(图片提供：Dan Hendrycks)

为什么这些照片连最强大的视觉AI也无法准确识别？

▲这是独轮车，还是一只穿越马路的鳄鱼?(图片提供：Dan Hendrycks)

对人类而言，这些答案显而易见。然而，世界上最强大的图像识别人工智能却还无法解决上述难题。

之所以会这样，是因为每一张照片都经过精心挑选，专门用来“欺骗”图像识别技术。这些照片来自一套专门的数据集，其中的7000张照片由加州大学伯克利分校、华盛顿大学以及芝加哥大学的研究人员们共同整理完成。

加州大学伯克利分校计算机科学博士生、论文作者Dan Hendrycks表示：“目前的(机器学习)模型还不够完善。虽然已经有不少研究尝试利用人工数据提升模型的能力，但我们发现，这些模型在面对某些真实数据(来自真实照片)时往往会出现严重且高度一致的错误判断。

为了解释这个问题的重要意义，我们首先对图像识别技术的发展做一下回顾。

过去几年以来，图像识别工具已经变得越来越好，识别速度也越来越快。这在很大程度上要归功于斯坦福大学创建的，并且其规模仍在持续拓展的开放数据集ImageNet。该数据集目前已经包含超过1400万张照片，每张照片都配有“树”、“天空”之类的标记。这个庞大的数据库成为人工智能重要的训练素材集合，也可以作为新AI系统的参考基准，用于训练系统进行图像识别。打个比方，它就像是一本专供幼儿学习新单词的看图学话绘本。目前，利用ImageNet训练出的人工智能拥有极高的准确率，其物体识别精度可达95%，这一水平已经优于人类的图像内容分辨效果。

然而，解决这最后5%的准确度缺口是个巨大的挑战。自2017年以来，计算机在识别图像的准确度方面一直比较羸弱。正因为如此，研究人员们才尝试探索其中的原因——即计算机为什么无法解析某些特定图像。

通过这套新的图像集合，研究人员们以手工方式搜索Flickr(雅虎旗下的图片分享网站)，寻找可能会令AI软件陷入混乱的照片。然后，他们利用由ImageNet数据集训练而成的AI模型进行测试，如果模型确实无法识别照片内容，则将其添加到这套名为ImageNet-A的新数据集内(很明显，这个名称代表的就是反ImageNet之意)。在识别这7000张照片时，AI的准确度从90%迅速降低至2%。是的，您没有看错，世界上最先进的视觉AI模型确实无法正确识别其中98%的照片。

至于AI系统为什么无法理解这些图像，则是个相当复杂的问题。

目前的AI训练基本上就是把大量数据投入“黑匣子”当中——换句话说，我们只能根据最终结果来判断其准确性。比如，如果“黑匣子”见过足够多样的树木图像，它就会开始在新照片中认出树木对象，而我们就认为训练获得成功(这类重复任务被称为机器学习)。但问题是，我们并不知道AI是依靠哪些指标识别树木的——是形状?颜色?背景?质地?还是说树木具有某种人类从未意识到的统一核心几何样式?对于这个问题，目前科学家们也回答不了。

总而言之，AI能力的判断由结果实现，而非通过推理过程实现。这意味着我们可能会从AI当中发现种种令人意想不到的偏见，而这又进一步影响到AI系统在无人驾驶汽车或者刑事司法领域的实际应用。除此之外，这也意味着图像识别系统并不算是真正实现的智能化，而更像是一种强大的匹配工具。

构建ImageNet-A数据集，正是为了“欺骗”AI，从而总结为什么这些图像会让系统找不到正确答案。举例来说，当AI错把一张松鼠的图片误认为是海狮时，其缺少深层智慧与推理能力的问题就会被直接暴露出来。该系统可能仅依赖于这些动物的纹理——而非对象的相对大小或形状——进行识别。Hendrycks表示：“那些需要根据物体形状才能做出正确判断的照片，似乎最有可能骗过AI模型。”

text-align 人工智能 imagenet

syumilai

0 关注 0 粉丝 0 动态

相关推荐

华人研究团队推出AI“讽刺”检测模型，准确率达86%

本文转自雷锋网，如需转载请至雷锋网官网申请授权。最近网络上散发着一股浓浓的凡尔赛文学气息，比如。好烦，睡过了，错过马尔代夫的航班，只能专机去了。在看似平淡的话语中，流露出一股浮夸的炫耀，这就是凡尔赛文学。如果答对了，你可别骄傲，因为这道题可能连AI都会。最

hiarxiaoliang 5评论 2020-11-20

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 12评论 2020-11-13

如何在Fedora上安装Google Chrome浏览器

Fedora 的默认网页浏览器是 Firefox。尽管它是一个优秀的网络浏览器，你可能更喜欢流行的 Google Chrome 浏览器。如果你想知道如何在 Fedora 上安装 Google Chrome 浏览器，让我告诉你两种安装 Google Chro

86417413 2020-11-25

Chrome 87新特性解读，多年来Chrome性能最大提升！

近日Chrome更新了 87 最新版，这是今年最后一次 Chrome 更新了，这个版本是多年来 Chrome 性能获得最大提升的一次，开发者工具也进行了大幅度更新。有用户认为，原本 Chrome 的性能问题诟病已久，然而在新 Edge 出来了以后，性能突然

simonzhao0 2020-11-23

软件架构设计分层模型和构图思考

对于架构思维本身仍然是类似系统思维，结构化思维，编程思维等诸多思维模式的一个合集。由于架构的核心作用是在业务现实世界和抽象的IT实现之间建立起一道桥梁，因此架构思维最核心的就是要理解到业务驱动技术，技术为最终的业务服务。要真正通过架构设计来完成业务和技术，

rise 2020-11-22

Golang中Delve版本太低无法Debug的问题

打开 Hele->Edit Customer Properties,若提示文件不存在，点击创建。

窗前废雨 2020-11-16

关于go语言编码需要放到src 文件夹下的问题

配置GOPATH的用意是为了方便项目的部署和构建，以及可以直接使用go get 命令下载第三方的包到自己的项目的src下和相关的执行文件bin目录，和中间文件pkg. 问1：index entire GOPATH:如果你选中那么我就把你在环境变量中配置的G

wfs 2020-10-29

Navicat如何远程连接云服务器数据库

本来没有开启秘钥的远程服务器端数据库连接非常方便，就在新建连接上填入数据就ok了，但是开启SSH秘钥后的服务器连接有一个大坑，下面来详细讲讲。这里的SSH部分就好了，千万别急着测试。对了最后还要说一句，测试成功之后按确定之后，当你双击数据库的时候，有一件很

projava 2020-11-14

mysql 8.0.22 安装配置图文教程

解压后的目录并没有的my.ini文件，没关系可以自行创建在安装根目录下添加的my.ini ，写入基本配置：。# 允许连接失败的次数。初始化MySQL，在安装时，避免权限问题出错我们尽量使用管理员身份运行CMD，否则在安装时会报错，会导致安装失败的情况，如下

aydh 5评论 2020-11-12

基于postman实现http接口测试过程解析

无意中发现了一个巨牛的人工智能教程，忍不住分享一下给大家。教程不仅是零基础，通俗易懂，而且非常风趣幽默，像看小说一样！觉得太牛了，所以分享给大家。HTTP的接口测试工具有很多，可以进行http请求的方式也有很多，但是可以直接拿来就用，而且功能还支持的不错的

huimeiad 2020-11-23

最新PyCharm从安装到PyCharm永久激活再到PyCharm官方中文汉化详细教程

如下图所示，进入官方下载页面，选择与您系统相应的PyCharm版本。这里我们选择使用Windowns系统下的PyCharm专业版，点击上图标注2中的Download按钮进入下载页面，如下图所示。选择完PyCharm安装目录后进入PyCharm快捷方式与运行

NANGEBOKE 2020-11-23

Linux安装Nginx步骤详解

修改完成之后,重启nginx服务器.

liuchen0 6评论 2020-11-13

如何将Pycharm中调整字体大小的方式设置为\"ctrl+鼠标滚轮上下滑\"

对于字体大小的调整，我们比较习惯的方式是ctrl+鼠标滚轮上下滑，这也是我们在大多数软件中对页面进行放大缩小的方式。但当我发现Pycharm中的字体偏小想要进行调整时，却发现使用ctrl+鼠标滚轮上下滑的方式没有反应。下面介绍一下设置过程，分为字体放大的设

wuguangbin0 2020-11-17

Pycharm中使用git进行合作开发的教程详解

为了开发过程中尽量减少冲突，master分支用作最终的release，dev分支作为每日的开发和合并代码，然后每个人建立自己的分支，在自己的分支上进行开发，比如我的个人分支是dev_wyb，然后点右下角分支图标，选择dev_wyb,选择push，此时整个d

skyplay0 2020-11-17

Linux安装Nginx步骤详解

修改完成之后,重启nginx服务器.

LUOPING0 5评论 2020-11-11

Docker使用Portainer搭建可视化界面的方法

Portainer是Docker的图形化管理工具，提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作、事件日志显示、容器控制台操作、Swarm集群和服务等集中管理和操作、登录用户管理和控制等功能。功能十分全面，基本能满足中小型单位对容器管理的

魅惑青花瓷 2020-11-11

nginx proxy_cache 缓存配置详解

由于本人工作原因，涉及到网络直播领域，其中视频的回放下载，涉及到了一些视频下载方面的技术。针对于一个完整视频的下载，目前市面上的主流做法是，先将整个视频流切片，存储到文件服务器中，在用户需要观看回放视频时。通过一个视频回源服务器，去文件服务器中逐个请求切片

Freshairx 2020-11-10

浅析Linux之bash反弹shell原理

反弹shell往往是在攻击者无法直接连接受害者的情况下进行的操作，原因有很多，例如目标是局域网，或者开启防火墙的某些策略等情况，而这时，我们就可以让受害者主动向攻击者发起连接，被控端发起请求到控制端某端口，并将其命令行的输入输出转到控制端，从而实现交互。L

applecarelte 5评论 2020-10-16

详解docker-compose速度太慢解决方式

解决办法只有一个一个一个,那就是换源!gihub上下载docker-compose太慢了，下载不动，只能换成国内镜像来下载。

链块学院 2020-11-06

详解docker pull 下来的镜像都存到了哪里

docker pull 下来的命令都默认存在/var/lib/docker/文件夹下。正好和docker images的内容一致。可以看到上面 repositories.json 文件中记录的就是已拉取的镜像信息。

TaoTaoFu 2020-11-06

syumilai

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号