深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

lizhengjava

2020-06-29

在长达两周的「骂战」之后，图灵奖得主、Facebook 首席 AI 科学家 Yann Lecun 宣布，自己将退出推特。

「我请求社交网络上的所有人不要再互相攻击了，特别是对于 Timnit Gebru 的攻击，以及对于我之前一些言论的攻击。」Yann LeCun 刚刚在推特上发出了这样的呼吁。「无论是口头还是其他方式的冲突，都只能获得伤害和相反的结果。我反对一切形式的歧视。这里有一篇关于我核心价值观的文章。」

「这是我在推特上最后一篇有内容的帖子，大家再见。」

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

看起来 2018 年图灵奖得主、人工智能领军人物 Yann LeCun 已经下定决心想对长达两周的激烈讨论画上句号。而这场闹得沸沸扬扬的骂战，起因正是被指「严重种族歧视」的 PULSE 算法。

这一工作由杜克大学推出，其人工智能算法可以将模糊的照片秒变清晰，效果极佳。这项研究的论文已在 CVPR 2020 上发表（论文《PULSE：Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models》）。

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

PULSE 在 CVPR 大会期间引来了人们的关注，进而引发了 AI 社区的广泛争议。首先，这种方法所产出的图像清晰度更高，细节也更加丰富：PULSE 能够在几秒内将一张 16×16 像素的图片提升至 1024×1024 分辨率，提升高达 4096 倍。目前该算法仅针对人脸照片，算法生成的照片清晰到可以呈现出人脸上的毛孔、皱纹甚至一缕头发。

但本质上看，PULSE 并不是在消除马赛克，而是「生成」了看上去真实却并不存在的人脸。超分辨率算法一直是计算机科学的热门研究领域，以往科学家们提出的还原方法是在低分辨率图片中添加像素点。但 PULSE 使用 GAN 的思路，先利用深度学习算法生成一些高清图片，再降低它们的分辨率，并与模糊的原图对比，从中找出匹配程度最高、最接近原图的高清图像随后输出。

问题就出在这里，有网友试用了 PULSE 之后，发现美国前总统奥巴马的高糊照片经过去码处理以后，生成的是一张「白人面孔」：

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

有网友质疑该方法生成结果存在偏见，对此项目作者也给出了回应，表示这一偏见很可能来自于 StyleGAN 的训练数据集，可能还有其他未知因素。

「我们意识到偏见是机器学习和计算机视觉领域的重要问题，并就此问题联系了 StyleGAN 和 FFHQ 数据集的创建者。我们希望这能够促进不具备此类偏见行为的方法的诞生。」

但这件事还没完，鉴于美国目前 BLM 的舆论环境，人们很快就开始深入讨论机器学习研究结果缺乏多样性的问题。在这其中，种族偏见和性别偏见的问题一直存在，迄今为止却没人给出一个好的解决办法。

也就在这个时候，Yann LeCun 发布了一条推特，来解释为什么 PULSE 会出现这样的偏见。

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

「机器学习系统的偏差是因为数据的偏差。这一人脸上采样系统其结果倾向于白人是因为神经网络是在 FlickFaceHQ 上预训练的，其中的大部分图片基本是白人照片，」Yann LeCun 说道。「如果这一系统用塞内加尔的数据集训练，那肯定所有结果看起来都像非洲人。」

Yann LeCun 的说法本身没有错，但可能是因为过于直白了，一下子让大量 AI 从业者和研究人员炸了锅。LeCun 希望将人们的注意力引向数据集的偏差，但推特网友不买帐，并指责他「用这种陈旧的理由来掩盖问题本质」。

之后，Yann LeCun 又在多条推文来解释自己关于偏见的立场，但仿佛已经没有用了。

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

「与学术论文相比，这种偏见在已经部署的产品中产生的后果会更加可怕。」这句话的含义被解读为「不必为此特例而过分担心」，引发了诸多同行的质疑。

斯坦福 AI Lab 成员、Google AI 科学家 Timnit Gebru（她是一名非洲裔美国人），对 LeCun 的言论表示「失望」。

Yann LeCun 甚至在 Timnit Gebru 的推特评论区连写 17 条回复：

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

当然，需要讨论的也不只是机器学习中的偏见问题：

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

「同样需要避免的是在对话中产生恶意，它只会激起情绪，伤害到所有人，掩盖实际问题，推迟解决方案的出现。」

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

从事数据科学领域超过十年的 Luca Massaron 认为，尽管从技术角度来看 Yann LeCun 是完全正确的，但看看这种观点被抛出之后公众的反应，你就会知道谈论它是多么的敏感。

「人们总是害怕自己会被不公平的规则控制，进而无条件地，有时甚至毫无理由地惧怕 AI 剥夺人们的自由，而不仅仅是工作，」Luca Massaron 说道。「我个人并不担心 Face Depixelizer 这类研究，我所害怕的是在应用之后，我们无法识别和挑战偏见。」

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

如今，越来越多的机器学习自动化技术正在进入我们的生活，立法者在这里扮演的角色非常重要。在欧盟国家，为了确保数据使用的透明度和责任，GDPR 条例要求互联网公司保证算法的可解释性，以及用户对于自身数据的控制力。

如果我们希望 AI 能够朝着正确的方向发展，我们需要追求的或许不是无偏见，而是透明度。Luca 认为，如果算法是有偏见的，我们可以挑战它的推断结果并解决问题。但如果算法的推理机制不可知，或许其中还隐藏着更大的问题。

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

不可否认的是，人类社会存在着各种偏见，但因此而认为机器倾向于更「流行」的答案是理所应当的，或许不是一个正确的观点。

深度学习先驱Yann LeCun被骂退推特：你们都很懂，从此我不说话了

人们对于 PULSE 的讨论，以及 LeCun 的攻击，有很多已脱离了 LeCun 的本意。

作为这场争议的起因，杜克大学的研究者们已在 PULSE 网站中表示将会修正有关偏见的问题。目前论文中已经增加了一个新的部分，并附加了可以解决偏差的模型卡。

lizhengjava

0 关注 0 粉丝 0 动态

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

详解深度学习感知机原理

我们之前的机器学习专题已经结束了，我们把机器学习领域当中常用的算法、模型以及它们的原理以及实现都过了一遍。虽然还有一些技术，比如马尔科夫、隐马尔科夫、条件随机场等等没有涉及到。但是这些内容相比来说要弱一些，使用频率并不是非常高，我们就不一一叙述了，感兴趣的

深度学习大讲堂 2020-10-14

用Windows电脑训练深度学习模型？超详细配置教程来了

虽然大多数深度学习模型都是在 Linux 系统上训练的，但 Windows 也是一个非常重要的系统，也可能是很多机器学习初学者更为熟悉的系统。Kaggle Master 及机器学习实践者 Abhinand 立足于自己的实践，给出了一种简单易行的 Windo

Trent 2020-10-13

深度学习未来发展的三种学习范式：混合学习，成分学习和简化学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。深度学习是一个很大的领域，其核心是一个神经网络的算法，神经网络的尺寸由数百万甚至数十亿个不断改变的参数决定。似乎每隔几天就有大量的新方法提出。然而，一般来说，现在的深度学习算法可以分为三个基础的学习范式。每一

qijiqiguai 2020-10-09

深度学习之后会是啥？

我们被困住了，或者说至少我们已经停滞不前了。有谁还记得上一次一年没有在算法、芯片或数据处理方面取得重大显著进展是什么时候?几周前去参加Strata San Jose会议，却没有看到任何吸引眼球的新进展，这太不寻常了。我不是唯一一个注意到这些的人。例如，这

mpkno 2020-09-26

深入了解目标检测深度学习算法的技术细节

本文转载自公众号“读芯术”。本文将讨论目标检测的基本方法，并尝试理解每个模型的技术细节。为了让经验水平各不相同的读者都能够理解，文章不会使用任何公式来进行讲解。目标检测(或识别)基于图像分类。IoU是一个度量，用预测的框和真值框的重叠面积除以它们的并集面积

ustbfym 2020-09-21

理解卷积神经网络中的自注意力机制

计算机视觉中的编解码结构的局限性以及提升方法。卷积神经网络广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准，可以嵌入到商业产品中，但是标准的CNN算法仍然有局限性，在很多方面还可以改进。由于其简单和准确，该体系结构被广泛使用。顾名

sunxinyu 2020-09-17

分析深度学习背后的数学思想

深度神经网络本质上是通过具有多个连接的感知器而形成的，其中感知器是单个神经元。可以将人工神经网络视为一个系统，其中包含沿加权路径馈入的一组输入。然后处理这些输入，并产生输出以执行某些任务。随着时间的流逝，ANN“学习”了，并且开发了不同的路径。各种路径可能

walkpower 2020-09-16

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 2020-09-04

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

在30分钟内创建你的深度学习服务器

每当我开始一个新的项目时，我发现自己一次又一次地创建一个深度学习机器。从安装Anaconda开始，最后为Pytorch和Tensorflow创建不同的环境，这样它们就不会相互干扰。而在这中间，你不可避免地会搞砸，从头开始。这种情况经常发生多次。这不仅是对时

QFYJTL 2020-08-23

浅谈人工神经网络与BP算法

如今，深度学习技术，也叫机器学习技术日益火热，运用深度学习技术的领域也愈来愈广泛，这些领域包括图像识别、语音识别、自然语言处理以及游戏、机器人之类的。由于本人是电子信息专业，在大学期间接触了一过一些机器学习的知识，并且在毕业后顺利进入一家世界500强的互联

ohbxiaoxin 2020-08-20

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

lizhengjava

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号