深度学习没你想的那么“深”!都是炒作惹的祸

深度学习为我们提供了巨大的新力量,可以发现隐藏在大量数据中的模式。对于一些挑战,神经网络甚至可以胜过顶尖的人类专家。然而,尽管新方法取得了一些进展,并且希望能够引导我们进入实际的人工智能领域,但深度学习的实际应用仍然有很大的局限性。

深度学习没你想的那么“深”!都是炒作惹的祸

深度学习已经成为大数据分析的最新的“简单按钮”。这个想法似乎是这样的:有很多数据要分析,别担心,只需使用TensorFlow、Keras或其他深度学习库启动一个神经网络即可!你很快就会得到正确的答案。

深度学习使数据科学和计算机科学界的能力激发起来,但现实情况是,它既不像人们想象的那样自动化,也不如其强大。在许多情况下,专家表示,数据科学家通常使用完善的机器学习技术,而不是使用最新的深度学习库。

对深度学习方法最大的误解之一是,它不需要从业人员进行大量的手动特征选择和调整。精算师协会的会员,也是Kaggle数据科学竞赛的老手,Michael Xiao表示,这只是部分正确,“很多人认为,如果你开始使用神经网络,你真的不需要做任何事情。那绝对不是真的,你仍然需要做大量的预处理。”

翻转DL脚本

肖的日常工作是领导一个蓝十字蓝盾健康保险集团的数据科学团队,最近参与了一个Kaggle竞赛,试图找到更好的宫颈图像分类方法,以改善宫颈癌的自动化检测。他发现了几个技巧,有助于提高他的卷积神经网络(CNN)的准确性。

深度学习没你想的那么“深”!都是炒作惹的祸

翻转子宫颈的图像可以提高卷积神经网络的分类准确性

翻转子宫颈的图像可以提高卷积神经网络的分类准确性(Courtesy National Cancer Institute)例如,肖发现,翻动子宫颈的图像提供了更多CNN可以训练的样本图片,这导致精度提高了1%。

他补充表示道,“如果我只是翻转图像,那么可能与其他图像相同。但是,如果没有你提供这些数据,这个模型实际上并没有达到这个程度。神经网络没有达到他们固有的理解的程度。”

他还发现,使用其他机器学习方法来检测图片的哪一部分包含子宫颈同样有帮助。因此,将大图像文件的分辨率缩小到了更易于管理的计算机上。这些是“常识”技术,数据科学家可以使用这些技术来提高神经网络的有效性。

所以虽然神经网络能够自动处理深度学习的特征选择部分,但在深度学习中仍然有很多工作可以使数据科学家保持忙碌。肖表示,这远非“设置和忘记”,即使你不需要做特征选择,你仍然需要处理图像。

DL不是万能的

不可否认的是,围绕深度学习有很多的炒作。 2017年,神经网络应用的进展催生了一个普遍的信念,即人工智能的突破即将到来。

深度学习没你想的那么“深”!都是炒作惹的祸

虽然深度学习方法在某些应用程序中得到了更好的结果,但是这种技术并没有被用在两个主要用例之外:图像识别(即计算机视觉)和文本识别(如自然语言处理)。对于大多数不涉及操纵图像或文本的数据科学用例来说,传统的机器学习模型很难被打败。

肖认为,“实际上没有任何证据表明(神经网络)可以更好地发挥作用。而对于业内很多人来说,深度学习将推动数据科学进入AI未来,这可能令人惊讶。但可能这并不是大多数人想要听到的答案。人们喜欢到处放置人工智能这个词,但我们还没有达到那个水平。”

这一思路被机器学习界的一些著名人士的支持。 Google的研究人员,Keras的发明人Francois Chollet认为,虽然深度学习应该模仿人脑,但它实际上只是一种更强大的统计推断形式。深层神经网络实际上并不复制人脑的功能。

根据TopBots首席技术官Mariya Yao 3月份的博客文章,“最近AI最重要的问题就是抽象和推理”。 “目前的监督感知和强化学习算法需要大量的数据,在规划时非常糟糕,只能做简单的模式识别。”

这种观点也得到了加拿大计算机科学家Geoffrey Hinton和谷歌研究人员的支持,他被称为“深度学习之父”。尽管神经网络已经有数十年的历史了,但是Hinton主张以多层方式反向传播数据更好地模拟人脑中信息处理的复杂性。

现在,Hinton正在探索一种新的计算理论,它利用列状的数据集合或“胶囊”,与神经网络中的水平层一起进行。他在“麻省理工学院技术评论”(MIT Technology Review)上表达:这样的结构可以帮助缓解一些深度学习目前的局限性,并提供另一个“计算机科学与生物学之间的桥梁”。

对于今年秋季与Axios的讨论,Hinton更加坚持需要一个新的方法,尤其是当他以监督学习和反向传播而闻名。

在建立真正的人工智能方面,获得大脑实际工作方式的更好模型将是一个很好的开始。这就是神经科学家和Starmind创始人Pascal Kaufmann所追随的道路,但迄今为止,还没有任何突破会导致我们超越深度学习中的“暴力统计”方法。

肖表示,“我们目前遇到了一个障碍,那就是反向传播并不能真正模拟人脑。我们需要有人做出突破,实际上是需要想出一个更类似于大脑运作的计算方法。”

相关推荐