深度学习之父Hinton发布胶囊网络的最新进展,将重塑人工智能
如果你不明白人们为什么对于人工智能这么着迷,69岁的谷歌研究员杰夫·辛顿也许知道其中最好的答案。
这位多伦多大学的教授在2012年10月颠覆了人工智能研究领域,开辟了一条全新的研究方向。当年Hinton带着两个研究生,向世界展示了一个他几十年来一直致力倡导却并不受待见的技术 - 人工神经网络,让机器理解图像的能力有了巨大的飞跃。这之后,在六个月内,这三名研究人员就都被谷歌招致麾下。今天人工智能神经网络可以理解我们的言论,认识我们的宠物,并与我们的小恶魔作斗争。
但是,Hinton现在却开始怀疑他所创立的人工智能神经网络技术。他说:“我认为目前用深度学习的方法处理计算机视觉的方式是错误的。 尽管深度学习目前比其他任何方法都好,但这并不意味着它就是正确的。”
取而代之的是,Hinton揭示了另一个并不太新的想法,它可能会改变未来计算机如何看世界,将重塑人工智能。这一点非同小可,因为计算机视觉对于诸如自动驾驶技术,以及代替医生的人工智能诊断软件等应用,均至关重要。
最近,Hinton发表了两篇研究论文,证明了他已经研究了近四十年的想法。 Hinton说:“很长时间以来,这个方法对我来说很直观,但应用效果一直不太理想。最近我们终于得到了很好的计算结果。”
Hinton的新方法,被称为capsule networks胶囊网络,是对现有神经网络的一种变通,旨在使机器更好地通过图像或视频来了解世界。在今年10月底发布的一篇论文中,Hinton的胶囊网络在一个标准测试中展示了至今为止最好的技术的准确性,用来测试软件如何识别手写数字。在第二篇论文中, 这个测试软件挑战从不同角度识别卡车和汽车等玩具,胶囊网络几乎将之前的最佳错误率降低了一半。 Hinton一直在与Google多伦多办公室的同事Sara Sabour和Nicholas Frosst一起研究这项新的人工智能技术。
胶囊网络旨在弥补当今机器学习系统的弱点,这些弱点限制了计算机视觉软件的学习能力。 Google和其他公司今天使用的图像识别软件需要大量的示例照片,来学习如何在各种情况下可靠识别物体。因为目前的计算机视觉软件并不能很好地把它学到的东西推广到新的场景中,比如学会从不同的角度来识别同一个物体。
例如,目前采用深度学习的算法,教计算机从多个角度识别一只猫,可能需要数千张照片覆盖各种不同视角的猫。而人类的孩子则不需要如此明确和广泛的训练来学习识别家庭宠物。
Hinton的想法是缩小最好的AI系统和人类幼儿之间的差距,把更多的世界知识融入到计算机视觉软件中。因此提出了胶囊神经网络 - 一小组粗糙的虚拟神经元 - 可用来跟踪物体的不同部位,如猫的鼻子和耳朵,以及它们在太空中的相对位置。采用许多这样的胶囊形成神经网络,就可以让计算机具有一种新的意识,来了解它所看到的新的场景,实际上只是一个之前看到的物体的不同视角而已。
早在1979年,Hinton就形成了自己的直觉洞察;当他试图弄清楚人类是如何使用大脑想象时,他意识到计算机视觉系统需要具备人类大脑的立体成像能力。Hinton在2011年首先制定了胶囊神经网络的初步设计。他最近发表的论文,展示了更完整的算法,这是人工智能领域的科学家们翘首期待的。纽约大学的图像识别教授Kyunghyun Cho说:“每个人都在等待它,期待Geoff Hitnon的下一个飞跃。
现在评估Hinton的胶囊网络到底实现了多大的飞跃,还为时尚早 - 他自己很清楚地知道这一点。 这位AI老帅,只是安静地庆祝他的直觉现在得到了证据的支持,也解释说胶囊网络仍然需要在大型图像集合上得到证明,而且与现有的图像识别软件相比,目前胶囊网络的计算速度较慢。
但Hinton辛顿乐观地说,他可以解决这些不足。AI领域的其他专家们也对他的成熟想法充满期待。
图像识别初创公司Twenty Billion Neurons的共同创始人之一,蒙特利尔大学教授Roland Memisevic表示,Hinton的胶囊神经网络设计应该能够从一定数量的数据中获得比现有系统更多的信息和理解。如果得到大规模验证,胶囊神经网络将对医疗保健等领域大有帮助;在医疗领域,训练AI系统的图像数据要比互联网上海量的自拍图像稀少得多。
在某种程度上,Hinton的胶囊网络与AI深度学习研究的趋势背道而驰。对神经网络最新成功的一个解释是,人类应该尽可能少地将知识编码到AI软件中,而应该让AI从头开始学习,自己弄清楚事情的真相。