人工智能全新突破：神经网络可自主识别图片中的对象

白飞飞Alan

2017-03-16

人脑非常奇妙。在几十年研究之后，人类仍然无法复制出人脑的超快计算速度。目前，计算机科学家可以利用的最强大工具是神经网络。这样的大型计算机网络能通过训练去解决复杂问题，而机制类似于人类的中枢神经系统，即利用不同层次的神经元解决问题的不同部分，最终合并为适当的答案。

目前的问题在于，这样的神经网络需要大量数据输入和训练，随后才能学会如何解决问题。例如，ImageNet是个很好的训练数据源，这一庞大的可视化信息数据库中包含100万张经过人工标注的照片。

这被称作“监督学习”，而真正的人工智能意味着，神经网络需要学会如何自动完成“无监督学习”。这正是芬兰创业公司Curious AI希望实现的目标。

Curious AI首席技术官安迪·拉斯姆斯(AntTI Rasmus)在赫尔辛基的Slush 2016科技行业大会上表示：“人脑会进行大量的无监督学习。我们不需要反复告诉婴儿，勺子是什么。他们可以自动从环境中学习，并形成概念。”

“对人脑来说，根据某一对象形成概念很简单。这已在心理学中得到了研究，即‘格式塔理论’。人脑会将具备类似形状、颜色、运动状态和模式的东西归类在一起。我们采取的第一步是让深度学习系统能像人脑一样，对对象进行归类。”

将神经科学应用于人工神经网络

在神经科学中，名为“速率编码”的理论认为，大脑中神经元的激发速率越高，神经元就越活跃。神经元持续被激发。而80年代时，科学家发现，神经元会将自身组织在一起，代表不同的信息。

这一理论被称作“临时编码”。理论认为，神经元的激发时机很重要，而准确的激发时机定义了，在数万神经元中哪些神经元属于同一群体。因此，一部分神经元可以同时激发，帮助大脑识别一系列对象中的某个对象，例如一堆办公用品中的一块红布，而另一部分神经元会告知大脑，其他对象都属于背景信息。

拉斯姆斯表示：“我们的计算机算法集成了临时编码机制。我们在神经网络的每层中保存多个拷贝。整个神经网络被复制了4次。这意味着系统可以学习得知，每个拷贝代表了某个特定对象，而将这些对象合并在一起，就可以与原始图像进行匹配。”拉斯姆斯此前曾是英伟达的软件工程师，目前正在芬兰阿尔托大学从事深度学习的博士研究工作。

人工智能全新突破：神经网络可自主识别图片中的对象

“通过将图像分为不同的4组，神经网络可以自行编码图像。这就是无监督学习，我们不用对系统进行任何标记。当我们向神经网络展示图片时，它会将图片自主分解成为元素(例如图片中的对象)。”

在神经网络将图片分解为单独元素之后，归类和识别对象就变得更容易，因为这些对象不会相互重叠，导致图像模糊不清。

知觉分组可以给深度学习带来变革

研究人员最初指导神经网络在无监督的情况下分析图片，组织对象，随后向图像加入标记信息(监督学习)，从而观察系统究竟学会了什么。他们发现，Curious AI的Tagger系统能实现75.1%的准确率。

作为对比，传统神经网络的准确率只有21%，比随机猜测的准确率仅仅高出1%。

拉斯姆斯表示：“这是革命性的研究，这使得无监督学习获得了进一步发展。通过让机器获得对象的概念，我们实现了更类似人脑的无监督学习。这可以帮助未来的研究，让神经网络进行更高层次的推理，学习对象与环境的相关性。”

人工智能机器学习神经网络算法

安科网

人工智能全新突破：神经网络可自主识别图片中的对象

白飞飞Alan

白飞飞Alan

相关推荐

如何通过7个步骤构建机器学习模型

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

理解AI：为什么要在人工智能系统中寻求可解释性呢？

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

IT自动化和人工智能将在2021年走向何方?

强化学习到底是什么，它如何运作？

数字营销：AI如何“看透”人类行为模式？

当教练、做监工…… 人机协同下的AI更懂你

Facebook借助人工智能对内容审核排序

人脸识别技术发展现状及未来发展趋势

零基础也能看懂的人工智能教程

关于人工智能的解读，看这一篇就够了

谷歌正在测试一个人工智能系统，帮助视障人士参加跑步比赛

白飞飞Alan