关于机器学习、深度学习和AI的初学者完全指南
遇见萨曼莎(Samantha)。她是你来自2025年的贴心助手。她可以帮你整理邮件、设置您的会议以及杂货订单。她会画画和写诗。她是你最好的朋友。她是电影《她》里的人工智能,这也是我们可以想象Siri会把我们的生活改变 ...
遇见萨曼莎(Samantha)。她是你来自2025年的贴心助手。她可以帮你整理邮件、设置您的会议以及杂货订单。她会画画和写诗。她是你最好的朋友。她是电影《她》里的人工智能,这也是我们可以想象Siri会把我们的生活改变成怎样的动人。
现在,大小型高科技公司都在竞相使这成为现实。你看看新闻就会听说过这些行话:AI、机器学习、深度学习、神经网络、自然语言处理。
也许这一切都有点疑惑。因此,以下是关于这些概念的基本知识,以及它们之间是如何关联的。
什么是人工智能(AI)?
简单地说,AI是试图让计算机变得智能,甚至比人类更聪明。这是让电脑拥有类人类的行为、思维过程和推理能力。
有两种人工智能:
狭义的AI(弱AI):
这种AI只专注于一种狭义的任务。现在我们的身边已经处处都是弱AI了。它已经在国际象棋,电视竞赛节目《危险边缘》,还有最近的围棋比赛中击败了我们人类。
像Siri和Cortana这样的数字助手可以给我们提供天气信息以及在路上自动驾驶汽车。但是,它们有很大的局限性。自动驾驶汽车不会下国际象棋。Siri也无法读取和删除不重要的邮件。弱AI有一个狭隘的范围:它不能超越最先为其设置的功能。
Cortana就是一个弱AI的例子
通用AI(强AI)
下面我们进入科幻小说的王国。萨曼莎毫无疑问被定义成一个强AI。她可以学到新的东西,并修改自己的代码库。她可以在国际象棋和开车上都打败人类。
AI的分析
现在我们知道通用AI是我们的终极目标,那么我们怎么才能实现它呢?这里列出5个需要精通的领域:
1.感知:像我们人类一样,一台电脑也需要五官来与世界进行互动。但它并不仅仅局限于这五个方面。它可以有人不具备的感觉。透视眼?声纳探测?所有的可能。
2.自然语言处理(NLP):超越感知世界,AI需要懂得解释语言和写字。他们需要解析句子和理解它们之间的细微差别、口音和含义。同一个句子根据上下文不同可以有不同的含义,所以这个任务的难度是众所周知的。
3.知识表达:既然它可以感知到东西 - 物体,人,概念,词语和数学符号 - 它需要一种方式来表示它们大脑中的世界。
推理:一旦它通过其感官收集到数据并和概念连起来,它就可以使用该数据来按照逻辑解决问题。例如,一个象棋软件检测到棋盘上的棋子走动,就可以计算出应对的策略。
4.规划和导航:要想做到真正像人类一样,AI不仅要像人类一样思考。还应该在我们中间生活。因此,研究人员的一个大问题就是帮助人工智能在三维世界中移动和规划最佳路径。自主意识的交通工具必须做好这一点,因为一个错误就会出人命。
你可以看到这些方面是如何在一起协调工作的,诸如机器视觉,它是利用成像和图像分析来解决问题。举个例子,Facebook解析你上传到社交网络上的照片来建议你应该标记谁,并且这已相当的准确。
自动驾驶汽车也许是目前最复杂的机器视觉处理任务了。它需要认清路标,遵守车道,注意车辆、物体和人。它在能见度恶劣的天气条件下,不管白天黑夜,是在破旧的路上还是全新的路上,都要能正常工作。
实现工具
这些概念并不是新的。他们早在1956年就在达特矛斯会议(Dartmouth Conferences)上被提出,这次会议是人工智能领域的开创性事件。
让技术跟上我们的想象要花几十年的时间,我们似乎也马上就要最终站在AI革命的风口浪尖上,随着更多的风险资本投资,更多的大型科技企业投入到AI的研发中来,我们在日常的生活越来越多地使用到AI。
促进AI崛起的重要因素包括摩尔定律,这让我们可以在更小、更高效的芯片上注入更多的计算能力。计算能力到达一定程度后,AI就将会变得既实用又划算。
大数据是导致AI崛起的另一个趋势:当谷歌在2012年为神经网络输入了海量的数据之后,取得了突破性进展,这其中包括1000万张YouTube的视频剧照。
其结果是,神经网络在没人教它的情况下学会了辨识猫,取得了75%的准确率。没有这1000万个视频资料库是不可能实现的。
当机器会学习
现在,让我们理清几个常常容易相互混淆的概念。机器学习是一个专注于从数据里学习insights并利用它们来预言世界的AI技术。
机器学习已经用算法实现了。一个任务是通过一系列算法来完成的。这种算法的例子包括决策树学习和关联规则学习。
机器学习算法使整个世界闪耀了起来,但是,它只是人工神经网络,一个由我们大脑的神经如何运作而得到启发的技术。
它甚至进入了流行文化:创业公司Pied Piper就是在神经网络上运行其压缩服务。
这里有一个简单的解释:神经网络是由好几层的神经元组成的。输入被传递到第一层上。单个神经元接收输入,给每个输入值一个权重值,并在这个权重值的基础上产生一个输出。
输出从第一层被传递到第二层来进行处理,以此类推。最终的输出就这样生成了。
然后,奇迹就发生了。运行网络的人定义了“正确”的最终输出应该是什么。每次数据通过网络传递,最终的结果都是与“正确”的值比较,每次它都会调整权重值直至其创建正确的最终输出。这个网络实际上是在进行自我训练。
举个例子,这个人造大脑可以学习如何从照片中识别椅子。随着时间的推移,它会学会什么是椅子的特性,来提高他们识别出椅子的概率。
Facebook的AI负责人Yann LeCun用类推法来解释神经网络:
模式识别系统就像个一端带有摄像头的黑盒子,在顶部有一个绿灯和一个红灯,前面则有一大堆的旋钮。学习算法就是试图调整旋钮,当在镜头前是一条狗时,使红灯亮起;当镜头前有一辆汽车的时候,使绿灯亮起。
在你给机器展示一只狗的时候。就把红灯亮起,不要做任何事情。如果它是暗的,就调整旋钮使灯光变亮。如果绿色指示灯亮起,调整旋钮,使其变暗。然后,显示汽车的时候,调整旋钮使红灯变暗,绿灯变亮。
如果你展示了很多汽车和狗的案例,而你每次都是不断一点点地调整旋钮,最终,机器每一次都会得到正确的答案。
现在我们来谈谈深度学习,这是一套简单的训练多层人工神经网络的方法。它已被证明从数据中识别图案是特别有效的。不论何时媒体谈到神经网络,很可能指的都是深度学习。
关于机器学习和深度学习的一个伟大解释:How Does Your Phone Know This Is A Dog?
深度学习对于AI的促进作用是显而易见的。它现在在软件行业之外的许多行业都已经使用。
Facebook M,一个人工智能驱动的虚拟助手,正在使用深度学习来帮助用户完成各种任务-包括做研究、预订机票以及买咖啡等。
谷歌正在使用一个名为RankBrain的深度学习系统来过滤搜索结果,来和更多的传统搜索结果进行比较。据彭博社描述:
该系统每天帮谷歌处理15%的之前系统没有遇到过的查询请求。它善于处理模棱两可的查询请求,比如“在食物链顶端的消费者怎么称呼?”
该系统现在已经是谷歌搜索结果的第三大信号,位居反链接和内容之后。
神经网络可以识别猫?这就是深度学习。
从Siri到萨曼莎
深度学习可能是建立更智能、更类人类AI的一个关键拼图。
谷歌扫描猫的大脑需要1.6万台计算机处理器来运行。击败围棋世界冠军李世石的程序AlphaGo,运行在48个处理器上。在未来,神经网络能在廉价的移动电话上运行。
深度学习可以提高AI的各个方面,从自然语言处理到机器视觉,可以看成是一个能够提高计算机学习能力的更好的一个大脑。
它可以提高虚拟助手例如Siri或谷歌处理不熟悉请求的能力。它可以处理视频和生成总结内容的短片。
或许有一天它还会赢得奥斯卡奖,谁知道呢?
在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以关注猿学,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!