一文读懂“深度学习”!它与普通机器学习有何区别?
随着人工智能"阿尔法狗"一战成名,百度无人车的线下量产,以及智能医疗AI的横空出世,似乎都把"人工智能"这个东西推向了时代的高潮,随之衍生出来的"机器视觉""深度学习""神经网络"这些专业名词,也引发了一票人的好奇。
不过真要说"人工智能"是如何通过精密的算法与"智慧"通过围棋这个项目战胜人类的,如何能够达到类似"人"这样的智商,想来也是要牵扯到这其中最重要的一环———"深度学习"了!
深度学习(DL)是一种基于对数据进行表征学习的方法,它能够模拟出人脑的神经结构的机器学习方法。深度学习的概念源于人工神经网络的研究。而人工神经网络ANN(ArTIficial Neural Network)是从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络,简称为神经网络或类神经网络。
简单来说,深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。
举个例子,像打败世界围棋冠军柯洁的人工智能机器人——AlphaGo,它的程序设计不仅包括皮质模型,还包括大脑的一部分被称为"基底神经节"的模型,这对于制定一系列决策来实现目标非常重要。 有一种称为时间差分的算法,由Richard Sutton在80年代开发,当与深度学习相结合时,能够进行人类以前从未见过的非常复杂的玩法。
是不是很神奇?
同时呢,深度学习也是机器学习研究中的一个重要领域,是现在应用较为广泛的一个领域,不过普通的机器学习跟"深度学习"却大不一样,深度学习更"高阶"一点。
那究竟什么是机器学习?
机器学习通俗点来说就是:不需要编程就可以使机器可以模仿人类动作的科学。机器学习利用算法分析数据,并从中学习,然后利用这些数据对特定的事情来做一些预测。机器通过大量数据训练,从而可以执行某个特定的任务。机器学习算法允许机器在没有大量编程的情况下执行任务。
举个例子:你希望通过机器学习算法从图像和视频中来识别物体。那么,你需要大量的图片素材和视频素材,并且由人工给其做好标签。比如说,图片中"有车"和图片中"没有车",这两种标签。
机器尝试着建立一种算法,可以基于标签来辨别包含汽车和不包含汽车的图片。一旦准确率变高了,我们就说机器是可以学习的。
但深度学习却不一样
深度学习深受大脑工作模式启发,尤其是神经元互连性的影响。这也就是为什么深度学习更胜于一般机器学习模型的原因。
而人工神经网络具有多个层级,每个层级可识别对象的一个独特特性。每个层级会选择一个特定的特性去学习,并学习使用它来识别对象。
深度学习可以通过各种复杂的操作,达到人类想要的视觉效果。所以这就是为什么人工智能能够在"计算机视觉""人脸识别""语音图像"这几个领域快速发展的原因了!
值得一提的是,在深度学习领域,有一种出色的技术网络,这种网络更易于训练并且比那种全连接的神经网络的泛化性能更好。
这就是卷积神经网络(CNN)。
当人们对神经网络不感兴趣的时候,卷积神经网络在实践中却取得了很多成功,如今它被计算机视觉团队广泛使用。
卷积神经网络经常被设计用来处理到多维数组数据的。
比如一个有3个包含了像素值2-D图像组合成的一个具有3个颜色通道的彩色图像。很多数据形态都是这种多维数组的:1D用来表示信号和序列包括语言,2D用来表示图像或者声音,3D用来表示视频或者有声音的图像。卷积神经网络使用4个关键的想法来利用自然信号的属性:局部连接、权值共享、池化以及多网络层的使用。
21世纪开始,卷积神经网络就被成功的大量用于检测、分割、物体识别以及图像的各个领域。这些应用都是使用了大量的有标签的数据,比如交通信号识别,生物信息分割,面部探测,文本、行人以及自然图形中的人的身体部分的探测。
人们最常用的"人脸识别"系统就是通过卷积神经网络而呈现的。
在未来,深度学习的应用将更加广泛,到那时候想来也是更多的造福于人类啦!
下一章将给大家讲讲目前,深度学习已经成功应用于哪几个领域了!