如何区分人工智能、机器学习和深度学习?
本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。
人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。
深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。
神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。
在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。
(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)
上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。
深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。
数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。
再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。
而机器学习可以分成下面几种类别:
-
监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。
-
无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。
-
半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。
-
增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。
在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。
当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。
GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。
(图片来自Nvidia Deep Learning Training Workshop)
目前主流的深度学习框架:
-
Caffe 由Berkeley提出
-
TensorFlow 由Google提出 (Apache 2.0)
-
Torch (BSD License), facebook是主要使用者
-
MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用
-
CNTK2 由Microsoft提出 (MIT License)
人工智能在各个行业的公司分布
(图片来源 http://www.shivonzilis.com/)
目前人工智能在各个领域的初创公司数量(2016年的数据):
-
Deep learning/机器学习 (通用)(123家公司)
-
Deep learning/机器学习 (应用) (260家公司)
-
NLP (通用) (154家公司)
-
NLP (语音识别) (78家公司)
-
计算机视觉/图像识别 (通用) (106家公司)
-
计算机视觉/图像识别 (应用) (83 家公司)
-
手势控制 (33 家公司)
-
虚拟个人助理 (92 家公司)
-
智能机器人 (65 家公司)
-
推荐系统 (60 家公司)
-
Context aware computing (28 家公司)
-
语音即时翻译 (15 家公司)
-
视频识别 (14 家公司)
下图是目前人工智能在各个行业的热度
上图是2011到2016年最积极的人工智能企业投资者
下图是福布斯关注的50家人工智能公司。
(图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)
融资最多的人工智能初创公司(2011-2016)
Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。
Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:
Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。
Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。
Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。
Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。
RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析
Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。
H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。
Viv Labs:Viv在开发语音智能助理,已被三星收购。
参考文献:
http://fortune.com/ai-artificial-intelligence-deep-machine-learning/
https://en.wikipedia.org/wiki/Artificial_neural_network
http://fortune.com/2017/02/23/artificial-intelligence-companies/
https://www.amazon.com/b?ie=UTF8&node=16008589011#
http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/
Nvidia Deep Learning Training Workshop