试水人工智能前,先搞清楚机器学习与深度学习,你要哪个?

随着人工智能(AI)进入主流商业实践,各种不同的应用程序正在谈论如何最佳利用AI技术。在观察这些对话时,我注意到一些作者交替使用术语机器学习(ML)和深度学习(DL)。就解决的业务问题和所需的资源而言,这两者实际上是不同的概念,混淆它们可能会导致不必要的成本增加。

试水人工智能前,先搞清楚机器学习与深度学习,你要哪个?

当我们看到人工智能成为头条新闻时,例如苹果使用面部识别技术来保护iPhone安全,或者制作模仿奥巴马总统演讲模式的视频。这些应用通常都属于深度学习范畴。实际上,DL已经存在了几十年,但是直到最近几年才有足够大的规模在计算上使其变得可行,并成为一种有效的选择。

深度学习被认为是整个机器学习的一个子集,这是一种AI方法,它使应用程序能够更准确地预测结果,而无需特别编程。ML工作的一个很好的例子是你的垃圾邮件过滤器。过滤器后面是一个算法,不断“学习”有关可能的垃圾邮件或网络钓鱼邮件的标签。因此,大多数应用程序能够将垃圾邮件减少到收到的所有电子邮件的1-3%。大约15年前,垃圾邮件过滤器开始从基于规则的系统转向基于机器学习的过滤器。简单的贝叶斯ML算法可以从大量的“垃圾邮件”训练集中学习,其中单词,标题和IP地址最可能指出电子邮件是垃圾邮件。

出于区分的目的,我将把在过去15-20年间在商业上可行的简单ML算法称为“经典机器学习”。这些算法包括一套机器学习算法,数据科学家可以在一个小的数据集上运行,相对容易地创建预测,聚类,检测异常值等等。

深度学习在预期的目标需要分析由复杂的相互关系网络连接的大量因素时起作用。要了解差异,请考虑一辆正在接近路口的汽车。即使在不同的天气条件下,经典的机器学习算法也可以确定交通信号是红色,黄色还是绿色。但是,正如任何车手所知道的,在交叉路口做出决定要求的不仅仅是灯光是红色还是绿色,我们还必须考虑行人,其他车辆,我们所在的车道等,以及所有这些因素如何与彼此关系。吸收和处理所有这些数据以做出最佳决策是深度学习的工作,这就是为什么它被用于自动驾驶的原因。

当深度学习进入主流商业世界的时候,实施既不便宜也不简单。在人员方面,需要一支训练有素的数据科学家和工程师团队,他们拥有先进的深度学习技术。这些专家人数并不多,而且可以获得顶尖的薪酬。在硬件方面,将需要一系列带有高端图形处理单元(GPU)的计算机,这会以成倍增长的速度增加成本。

幸运的是,对于大多数商业用途来说,经典的机器学习非常好。我喜欢将经典的ML视为“80/20”解决方案,它只需花20%的成本即可实现80%的深度学习。这一切都取决于你的目标。

对于一个真实世界的例子,让我们回到电子邮件垃圾邮件过滤器。正如我前面提到的,大多数经典的机器学习启用的过滤器能够将垃圾邮件率降至1-3%。最近谷歌指出这个比值依然无法让用户满意。他们发起了一项倡议,将深度学习方法整合到Gmail过滤器中,目前垃圾邮件率为0.1%,假阳性率为0.05%。这个结果是否匹配所需要的人力,资源和预算的巨额投资?谷歌认为值得,但对于其他企业而言,看法可能会不同。

所以,在你组建一个工作组来决定深度学习是否为企业的一个明智的方向之前,花点时间和精力去决定你想达到的目标。经典的机器学习可能会给你带来机会。如果做不到,那么深度学习才是下一步。

相关推荐