企业界迟迟未采用深度学习的四大原因

深度学习是最先进的人工智能方法,涉及机器翻译、计算机视觉和自然语言处理。不使用这些技术会影响收入,并限制最终用户的体验。

使用深度学习的方法可全面解决问题。换句话说,我们让算法而不是人类来决定什么是解决问题的要点。这种方法简化了系统,并让数据可以做决策。更重要的是,它最大限度地减小了人类带来自身偏见的可能性。

1. 深度学习很深奥,要招聘合适的人员。 

企业界迟迟未采用深度学习的四大原因

深度学习是人工智能这个更广泛的领域的分支。

深度学习是个庞大的研究领域。如今许多公司使用的机器学习大多可能基于广为人知、较为悠久的算法,这些算法可使用scikit-learn之类的开源工具轻松构建。然而,深度学习还没有达到那么成熟的地步。谷歌员工François Chollet开发的Keras、Facebook的PyTorch和谷歌开发的Tensorflow,诸如此类的工具已让深度学习更普及开来。

虽然让简单的深度学习例子切实有用比较容易,但改变行业规则的重大结果却需要我们所说的“魔法”。深度学习的秘诀在于,最先进的结果需要大量的计算资源、深入了解训练技巧以及特别熟悉某种特定的方法。

解决办法:招聘构建过深度学习系统,而不是只会复制粘贴的研究人员。这些人不需要都有博士学位,一些顶尖的机器学习研究人员连大学学位都没有。

2. 可解释性重要吗?

深度学习中的可解释性是指明白为什么系统做出某个决策。这是人工智能界的一个热门话题,具体归结为企业的使用场景和风险容忍度。对于制药公司来说,明白算法为什么做出可影响我们生活的决策是个好想法。对于客户流失预测来说,如果系统能大大降低流失率,可解释性可能不是很重要。

正如Facebook的人工智能研究主任Yann LeCun在《人工智能大辩论》中所说:“如果你向一家公司展示两个系统,一个是表现还行的可解释的简单系统,另一个是表现更好的较复杂系统,公司每次都会选择后者,每次都是如此。”

我在自己的工作和研究中经常听到的就是所谓的“黑盒子谬误”(black box fallacy)。数据科学家常常将神经网络称为无法理解的黑盒子。虽然解释结果不如更传统的方法那么清楚,但是我们开发出了许多方法来探究这些网络的内部。这应该不会阻止公司采用深度学习。

解决办法:确定可解释性在贵公司带来的实际影响。另外构建简单的模型,以便有一个基准。如果你的深度学习方法好得多,它可能会提供更引人入胜的商业理由。

3. 你需要更多的数据和GPU。

数据和计算能力是当今深度学习切实可行的两大原因。GPU将计算时间从几星期缩短到几小时。TPU的速度更快。要是没有这些GPU,你不可能足够快地训练这些模型、获得显著成效。贵公司可以自行购买GPU,也可以向亚马逊网络服务(AWS)或谷歌云等提供商租用。

深度学习方法需要大量数据才能发现不太明显的模式。如果没有足够的数据,这些系统注定会失败,或者给人以一种性能良好的假象(即:过度拟合)。

解决办法:收集你所有产品的原始信号。别害怕在GPU上花钱。

4. 人工智能战略的目标不够远大

企业界迟迟未采用深度学习的四大原因

为什么深度学习因大数据而变得更有意义?

手动特征工程是指人类选择对算法来说很重要的东西。由于这个环节牵涉人类,这些系统的性能受制于人类的创造力。一种更好的方法是,使用来自贝叶斯机器学习的技术将人类的直觉添加到系统中。

数据科学团队认为深度学习对于大多数问题而言大材小用。虽然神经网络无法解决所有问题,但它们是最先进的方法,涉及计算机视觉、音频和自然语言处理。这种思维人为地限制了系统的性能。如果你知道汽车比马快,为什么还要继续骑马?

解决办法:使用较悠久的机器学习方法构建强大的基准。如果深度学习能超过这个基准,就使用深度学习。这让你得以量化这些技术相对于更简单的方法所提供的价值。

结束语

相关推荐