大数据是否将我们拖到另一个AI冬天?

即将开播:5月20日,基于kubernetes打造企业级私有云实践

过去几年中,令人屏息的新闻剪辑数量令人难以记住,但人工智能的历史充满了挫折和挫折。 记忆犹新的人们记得70年代初和80年代的第一对所谓的" AI冬季"。 首先是由于对AI的幻灭而造成的,而第二个(可能更重要的)冬天诞生了,因为技术和物理硬件远远落后于当今的理论。 例如:科学家发明了反向传播的概念,它是深度学习的基础,但是直到现代的GPU大量出现后,真正的必要的计算能力才真正发挥出来。

大数据是否将我们拖到另一个AI冬天?

现在,当然,情况已经改变。 计算是随时可用的。 我们正在研究数据。 政府正在投资研究。 大学生正在研究机器学习。 媒体报道了AI,这是技术的下一次巨变。 一切似乎都朝着未来的趋势发展,在这种情况下,人工智能已经相当普遍,公众也理解并接受了它的承诺和实用性。

不幸的是,"似乎"是最后一句话中的执行词。 企业正在投资人工智能,但只有约三分之一的企业看到了投资回报。 而且,如果该投资回报率仍然难以捉摸,那么就很容易预测投资将开始萎缩的世界,尤其是在全球性经济环境中,这种经济环境由于史无前例的大流行而变得动荡不定。 与其享受上一个AI冬季以来的持续解冻,不如轻松地看着温度再次下降。

但是请注意,问题不在于AI不能赚钱还是不能赚钱,而是可以。 例如,许多流程自动化AI项目都是成功的。 考虑一下那些"阅读"法律文件并提取信息的AI,或者分类和处理客户沟通或核对账单问题的AI。 当然,这些不是最性感或最复杂的用例,但它们可以为公司省钱,因此您知道他们很快就不会去任何地方。

因此,如果AI可以赚钱,为什么只有35%的公司看到投资回报? 一个很大的原因是,构建和训练模型的成本仍然过高。 好吧,那为什么呢? 正是由于最近的另一种趋势席卷了整个企业,尤其是科技界:大数据。

问自己:您听过多少次"更多数据"才能使模型变得更好? 实际上,这是错误的。 高质量的数据使模型更好。 有用且标签明确的数据使模型可以工作。 有无数的数据? 其实并不重要。 尤其是在无法证明数据有用的情况下。 当您处理我们在此谈论的数量时,这很难做。

现实情况是,由于缺乏更好的期限,投资者以及大数据行业一直保持着对大数据的首要地位的叙述。 大数据的成本是AI成本的巨大推动力。 人工智能和机器学习从业者所担心的是,那些完全相信自己需要堆积所有数据(即使他们看不到这样做的明显效用)的公司可能会开始撤回对人工智能的投资,以支持建立大数据。 但是,首先存储所有数据比较大的原因是,您可以进行预测并从中构建AI。 换句话说,我们实际上正处于大数据扼杀AI投资的危险中-奇怪的是,这首先存在于AI中的一个重要原因!