2020企业机器学习行情报告:七大发现
Algorithmia的《2020年企业机器学习行情》报告对745名技术专业人员进行了调查,确定企业计划在2020年如何部署机器学习以及一路面临的关键问题。报告声称,与机器学习部署有关的最大挑战包括扩展规模、版本控制和预算编制。
Algorithmia的首席执行官Diego Oppenheimer说:“人工智能和机器学习将成为我们毕生看到的最具影响力的技术进步。为了帮助企业开展机器学习工作,报告将数据分为以下七大发现:
1. 面向机器学习的数据科学崛起
Oppenheimer说:“数据科学的作用是获取这些公司收集的大量数据并加以解读”,技术进步使许多公司生成更多数据,这导致需要更多的数据科学家。
随着机器学习普及开来,需求的这种增长会持续到2020年:报告发现,近60%的企业将雇用1名至10名数据科学家。
Gartner发现,其中一半以上的企业会开展至少一个机器学习项目,但是2020年预计部署数量会翻一番。随着机器学习项目增加,报告发现企业会开始看到新的数据科学职衔,包括机器学习工程师、机器学习开发人员、机器学习架构师、数据工程师、机器学习运维以及人工智能(AI)运维。
2. 削减成本为重中之重
报告还研究了公司希望从机器学习获得的好处。报告发现,总体而言,前三大使用场合包括降低公司成本(38%)、获取客户洞察力和情报(37%)以及改善客户体验(34%)。
Oppenheimer说:“在许多情况下,机器学习能够减少错误,这可以帮助公司开源节流。比如针对需要录入或处理大量数据、可能需要很多人、容易出错且速度稍慢的工作,机器学习可以大大提高自动化程度,使结果更准确。它可以解放执行基本数据录入工作的那些人,处理更高级的任务,人更适合处理这类任务。”
报告发现,大中型公司主要致力于削减成本,而小公司对改善客户体验更感兴趣。
小公司在努力留住客户并拥有稳定的业务,大公司可能没有这问题。Oppenheimer说,考虑如何使用机器学习时,优化是一大使用场合。
3. 企业大量处于尚不成熟的早期阶段,为了AI而AI
报告发现,到2020年,企业的机器学习项目仍将处于早期阶段:21%的企业称它们会评估使用场合,20%的企业自称是机器学习生产环境的早期采用者。
然而受访者表示,到2020年底,他们将处于不同阶段。约23%的人表示他们会在生产环境中使用模型,22%的人表示会开始开发模型。
Oppenheimer说:“将来无法想象哪家公司不使用机器学习和数据科学来优化业务。问题在于,许多团队在不了解最终结果需要什么样子的情况下贸然投入。事实上,你需要了解业务优化需要什么样子。”
4. 漫长的部署之路
公司花很长时间来部署机器学习。针对仅仅一个机器学习模型,受访者表示他们最多要花90天的时间来部署。报告发现,近20%的公司称需要的时间超过90天。
这个过程可能需要一段时间,因为机器学习项目太新了,目前的数据科学家可能并不完全熟悉该方法,这可以解释为什么新的数据科学家职衔会在2020年涌现。
报告称,大公司的部署之路更漫长。Oppenheimer称,主要原因是由于企业规模越大,批准环节就越多,需要人员来监管项目。
5. 规模扩展问题
报告发现,受访者认为扩展模型的规模是最大挑战(43%),高于去年的30%。报告称,这一挑战可能与分散的组织结构有关,这常常导致规模扩展过程中工具、框架和编程语言等方面出现问题。
Oppenheimer说:“一大障碍是工具很多。构建模型的员工通常不是最擅长扩展规模的人选。企业需要认识到这些团队需要有不同的技能,然后意识到框架方面的进展非常快。机器学习领域可以用日新月异来形容。”
报告中提供的一种解决方案是在企业内部设立创新中心。报告称,这种中心专用于机器学习之类的创新项目,能够以敏捷方式来运作,实现机器学习工作标准化。
6. 预算与机器学习成熟度不一致
报告发现,机器学习预算总体上在增加,但是因项目的成熟阶段而异。
处于机器学习成熟中期阶段的公司将机器学习预算增加了1%至25%,而处于创新高级阶段的公司中这么做的比例占到39%。报告发现,处于机器学习成熟度较高水平的企业中约30%表示,它们将预算增加了26%至50%。
该数据表明“如果你能证明成功,会获得更多的预算,”Oppenheimer说。“我们已看到许多公司在全面增加机器学习和数据科学方面的预算。但对于长期增加预算的公司而言,它们到了一定水平的成熟度,正将机器学习和数据科学融合到更广泛的部门中,因此需要更多的预算才能与之匹配。”
7. 确定机器学习在整个企业取得的成功
报告发现,确定机器学习成功的两大指标是业务度量指标和对机器学习模型性能的技术评估。