在追赶AI浪潮时髦之前,要先问自己三个问题
大数据文摘出品
文章来源:medium
编译:杨威、蒋宝尚
稍微有点想法的公司不是已经部署了AI项目就是在部署AI项目的路上。确实,在全面商业化的今天,这种激情促进了人工智能的普及,也在一定程度上降低了企业的成本,提高效率。
尤其,有些自动化工具的出现,例如谷歌的Auto系列,使得那些非技术专家也能采用AI的解决方案。
但是,在赶AI浪潮时髦之前,还是要问问自己以下三个问题:
- 任务是否属于数据驱动型?
- 是否有足够的数据来支持AI驱动的解决方案?
- 是否了解AI的工作原理?
如果对于上面的三个问题,没办法做到心中有数,那么就要掂量掂量所做的AI项目是否能够成功。
如果你能够对这三个基本问题说YES,那么,恭喜你,你可以尝试构建AI解决方案了。
通常来说,启动AI解决方案有三个基本选项可供参考:
- 用AI-aaS解决方案,例如Amazon AI(Rekognition),Google Cloud Vision或IBM Watson。它们提供一定的AI功能,主要通过API实现文本和图像识别。
- 与第三方应用的AI公司合作,这些公司专注于更广泛,更个性化的垂直AI服务。
- 使用内部团队和数据从头开始创建属于自己的机器学习系统。这主要适用于跨国公司以及AI对其核心价值和收入至关重要的组织。
采用第二种方案是大多数企业的选择,因为对比收益和风险,第二种方案带来的回报合算。第三种方案风险最大,当然带来的收益也是最大的,毕竟风险和收益成正比。
那么,如何正确认识一个AI项目,如何为AI项目选择最高效的解决方案,读读下面几条经验,相信你会找到答案。
不积跬步无以至千里
重整传统业务流程彻底向AI转型听起来确实很有魄力。但是,从概率上来讲,这种方式失败的概率也是最大的。
实际上,最明智的做法是从小项目中获得经验,然后厚积薄发,为更大,更复杂人工智能项目奠定坚实的基础。此外,强烈建议关注一些成功和成熟的项目,毕竟,他们大多数具有可靠的投资回报率。
尽量避免使用有过多变量和潜在结果的任务。在项目中,先把注意力集中在流程的一小部分,而不是整个流程。即使在今天,用单一的AI解决方案替换完整的流程仍然是非常困难的,更何况是设计一套这样的系统。最好的办法是采用化整为零:将完整的凌流程分解,然后逐个击破。
此外,在开展此任务的时候,要想想自动化的任务是否允许重复以及容忍低成本的错误。
明确自己想要的
每个人可以对同一问题以及如何解决问题有不同的看法。但是,缺乏明确的愿景可能会阻碍成果的充分实现。建议多花时间定义目标。明确你想要实现什么以及为什么?
让合适的人员参与过程的定义。这些人员必须是业务决策者和数据科学家之,因为只有他们才能真正了解业务案例。
如果开发人员不是机器学习专家,如果开发人员和数据科学家之间存在差异。这时候作为企业的领导,就需要确保AI易于使用并有一套长期解决方案。
机器学习可以用很多不同的方法来进行,但是正确的解决方案将取决于对问题的良好理解。如果缺乏必要的人力资源,强烈建议采用外包服务。实际上,确定不同过程需要什么样的人工智能,以及这些过程是以内部,外包还是合作实施的方式实现,是制定战略的重要一步。
如果在组织内部开发AI解决方案,不要忘记学习曲线的陡峭性,因为实施方案所需资源的成本可能非常高。例如,一个简单的识别模型解决方案的开发成本可能非常高。但是在市场上,这些方案依赖于现有软件服务或平台。
技术团队非常重要
如果外包AI解决方案的开发,那么让技术和业务专家参与开发过程是明智之举。此外,数据科学家,数据工程师和操作系统工程师需要团结一致,因为他们能够提供充分的技术环境,帮助你完美使用解决方案。
此外,AI解决方案必须具有内置的反馈循环机制,以便可以纠正AI的预测和输出。
最后,构建的AI工具交互界面,必须易于使用,可扩展且安全。
AI项目失败的经验教训
根据我的经验,大多数AI项目出问题都因为以下因素造成的:
在大多数人工智能项目中,公司倾向于忽视“人”的因素。事实上,人工智能不只是关于框架,数据和算法,它也与人有关。行政领导的支持以及关键AI岗位的合适人才非常重要。在开发方面,可以利用人力和机器智能来创建机器学习模型。让人类直接参与训练,调整和测试特定ML算法的数据能够培养“AI直觉”。
值得注意的是,成功的项目总有一个共同点,即新的AI部署始终在一小组员工中进行测试,因为他们提供有关系统界面的真实反馈。
数据问题
大多数项目都基于机器学习,因此大量的数据是必须的。通过足够的数据,就可以利用模型来预测未来的决策,而这正是公司所寻求的。
在开始人工智能之旅之前,必须确保所有操作系统中的数据都流水线化并存储在大数据存储系统中,方便供AI解决方案使用。
需要多少数据?这取决于数据的质量以及项目的实际情况。如果没有足够的标签数据,就需要开始以结构化的方式收集因素和决策,以便可以在不久的将来将它用于AI平台。
另一个问题可能是数据集。
拥有正确的数据集至关重要。但是,数据集的大小不是真正的问题,范围才是。AI的挑战不在于实施,最重要的问题是如何训练AI?这就是为什么需要花时间确保数据与AI解决方案兼容的原因。
此外,投资AI转型所需的基础架构硬件也是必须的。机器学习需要高水平的计算能力,以及高带宽和存储系统。
AI提供公司发展的绝佳机会。但是,它也很容易出错,毕竟它是一种新的复杂技术。如果你对某种解决方案感兴趣,但是忽略了数据和技术,那就不要在问题面前提出承诺,因为这可能是一个糟糕的解决方案。建议花点时间思考,不要急于开发人工智能。
相关报道:
https://medium.com/predict/what-i-have-learned-after-several-ai-projects-131e345ac5cd