如何建立人工智能护城河?
有一位博主曾经在他的文章中介绍了“智能系统”的概念,主要解释了以人工智能和数据驱动的产品如何帮助公司建立深厚的护城河,从而保护他们的利润和市场份额,免受竞争对手的冲击:
成功的公司可以建立良性循环的数据,因为您生成和生产的产品数据越多,模型就越好,产品也就越好。
这是一个很关键的部分,但它不是完整的故事。更好的模型并不能保证更好的产品。如果没有两者之间的联系,你就不会有护城河。弄清楚如何创建这种良性循环是产品战略和数据战略相遇的交汇点,也是这篇文章的主题。
模型、产品、价值
让我们从一个简单的问题开始:机器学习模型的商业价值是什么?
它本身的价值是零。因为在市场上创造价值的不是模型而是产品。
换句话说,模型只能作为产品的一部分生成价值。它可能是自动化我们工作流程中的一个常规动作,也可能是检测网络流量异常或提供个性化推荐。在每种情况下,模型的价值基于它的产品产生所谓的价值。
如果模型做出预测却没有产品可以使用它,它是否会创造价值?
量化预测价值
量化模型的潜在商业价值的一种方法是想象该模型是100%准确的。这对您的业务有何影响?答案可以是美元、点击次数、转化次数或任何其他可量化的商业指标。我称之为模型的预测值。
例如,保险公司可能希望使用机器学习自动化索赔处理。模型将从每个声明中提取信息并决定是否批准它。具有100%准确度的模型将降低代理商的成本,减少处理时间,并允许公司更有效地扩展,因此其预测值非常高。
并非每个模型都有可能如此有价值。一些初创公司推销基于人工智能的解决方案,这些解决方案根本没有足够的可寻址市场。如果你的神经网络没有创造商业价值,那么它是否100%准确是无关紧要的。
让我们继续这个思考下。实际上,没有任何模型是100%准确的。那么,如果模型准确度达到99%,那么预测值会发生什么变化呢?
我们可以考虑下保险公司,可能会批准少量欺诈或其他未披露的索赔。如果这些索赔成本非常高,那么自动处理其余99%的索赔所节省的成本就会被抵消。
从产品战略的角度来看,这带来了明显的挑战,因为构建高度精确的模型需要大量的时间、资源,尤其是数据。在这种情况下,有一个简单的解决方案:对自动索赔的价值设置上限。这是一个简单的示例,说明产品和数据洞察如何协同工作以加速价值创造。我稍后会回到这里,但现在让我们继续思考这个实验。
模型值图
99%的准确性问题为我们提供了一些有用的见解,但它仍然过于乐观。实际上,您构建的第一个模型远没有那么准确。究竟有多准确?这你不会事先知道的。因为它取决于许多因素,主要是数据量和问题类型。
即使您不知道模型的准确度是60%还是90%,您仍然可以在这些不同的情况下评估预测值。您不需要实际构建任何模型来回答这些问题。事实上,你甚至不需要了解很多的有关机器学习的知识!
让我们把这个思想实验的结果绘制成图表,在x轴上设置成精确值,在y轴上设置成预测值。这是模型值图,以下是保险公司的情况:
图表呈上升趋势,因为随着模型精度的提高,预测值总是会提高。但是,由于任何错误的成本都很高,该模型只能在非常高的精度下产生显著的价值。在容错性较低的许多情况下,这种模式很常见。
达到收益递减
让我们考虑另一个例子。当您致电优步时,您可以估算出驾驶员的到达时间,这是机器学习模型的预测输出。例如,可以通过预订的行程数量的增加和取消的行程数量的减少来测量预测值。
该模型的模型值图表是什么样的?即使是一个不准确的ETA,对乘客来说仍然有些用处,从而产生正的预测值。准确的ETA当然更有用,但在某些时候你会收到递减的回报:知道确切的到达时间到第二个点不会影响旅行次数。换句话说,模型值图趋于平稳:
这也是一种常见的模式。这比保险示例中的情况要安全得多,因为即使模型不是很准确,该模型也能产生良好的价值。
破碎的环节
但具有稳定价值的模型代表了一个错失的战略机遇,因为它们并没有创造出一条深厚的护城河。
机器学习模型不是静态的,他们可以重新训练和改进。当优步刚刚起步时,ETA的预测并不十分准确。但随着越来越多的乘客上路,该公司收集了越来越多的数据,模型变得越来越准确。
产品是否也变得更好?模型值图表告诉我们答案。当图表趋于平稳时,这意味着对于这个特定的模型,从收集更多数据或使用更复杂的建模技术中获得的机会并不多。更好的模型和更好的产品之间的联系被打破了。
也就是说,即使竞争对手的数据少得多,竞争对手也能迅速赶上并创造出类似的价值。如果模型在您的产品中具有很好的功能,那么这可能是可以接受的,但如果它是价值生成的核心引擎,就不是这样了。这就是为什么单凭数据或深层技术很难建立一条可防御的护城河的原因之一。
如果模型在您的产品中具有很好的功能,那么这可能是可以接受的,但如果它是价值生成的核心引擎则不是。这就是为什么单靠数据或深度技术难以构建可防御的护城河的原因之一。
如何建立AI护城河
那么如何用数据和AI建立一个可防御的护城河呢?以下是您希望模型值图形的样子:
这意味着您的模型即使最初的准确性可能较低,也会产生一定的价值。然后,当您收集更多数据并改进模型时,预测值会增加。
这种模式确立了更好的模型和更好的产品之间的良性循环,并确保数据较少的竞争对手将具有显著的劣势。
从更好的模型到更好的产品
实际上,单个模型很难符合该模型。但成功的AI产品并不仅仅依赖于一种机器学习模型。相反,它会利用模型生态系统之间的协同作用,随着更多数据的生成而共同改进。
再看看优步,除了ETA预测之外,UberX,我之前讨论过的优步服务,也是由预测乘客需求和旅行模式的模型提供支持。单独来看,这些模型中的每一个都可能是稳定的,但总的来说,它们的预测值可以在更长的时间段内保持增长。
随着您生成越来越多的数据,您的每个模型都会变得更加准确。随着时间的推移,先前预测值较低的模型,如保险公司的情况,可以提高到足以产生实质价值。最终,您可以释放潜力,利用这一新的模型群体为新产品提供动力,创造更多价值和更深层次的护城河。
AI S曲线
以Uber POOL为例,这是一种较新的优步服务,允许乘客在类似的路线上拼车,并分摊费用。除了UberX模型之外,POOL还依赖于一组需要更高精度和复杂性的模型,例如预测额外乘客是否会加入正在进行的旅程。该模型具有相对较低的容错性,因为错误的预测可能会给公司带来巨大的损失。
作为一种产品,POOL打开了一个更注重价格的客户的新市场。这对Uber来说显然非常有价值,这意味着为POOL提供动力的模型具有很高的预测价值。
让我们一起绘制UberX模型和POOL模型的模型值图。
与ETA预测示例一样,为UberX供电的模型开始以相对较低的精度产生价值并快速扩展,然后趋于平缓。这样就会形成一个S形曲线。一旦准确度足够高,POOL模型就会启动,并且与UberX模型一起继续扩展预测值。追踪所有模型的预测值,可以发现优步深层AI护城河后的预测值正稳步上升。
这种模式类似于创新的S曲线,它标识了一种技术成熟与刚刚开始出现的新技术之间窗口创新和破坏的机会。同样,我们案例中的关键战略问题是如何确定何时出现了一批新的高价值模型的潜力以及如何在产品创新中利用它。我将在以后的帖子中继续探讨这个话题。
总结
人工智能和数据有可能形成深层防御护城河,关键是要建立更好的模型和更好的产品之间的联系。 随着更多数据的生成,模型变得更好,但任何单个模型的预测值都趋于稳定。 通过战略性地利用新的更强大的模型群和他们解锁的产品机遇,成功的企业可以扩展其数据产生的业务价值,并构建深厚的AI护城河。
编译出品