不知道AI落地这三大痛点?小心未来被裁员!
AI落地难有多难?IBM都因此要裁员了!
据英国科技网站 The Register 报道,有 IBM 内部消息人士透露称,Watson健康部门即将解雇50% 至 70% 的员工。
Watson 健康是IBM“认知计算”计划中的标杆项目。如今,Watson健康大裁员,无异于宣告IBM这些年的努力基本失败。而IBM失败,正是因为遇上了AI落地的一些痛点。
AI医疗,怎么才看起来够靠谱?
Watson健康于2015年成立,主要是运用AI技术,助力医生应对癌症、慢性病、流行病等“健康杀手”。
这一年,AI这个概念还没有大火,大数据的强大实力才刚刚露出它的冰山一角。Watson便是通过这些对于人们来说还十分陌生的概念,席卷了全球医疗界。
但是,随着人工智能时代的到来,人们开始有了更多的思考。医疗数据的敏感和隐私、获取的难度、数据集的不准确和不完整、信息共享难以实现等问题,都逐渐暴露在了公众眼前。AI能否代替医生,也成为了一个公众性议题。
不仅如此,越来越多的资本玩家开始进入AI医疗市场,也让IBM遇到了前所未有的竞争压力。
这时候,摆在IBM面前的真正问题,是如何在万千AI产品中凸显自己的优势。而在这一点上,IBM显然搞砸了。
模型有效性缺乏市场认同
为了宣传自己的产品,IBM通过媒体、广告等手段,大肆渲染自己取得的成果,如市场占有量、数据集体量、公司并购等,却唯独没有对模型的有效性给出一个直观且能被市场认同的答案。
模型的有效性计算依靠的是测试集。而测试集有两类:一类是从既得数据库中单独划分出的一组数据;另一类则是由行业公认的、作为性能计算统一标准的数据集。
第一种数据集,在绝大多数模型训练中都会有所涉及。不过由于测试集要瓜分一部分既得数据集,在数据集体量不够之时就会显得十分尴尬。由此,也会有直接忽略测试集的情况。
而行业公认标准测试集,目前只在语音和图像领域存在,例如大家熟悉的ImageNet就是李飞飞教授所建立的图像测试集。由于这样的测试集被行业普遍使用,由此得出的性能参数也就有了可比较性。
更关键的是,如果模型始终在固定样本来源的数据集中进行训练,很有可能会出现过拟合的情况,从而无法适应普遍的应用场景。
因而,像医疗这样“人命关天”的领域,建立起行业公认的标准测试集,可谓是解决落地痛点的关键。
产品太贵,变现难
如今,数据搜集与数据交易的难度成为了AI产品生产成本高居不下的主要原因。但是,这也成为了一些用户体量大、用户行为数据丰富的公司的机遇。不过,Watson健康显然不属于这一类。
对于AI产品来说,研发成本高是一方面,后期迭代的费用更是难以预计,并且,在发展的初期,AI产品绝大多数还是辅助性产品,并不能解放大量人力物力。
对于一个开销巨大、还不知道有没有卵用的高科技产品,很多客户自然会望而却步。MD Anderson癌症研究中心就曾以3900万美元的价格购入了IBM的AI产品,却无法相信AI分析所带来的结果,导致和AI“合作”过的医生都苦不堪言。
那么,如何让AI产品能够顺利变现呢?目前对于大公司的解决方式是,放弃B2B,只做B2C。
所谓B2B,即根据企业的具体需求定制AI,或是研发功能全面、可适用于绝大多数企业应用场景的AI。
由于大公司人力成本高,如果为企业定制AI,就像Waston健康做的那样,价格非常容易超出企业的预算范围。而如果研发功能全面的AI,在如今市场细分化、长尾化的背景下,显然不具有商业竞争力。
而B2C,即开发适用广大消费者的AI服务,以大公司的品牌效应来说是十分容易的。
那么对于中小公司来说呢?B2B是唯一的出路。中小公司尤其是创业公司,受到数据体量的限制,根本无法保证AI的准确度。而B2B项目,数据一般由客户提供,因此能够避免数据不足而带来的尴尬。
另外,中小企业人力成本低,也能降低企业的投入,是B2B里较有竞争优势的群体。
数据窘境
虽然很多巨头的数据体量都比较可观,但是这种可观也只是在具体的领域上。目前的各大巨头,都是主要依靠自己之前所收集的用户数据进行模型训练。
而医疗数据,因为其隐私性、敏感性,并不属于各类软件可合法采集的用户数据。所以,就算是互联网巨头,在这方面的产品研发上,也会因为数据不足而处处掣肘。
不仅如此,由于医学的复杂性,其数据的处理也需要拥有医学背景的AI专业人士的参与,这就产生了人才真空的地段,也进而导致巨头们对医疗数据处理效率和能力的低下。
就以肺炎为例,如果要让AI通过X光片检测哪些病人是健康的,哪些有肺炎,哪些有比肺炎更严重的疾病……这就需要通过以下原则判断:肺叶清晰的是健康人,肺叶模糊的是肺炎,肺部有圆形对称阴影的是尘肺……所以,必须要有专业的人工来进行标记。
只是身体上的一个部位,就有无数种可能的诊断,AI医疗的难度显而易见。
福布斯就曾经报道称,为了AI研发,Watson不得不雇佣专业的医疗咨询团队对数据集进行改进整理,既费时又烧钱。
读芯君开扒
数据窘境,将来会更显著
任何商品的落地,都会从追求市场面积逐渐转为追求市场深度。AI产品也一样。随着市场被瓜分地越来越彻底,长尾市场将成为商业竞争的重点,这也就意味着,是否精准定位长尾市场进行研发,成为了一个企业尤其是新兴企业能否生存的关键。
但是,长尾市场虽然前景广阔,但数据体量却较之浅层市场小很多,也就为AI的训练带来了更大的难度。
不仅如此,许多长尾市场的数据处理对处理人员的专业程度有着更高的要求。比如,企业需要研发一个办理离婚诉讼的法官AI,那么对于法律条文的解释就必须要有专业的、富有经验的法官来进行。而这在理论上,是难以达成的。
为什么呢?首先,数据处理师目前在行业的地位还处于最底层,所以缺乏对人才的吸引力。其次,数据处理需要一定的AI背景知识,更是提高了人才进入的门槛。
作者:羊习习
参考文献链接:
http://www.tmtpost.com/3273012.html
如需转载,请后台留言,遵守转载规范