AI公司盈利难?MSN聊天机器人起家的小i是如何做到的
作者 | 非主流
出品 | AI科技大本营
11 月 8-9 日,CSDN 和 AICamp 联合举办的中国开发者大会在京举行。会上,小i机器人解决方案中心副总裁孙欣围绕《AI 技术创新及产业化实践》主题深入分享了如何将 AI 用解决方案落地到真正的商业化中,并接受了AI科技大本营的专访。
作为一家已经盈利的 AI 公司,孙欣表示,在技术商业化过程中最重要的一点就是货币化。直至今日在 AI 领域,应用最成熟、最先落地的就是智能客服领域。小i机器人以 iBot 会话平台,通过自然语言的处理能力、多模型知识库、大数据分析能力以及多模态处理层等相结合面向行业提供了智能化的会话平台。同时提供会话式人工智能五大 Bot,分别为:Chatting Bot 智能闲聊解决日常聊天问题,FAQ Bot 基础问答解决简单、明确的问题,Deep Bot 深度交互解决复杂场景问题,Recommendation Bot 智能推荐解决营销场景问题,Discovery Bot 知识探索解决未收录知识问题。
以下是大会演讲以及采访内容,AI科技大本营编辑整理。
孙欣演讲
我在小i机器人主要负责解决方案的发展和管理工作,通俗讲就是把 AI 用解决方案真正落地到商业化应用里。
小i机器人做了 18 年,这一路走的很辛苦,18 年以来我们一直在不断探索,在如何把人工智能更好的落地到商业化的场景里,如何跟传统产业做结合。在这个过程中我们一直在不断追求 AI 的技术创新,以及产业化的实践。
市场拐点已经出现
从 2001 年成立至今,我们发现 AI 浪潮才刚刚开始,整个市场变化其实一直是动态的,市场的需求也是递次发生的。2008 年我们把聊天机器人落地到了 10086,在运营商领域做客服。2010 年我们把这个应用落地到了交通银行。到今年,我们看到很多传统企业,包括做卫生间洁具、抽油烟机这样的传统企业,都在引入人工智能。所以整个市场确实在递次发生。
在这个过程中,我们也在不断推进解决方案的落地,这个部分也是我本人主要负责的。我在面对很多媒体还有投资人时,经常会被问到,小i机器人如何把人工智能技术落到商业环境。因为我们是为数不多的、持续规模化盈利的公司。
这张图可以很清晰地表达我的观点。实际上技术是我们非常重要的核心,但是在这个过程中,如何商业化,说的直接一点就是客户愿意为你的服务买单,而且不仅是一个客户,而是多个行业多个领域的企业用户以及政府单位,这是最重要的一点。
我们有标准化的产品,依托这个产品形成我们完整的解决方案。再透过我们专业化的服务体系、专业团队还有独创的方法论,我们才可以真正把高大上的 AI 技术落地在商业场景里。
在商业化过程中,最重要一点就是货币化。我可以很负责的告诉大家,直到今日在 AI 这个领域里面,运用最成熟,最先落地的就是智能客服。小i机器人在这个领域做了很多工作,包括引领这个行业往前发展。现在已经有 40 多个行业的近千家企业客户在使用我们专业化的产品和解决方案。
而支撑这个平台的就是我们强大的 iBot 会话平台。通过自然语言处理能力、多模型的知识库、以及我们自己的专家系统、知识模型、领域知识,结合我们大数据分析能力和开发框架,我们可以提供一个智能化的会话平台。
会话式人工智能五大 Bot
按不同的商业化应用,我们把会话式的人工智能分成五大 bot,:第一类是 Chatting Bot,也就是聊天机器人,主要解决“今天北京天气怎样?”“明天北京有雾霾吗?”“诺金酒店附近有吃烤鸭的吗?”等等这样一些问题。第二类是 FAQ Bot,我们有幸给小米和京东提供了第一代的客服机器人,FAQ Bot 是很初始的客服专员,解答常见的、简单明确的问题,带一点点推理和上下文的场景。现在我们着重做的是 Deep Bot、Recommendation Bot、Discovery Bot。
1、Chatting Bot:小i的应用层面主要是在深度学习与语义匹配相结合的模式下,不断研究记忆机制+知识背景以及对抗模型情况下如何往下走。记忆机制+知识背景是什么意思?当用户问 Chatting Bot 问题时,它会记录用户的偏好、习惯等,下一次就可以依托这些信息进行个性化处理。对抗模型是做两个不同模型的机器人,生成更强大的聊天对话库。聊天机器人是最早的人机交互的雏形,我们做了十几年,发现聊天机器人 B 端企业场景没有太大的商业价值,更多是在 C 端的应用场景里,做陪聊、陪伴、教育等。
·
2、FAQ Bot:主要有四个发展阶段,目前我们所处的技术阶段是深度学习+自动化模型+语义表达式相结合的方式。为什么这么讲?我们在实践过程中发现完全依赖深度学习模型解决商业化场景下的客户问题时,很多时候答案是不可控的。有类似的应用在做此方面的尝试,结果是很难在商业化环境里使用,后来发现还是要用自然语言模型、语义匹配+深度学习模型相结合,才能够很好地解决这个问题。
3、Deep Bot:有自动上下文、多轮对话、深度推理等 8 大应用场景。
其中自动上下文就是在聊天对话过程中需要语义场景时,我们会根据前面的交互过程进行记忆推导,主动获取参数信息,补全上下文提问的内容,自动生成场景式的对话。这很像人与人之间的沟通,经常省略各种各样的关键要素,在一个语境里跟机器人聊天也是一样的。
流程化问题的引导叫“多轮对话”,在我们处理的用户场景里经常能够碰到,比如银行信用卡的激活流程,制造业的售后处理流程,预定机票的流程……都是这种场景,所以我们用多轮对话的能力去很好地捕捉和适应这个方式。
深度推理则是不需要定义每一条知识,但可以通过知识库找寻相关的答案,进行答案之间的推理,很好的把这个场景回答出来,比如买 iPhone 产品的实际交互过程。
多意图理解也是非常难的,我们在 2017 年中突破了这个难点。很多企业在使用 FAQ Bot 以后,都有一个很强的诉求,就是很多客户的问题是多意图的,一句话经常会问好几个问题。针对这个商业化的目标我们做了突破,比如“你们有没有信用卡,我想办一张,最近有没有活动?”其实是三个问题,我们需要在三个不同语义理解里找到不同的答案,通过答案渲染模板,拼凑出一个标准答案给用户。
动态场景交互主要是补全相关缺失的信息,比如“我要查帐单”,模拟人的行为反问“你要查几月份的?”“我要查9月份的”“你要查人民币还是美元?”“我要查美元的”,这种场景在企业服务里应用非常广泛。
动态知识载入也是一个常见的应用,企业里的很多知识不是相对固定或者有二维结构的。它的实现过程用到很多技术,包括对话聊天库的模型、自然语言处理的技术、多轮对话记忆模型、会话保持模型等等,是一个综合的解决方案。
还有一种方式在企业的应用场景里非常多,这类问题的答案是一种数据,存在于多种多样的数据库或者多个业务系统之间。原先人工处理这样的问题比较复杂,现在我们做了一个 NLQ 的自动化查询系统,通过关键的语义要素,自动化生成语句,然后根据对话模板来渲染答案,把答案展示出来,比如快递物流行业里的简单交互就是这样的过程。
4、Recommendation Bot:有的企业客服中心已经从成本中心往流量中心、利润中心转了,因此小i不仅仅要做服务,还要做营销。这个推荐机器人就是为营销场景设计的。它可以结合用户的画像,包括人机交互记录、购买记录、交易行为、用户属性,甚至跟知识维度之间的关联,做个性化的服务、营销、推荐,更重要的是达到千人千面的交互,这是我们正在探索的。比如几个常见场景:一是用户相关的推荐;二是业务逻辑的推荐,不同的用户给的推荐策略不一样;三是知识相关的推荐。
5、Discovery Bot:主要是做下一代研究探索,要解决的是非结构化数据的问题。因为很多企业的知识是非结构化的,如何在传统文档里找到相应的知识和答案回复给消费者,这是我们需要探索的问题。用户提一个问题,我先用 FAQ Bot 和 Deep Bot 进行过滤,执行度比较高时直接返回,如果没有答案时就会交给 Discovery Bot,在多种数据源中查找,置信度比较高的时候返回,比较低的给人工审核,下一次就可以自动回复了。
新一代智能 Bot 开放平台
借此机会预发布一个新的智能 Bot 开放平台发布。它整合了 Chatting Bot、FAQ Bot、Deep Bot、Recommendation Bot、Discovery Bot 的能力,为广大中小企业和开发者提供了一个免费平台,大家在这个平台上相互赋能、相互合作。未来,小i会继续推动技术的产业化落地,这是我们最大的愿景。欢迎上下游产业链相关企业、朋友一起合作。
孙欣专访
从聊天机器人到智能客服
AI科技大本营:为什么小i会在 2004 年做 MSN 聊天机器人?
孙欣:可能跟创始人的梦想有一点关系。小i机器人的创始人是从微软出来,在 2001 年创立了这家公司,当时很多人都用 MSN 交流,但晚上朋友们都下线后就会很孤独,于是突发其想,如果 MSN 上有一个机器人陪我聊天就更好了,而且当年比尔·盖茨说互联网的下一代是人工智能,于是就突发其想,做了这件事情。
当时这个聊天机器人主要提供生活娱乐方面的服务,比如查询音乐、地图、天气,做心理测试等。最开始主要在朋友之间的小范围内分享使用,我们创始人并没有想做公开化传播,后来因为口口相传,用户数量增多,我们才开始在后端投入服务器来支持并发能力。这是当时的历史情景。
AI科技大本营:目前小i在智能客服市场里占多大份额,你们有计算过吗?
孙欣:保守来讲,80% 以上是没有问题的。再精确一点,估计能够占到 90% 以上的市场。
AI科技大本营:小i做了这么多年的智能客服,目前国内智能客服使用情况是什么样的?
孙欣:一个企业无外乎有几个核心要素,可能有些企业不需要生产,但很难不需要营销和管理。在营销方面,我们有一整套可以落地的解决方案。未来智能化管理也有很多落地的可能,如今已经有点状应用的出现,包括财务审计、智能化办公等等,都属于管理侧。未来在企业角度还有很多可以扩展的空间。
AI科技大本营:小i机器人目前有多少人?技术人员占比?
孙欣:小i目前将近 600 人,技术人员 250 人。技术部分主要分技术研发和产品研发两大部门,对公司技术委员会负责。
我们的技术人员分不同层次。有做底层算法的,他们主要隶属于小i研究院的部门。再上面是做底层平台的,像 iBot 开放平台,主要在产品研发中心做一些工程化的工作。再上层还有解决方案中心,我本人负责的就是解决方案中心,解决方案也有一定的工程化的工作,但它的工程化是跟企业的业务相结合,在底层平台技术上做行业工程化的能力。再往上还有二次开发人员,也就是在项目中做开发的人员,隶属项目实施服务中心。
我们有四个大的部门梯队来协同作战,每个梯队都有相关的技术人员,相当于海陆空联合作战,帮助客户搭建业务,实现项目落地。
AI科技大本营:人工智能的前提是大数据,小i机器人如何获取数据?
孙欣:小i有多个数据来源:
第一,小i从 MSN 时代开始就一直在积累大量的对话库和基础语料,我们有专门的标注团队做知识处理和沉淀工作。
第二,小i做了不同行业的解决方案,因此也拿到了相关行业的语料。我们也给很多企业提供运营服务,企业的脱敏数据、跟企业本身商业信息没太大关系的数据恰恰是我们感兴趣的,因为这样的数据是不可复制的。
第三,小i从2016年开始做开放平台,这个平台上也有数十万的开发者在做应用,因此沉淀了很多数据。
最后,我们也会从网络上爬取相关数据。
这些都是我们的数据来源。此外,我们还有一个知识研究院,主要负责知识沉淀和处理工作。
AI科技大本营:您觉得 AI 技术和市场哪个走在前面?
孙欣:刚开始 AI 技术是走在前面,再往后技术在商业成功里占的比重就降低了。商业模式将会越来越重要,需要跟业务系统、业务流程、业务属性结合,服务企业或者政府单位的专署诉求,这才是真正的落地。
不断拓展的市场边界
AI科技大本营:小i目前的主营业务是那几块?在营收中占比如何?
孙欣:小i已经为超过千家的大中型企业、政府机关提供服务,业务主要集中在通信、金融、政务、电商、医疗、制造等行业,最大客户群来自于银行。营收 95% 以上来自于软件及相关服务,硬件在 5% 左右。
AI科技大本营:小i是从什么时候开始拓展新兴业务的?
孙欣:我们并没有有意往哪个角度去拓展,很多时候需求的诞生既是偶然也是必然的,随着时间发展阶段会逐步出现。最早我们做了运营商业务,后来做银行业务,因为它的规模、用户量都是仅次于运营商的。第三阶段则是电商平台,之后就是政府、传统制造业直至各行各业,这些都是递次发生的市场需求。我们也是逐步拟合市场往前走。
AI科技大本营:除了现有业务,小i还会向哪些领域拓展?
孙欣:目前小i的业务范围以智能客服为基础,已延伸至智慧城市、智慧金融、智慧医疗、智能办公、智能机器人、智能硬件、智能制造八大领域。
小i的整体业务可以这样看,我们从“服务+营销”这个大的产业角度出发,做了完整的智能客服的落地应用,当然这个过程还有不断深化的路径。当我们发现往其他的行业或者产业里有很多新机会出现时,我们也会去扩展、去覆盖。
我们第二个进入的是“智慧金融”领域。因为我们已经做了几十家的银行、保险、证券企业客户,中国前 50 大银行中 40 多家都是我们的客户。通过积累,我们发现这些工作可以形成些标准化、体系化的经验,所以开始尝试覆盖“智慧金融”里的更多业务,并引入了服务、营销、投资、风控、市场、智能化展示等一整套的智能方案。
近几年国家不断的有各种各样的政策指引、顶层设计,来推动“政务先行”或者“政府先行、民用商用垫后”。政府本身的确有服务需求,只不过它的服务不是来自于客户服务,而是来自于公共服务。我们每个人都会去政府单位办理相关事务,比如人社局局、工商局、税务局、民政局等。跟企业相比,政府单位在编制、人员、信息化各方面的基础和知识沉淀基础没有这么强,压力更大。早些年我们觉得政府单位事情难办,一件事情要跑很多趟,这是技术性条件所限。社会化治理、智能化民生、智能化商业、智能化政务、智能化党务等都是政府的诉求,而且从打通城市链路的角度来讲,它可以形成更大的平台和产业。
AI 跟传统企业结合,会产生更大的生命力和能量,所以我们也在提前布局制造、医疗等传统产业。今年已经有一些非常传统的企业,比如像做卫生间洁具以及做抽油烟机的企业,也在考虑引入人工智能。
产业化发展阶段不一样,有的相对成熟,有的半成熟,有的不成熟。从金字塔尖的客户,像运营商、银行这样规模比较大的企业,往中小企业发展,市场需求是递次出现的。小i一直在进行产业化布局,今年我们提出“八大产业”的商业化目标,推动整体发展。
未来,我们也会拓展海外市场。小i已经推出了英文版、繁体版的服务,先落地在港、澳、台,明年会落地到东南亚。产业化的推进和国际化战略布局,这是我们目前正在思考的。
AI科技大本营:2016 年,贵阳市政府与小i机器人签署国家人工智能大数据云服务平台战略合作协议,这个项目的效果如何?
孙欣:这个平台的目的在于发挥贵阳大数据综合试验区数据基础优势和小i在人工智能关键技术(自然语言处理、深度语义理解、知识表示和推理、语音识别、机器学习和分析决策等)、行业应用积累和人才方面的优势,通过将平台的核心能力与贵阳政府治理、民生服务、产业大数据应用和传统产业智能升级等深度融合,促进贵阳经济产业转型升级。目前,平台建设已经完成,十几家政用、民用和商用试点应用已投入使用。
比如群工委的 12345 自流程系统。该系统针对市民、网格员、电话坐席员等人员的报案信息(支持语音)进行整合与智能校对,基于报案描述,通过智能分析,进行语义匹配,在完善的城市工单(11 大类、700 多个小类和近 1000 个子类)分派模型中,将问题自动流转到负责处理部门进行处理。据介绍,系统上线后,指挥中心的接单能力从原来人工接单近 2000件/天 达到 3000件/天,派单准确率则由 60% 上升到 90%。
还有为工商局打造的人工智能自助调解平台。在“智能调解机器人”的监督下,参与调解的双方可 7*24 小时 365 天随时随地预约登陆平台,通过文本、语音、图片、视频等方式进行调解沟通。
AI科技大本营:除去智能客服的主业务之外,智慧金融、智慧城市等新兴业务的增速如何?
孙欣:从增长速度角度来说,这些新兴业务在未来 3 会有高速增长。
我们一直有一个观点,除了金字塔尖的那些群体和行业之外,AI 能产生更大生命力的恰恰是在非常传统的产业,甚至像农林牧副渔的产业,比如前端是连接养殖户,后面连接兽医,跟前面是用户后面是客服人员是一样的道理。
我们今年在青海做无人律师事务所,类似一个单人的设备空间,人进去之后,像以前的银行取款机一样,只不过你面对的是一个律师的平台,可以跟机器人交互,咨询法律难题,甚至可以转接到真实的律师进行视频交互。它跟客服的形态类似,只不过运用到了不同领域,以及不同的展现形式。
AI科技大本营:目前图像、语音、语义等技术都是小i自己做,有没有考虑过把核心的留给自己做,其他的通过和其他公司合作来完成?
孙欣:当然,市场太大了,不可能所有环节都由一家公司完成。我们发布的新一代 Bot 开放平台也是基于这点去考虑的。但为什么小i还要自己做研究?因为我们要了解这件事情,如果完全由我们做A,合作伙伴去做B,中间的结合就会有很多问题,这些就必须我们自己先了解。但碰到时间、地空间维度上没办法在单位时间内覆盖的情况时,我们就要借助生态的力量,通过行业合作伙伴去落地。
目前在国内,包括大陆和港澳台,小i已经有合作伙伴。在发展海外市场的过程中,我们也会依托海外合作伙伴来落地,目前小i也已经签署了一些海外合作伙伴。
AI科技大本营:小i机器人想做一个平台,通过开发者和合作伙伴来壮大这个生态,是这样吗?
孙欣:对。关于小i未来的走向:首先,我们要拥有自己的核心能力,然后有相应的标杆应用以及成熟的商业化模式,这些必须我们自己先创造出来;然后,我们要依托上下游产业链,以后还会借助资本的力量,做产业化基金,甚至投资孵化初创团队,进行商业赋能,发展生态体系;今年,我们还跟一些高校合作成立了小i智慧学堂,未来将面向公众开放 AI 培训课程,让更多人了解和掌握相关技能,这也是生态化战略布局一部分。
AI科技大本营:小i马上要发布新一代的智能 Bot 平台,能介绍一下这个平台的特点和未来发展方向吗?
孙欣:这个 Bot 平台主要是为了配合生态发展开放出来的一个开放平台,这个平台主要有两大特点:
第一,它是免费的,主要是面向中小企业、开发者,提供免费的平台,为行业赋能,大家可以在上面合作和探索。
第二,我们在这个平台上提供各种各样的能力,包括智能化机器人、在线人工客服、人机协作系统等,可以打造一个相对完整的应用闭环。
初始阶段,我们可能会开放智能服务应用,未来还会把智能营销、智能管理、智能硬件相关的其他企业板块应用也陆续开放出来,所以是一个长期的发展战略。
实现盈利的核心竞争力
AI科技大本营:AI 是一个投入非常高的行业,很多公司都没有实现盈利。AI 商业化这么难,小i是什么时候开始盈利的?哪个环节特别关键?
孙欣:我们是被逼的。从 MSN 那个年代小i就引入了很多风险投资,包括英特尔、IDG 等。但经历了互联网泡沫之后,很多资金离开了,我们意识到聊天机器人必须要有商业模型,有货币化和商业化的可能。机缘巧合的情况下,我们进入了企业和政府市场。2008 年,小i把聊天机器人落地到 10086 ,2010 年落地到交通银行,大家看到原来用机器人做客服能够产生商业价值,所以进入到了 toB 端的应用。
作为 AI 企业,技术投入、人才投入、研发投入的成本是最高的,当年聊天机器人对很多人来说是比较陌生的一个应用,很多人都不是很理解,他会问这个机器人长什么样子?能动吗?能跑吗?当年客户都是这样的想象。后来我们一直在这个领域坚守,经过 18 年,一直走到现在,把它应用在将近千家客户里,以及多达 40 多个行业的商业化场景里。如果只是某个点的应用或者某个单位的应用,其实很难盈利的,盈利的重要前提是必须在行业内有可复制性。
另外,我们很多应用诉求都是客户带动的,他们有各种各样的需求,根据这些需求,我们会透过底层技术形成一系列专业的解决方案。通过多个领域的项目实施和商业化落地,小i形成了一套很强大的方法论以及实时服务团队,透过完整的工程化、标准化产品又带动了解决方案,很容易在企业里落地,所以我们可以很快实现从客户咨询到解决方案上线,在有限的时间内就可以实现盈利。
AI科技大本营:做智能客服、聊天机器人的国内公司特别多,它们也在强调技术,强调落地,为什么小i能够保持高速增长,而且可以实现盈利呢?相比竞争对手,小i的核心竞争力是什么?
孙欣:我觉得是多种因素组成的:
第一,我们做得比较早,经历了很多弯路、经验和教训,时间上占据了先机。很多企业还没有走过这样的弯路,没有趟过这样的坑,这个时间鸿沟是很难跨越的。
第二,我们已经跟很多企业的业务深度绑定,相比那些还在进行技术研究的初创企业,小i现在所处的阶段比较靠前一点。
第三,小i不仅做人机交互,还有自己的智能语音、智能视觉、数据智能,提供的是一整套全栈式的人工智能平台,我们跟企业、用户、政府单位做合作,不是某一个点的应用,而是整体化的应用。单纯做人机交互或者做聊天机器人的厂商,在那一个点上的应用还没有做得很好,而我们已经是平台化的推进了。
人工智能仅仅处于起步阶段,前景广阔,目前这个阶段还谈不上有什么直接的竞争对手。在技术上,小i独有多轮对话、多意图、动态载入等深度推理能力,在应用上,小i服务的大中型客户近千家,有着丰富的实战经验和强大的工程化能力。所以综合多种因素,小i目前很难被复制或者被追赶。
本文为 AI科技大本营原创文章,转载请联系微信 1092722531。
在文本分类领域中的模型和算法有很多,那如何为你的文本分类问题选择合适的模型呢?本节公开课通过对比来阐述不同的算法、模型在实际的应用过程中的区别,以及在文本分类实践中所遇到的各种坑。