AI融入大数据服务,「00 后」企业百分点正在让机器进行智能决策
机器之能,是机器之心旗下关注全球人工智能产业应用场景及商业化的内容账号。欢迎关注与互动:almosthuman2017
百分点推出行业 AI 决策系统 DeepMatrix,能实现智能、快速、精确的 AI 决策。
撰文 | 藤子
「未来人类所有的决策都会不可避免地依赖机器。」百分点董事长兼 CEO 苏萌说。
以汽车召回为例。中国是汽车拥有量最多的国家,国家质检总局缺陷产品管理中心会决定哪款汽车应该销毁。
然而,做汽车召回的决定并不容易。汽车召回对汽车厂家来说是致命性打击,需要慎之又慎。按照传统召回方法,每个季度,缺陷产品管理中心都需要通过会商制度召集专家,花费 2-3 天评比所有信息。比如,汽车的问题具体是什么,严重程度如何,故障率相比市场如何,是否有人恶意投诉等等。汽车拥有量大,信息太多,完全依靠人力,工作繁重且效率低下。
两年前,百分点开始为国家质检总局提供智能决策产品。按照传统方法,需要 15 人工作 200 小时,现在做出召回决策只需 1 人,花费 2 小时。苏萌介绍,两年以来,百分点智能决策产品处理了 1000 多起汽车召回案例,协助完成 5000 多万辆汽车召回。
百分点成立于 2009 年,是一家大数据技术与应用服务商,产品线涵盖大数据技术层的操作系统、管理层的用户画像标签管理系统和应用层的推荐引擎、分析引擎和营销引擎,创建了行业应用模型库和行业知识图谱库,客户涵盖金融、公共事务、智能制造等领域,如光大银行、新华社、华为等 2000 家企业。
以动态知识图谱技术为核心,百分点在 12 月 14 日发布行业 AI 决策系统 Deepmatrix,聚焦零售、制造、媒体、公安、政府决策等领域,为它们提供智能、快速、精确的AI决策。
知识图谱之上,智能决策还需要一系列工具
「要使 AI 能够进行决策,核心在于研究人如何做出决策。」百分点技术副总裁及首席架构师刘译璟说。在他看来,人做决策时,通常有三个步骤。首先是感知,比如感知环境,如宏大的宇宙,具象的美食,抑或是经济、人际关系、理论知识等。其次是认知,将感知综合成认识或知识。在这之上,再进行判断。
「基于数据,再加上 BI 和 AI 技术,希望我们的系统也能实现这样的功能。」刘译璟说。
具体来说,在认知环节,刘译璟认为,先要打造知识体系。而要打造知识体系,就要抛弃技术化的数据,比如数据库的表、字段、数据的类型、结构、编码等,因为业务人员很难理解,也不需要关心,他们只需要关心指标和维度即可。
但刘译璟认为,人的知识是模糊的,比如某一个人好像喜欢某样东西,好像这一词就表明了模糊性。因此需要将模糊的概念加上概率值,反映到知识体系中,使整个知识体系与现实世界更加接近。由此,细致地描绘现实中的业务知识,使业务人员能够直接查看业务中的关键要素,在这些业务知识上讨论自己的业务问题。
光有知识还不够,刘译璟认为还需要动态的知识图谱。「我们希望在一个数据化的知识图谱里把现实中的行动、相互的关系都能够表现出来。」刘译璟举例,比如线上的交易行为、移动支付的行为、社交关系等,如何表现出来?这就需要动态知识图谱技术。
「知识图谱是数据体系,动态知识图谱是我们自己的技术。无论是现实世界的数据,比如人的行为,还是机器产生的数据,我们都会统一通过数据融合,使它们成为同一种数据结构,同一种语义的数据。再输入动态知识图谱,通过整体映射,将现实世界转化成数据化的知识。」刘译璟介绍具体的做法。
此外,百分点在所有知识里都加入时间、空间维度,借此从多个角度、维度观察现实世界,由于内置了时间和空间知识,因此也能进行时间序列分析和地理位置分析,挖掘事物相互的关系,以及潜在的业务含义,进行推断,并作出预测。刘译璟介绍,这些基于动态知识图谱的技术同样会应用于 DeepMatrix。
应用动态知识图谱有着明显的好处。想要形成新的知识,并不需要从最底层开始,进行数据处理和融合,只需修改本体映射即可。「每一个关系、标签、属性,都有一个概率值,所以我们能做动态推论,哪怕有一些关系或者属性在最初阶段没有设计到这个系统,通过动态推断,也能了解到这些实体之间应该有什么样的关系,具备什么样的属性。」刘译璟说,「由于内置了时间和空间,也可以动态地看待每个实体、每个概念。」
如果只有知识并不足以支撑整个智能决策。在知识图谱之上,还需要系列决策工具,比如通过搜索,直接搜索现实世界,对现实世界中的关系网络、实体快速进行统计分析。
DeepMatrix 作为一个行业决策系统,如何将技术应用于行业,刘译璟表示,他们会将行业领域业务专家的知识输入业务模型,再整体输入DeepMatrix。刘译璟认为,这些都是 DeepMatrix 拥有智能决策能力的基础。
安全分析、政府决策、全媒体服务、智能营销、智能制造,DeepMatrix 具有五大应用场景
沿袭百分点以往将产品做成整体解决方案的思路,DeepMatrix 同样是一个整体解决方案,在架构上分为三层,最底层是大数据操作系统,负责所有数据的接入、处理等。中间是百分点自主研发的智能认知引擎,应用了智能交互、自然语言处理、智能标签、动态知识图谱等技术。最上层是各个子系统,比如安全分析、政府决策、全媒体服务、智能营销、智能制造。
百分点智能安全分析系统 Deep Finder,将客户的所有数据接入大数据平台,通过动态知识图谱的技术构建出知识,在知识之上构建客户能使用的前端系统,比如搜索、分析、风险识别等。此外,还构建内容、模型管理等后台管理系统,用于公共安全领域,比如反恐、安防等。
举个例子,如果搜索「今天十二点在安贞桥通过的白色别克车」,系统会通过自然语言理解翻译成直接的语句,分析这个时间、这个地点交通卡口的车牌号以及车牌号对应的属性。搜索结果的呈现方式也与普通 2C 搜索引擎不同,如果搜索一辆车,呈现方式就是一辆车,如果搜索一个人,呈现方式也是一个人。
然而,现实世界错综复杂,任何物体在现实世界中都相互联系,为了应对这种情况,Deep Finder 会把个体置于整个关系网络分析,相比简单分析亲属关系,Deep Finder 更关注「两个人通电话」或者「发生了资金转账」,通过这种隐秘的数据将两人进行联系。同时,也会将个体和关系置于历史和空间中进行分析,清晰地知道何时、何地,何人做了何事,他与何人有何种关系,那人又会做何事。通过交互式的分析,以此还原现实世界,让分析人员快速了解现实世界。
百分点集团研发总监黄伟认为,通过搜索入口和分析工具,虽然能够进行事后分析,快速抓取线索。但是,与其事后抓到线索,不如去预防。这就需要所有的数据,机器智能就派上了用场。
黄伟介绍,使用规则引擎,他们将客户、分析人员的宝贵经验输入系统,让系统处理重复性工作,提高效率。再通过推理引擎实现基于知识图谱之上的推理。比如,查找「爷爷」,系统就会了解查找的是「爸爸的爸爸」。此外,还能基于现实世界,进行物理性的推理,比如某个物体在某个时间点只能出现在一个地方,不然这个人就不是同一个人。
「我们还能通过机器学习引擎,使用业务累计的标注数据,搭建预测模型,让机器根据这些数据,分辨出什么样的人具有什么样的高危概率,从而进行预防。」黄伟说。
百分点智能政府决策系统 Deep Governor 的架构同样有三个层次。底层是统一的数据管理平台,中间层是使用大数据和动态知识图谱、自然语言处理、商业建模等人工智能技术构建的支撑服务层。最上层是系统应用层,涵盖包括模型管理、指标管理、报表管理的基础应用,在基础应用上则是涵盖人口规划、国家宏观发展规划、区域发展规划等决策应用。
而支撑这些应用的是大量行业专家的决策知识和 6 大类 50 余种社会经济发展的综合决策模型,前者涵盖人口学、经济学、社会学等多个学科,后者包括系统动力学模型、微观仿真模型、资源供需分析模型、GIS 多重置叠模型等。
最终,这些宏观的数据以及关系到决策的重要因素,用可视化、实时交互的方式展现在技术图层上,进行政府决策模拟并比对调整后的效果。
百分点智能全媒体服务系统 Deep Editor 包括内容生产、内容传播和用户经营三个部分。最底层是全媒体的资产服务管理,支撑全媒体全流程的媒体资源的自动化管理和使用。中间层则是基于当前阶段不同时段媒体的影响力,让机器去决策、规划出适合当前的传播策略。然后是全生命周期的用户画像和经营系统,基于多渠道的信息聚合形成全面的用户画像。
百分点智能营销系统 Deep Creator 同样具有三大特征。
如今,消费者的行为非常碎片化,它既可能出现在线下门店,也可能出现在电商平台、微信端的语音电话,如何打通多渠道的多元异构的数据,形成实时的、动态的消费者标签,深刻理解消费者的行为和偏好,Deep Creator 则能通过深度自学习对消费者进行准确认知。
「我们基于 GPU 的高性能的算法,自动提取消费者的超高维的行为特征,同时将业务的规则和经验作为 AI 学习的边界,减少 AI 学习的负担,提升 AI 学习的效率。所以,建立动态的消费者知识图谱是一件 BEYOND AI 的事情。」百分点首席数据科学家杜晓梦说。
杜晓梦介绍,未来营销人主要的工作在于构建各种不同的营销场景,例如获客场景、客户活跃的场景、客户流失的场景、转化的场景和传播的场景,Deep Creator 则用 BI 构建场景,AI 自主学习进行决策判断。
同时,基于捕捉的消费者实时行为,系统会进行场景化判断,决定在什么样的场景下,用人工智能进行主动互动,什么样的场景通过短信,什么样的场景通过邮件触发,什么样的场景需要人来实时和消费者进行互动。此外,系统还会把所有的营销流量进行随机分流,从而测试不同的营销互动的策略的有效性。「这些都是 Deep Creator 自主决策的结果。」杜晓梦说。
智能制造大数据系统 Deep Sensor 则是针对制造行业,对各种设备进行全生命周期实时管理,利用数据分析实现实时设备健康预警等智能化远程运维。