平安科技人工智能实践:人脸识别用于17个子公司,拥有18项新技术
在人工智能领域,平安科技的人脸识别已在包括平安证券及平安银行在内的 17 个子公司使用。如今,平安科技拥有超过 18 项前沿新技术,包括声纹识别、图片定损、微表情、图像和语音识别及语义理解。
撰文 | 藤子
「人工智能要落地应用,在于业务影响力,因此在业务流程上,与人工智能既要深度结合,又要定制化。」平安科技人工智能高级产品总监、平安深度学习平台负责人王健宗博士在 9 月 7 日由中国工程院信息与电子工程学部主办、浪潮集团承办的 AICC 中国人工智能大会上表示。
平安科技最初是中国平安集团的信息管理部,2008 年独立为子公司,服务于集团的 IT 系统。2016 年初,中国平安提出 3.0 时代战略,相对 1.0 时代只销售平安内部产品的自营模式,2.0 时代不只销售平安产品,还销售其他金融机构的产品和服务的平台模式,3.0 时代则是把公司现有技术、系统等核心能力向其他金融机构输出,共建生态圈。
在这样的战略指导下,平安科技也从服务于集团的 IT 公司成为人工智能领域的引领企业,聚焦于大数据、AI、金融科技、云以及区块链等新技术的研究和落地,负责开发并运营集团的关键平台和服务,支持集团的保险、银行、投资和互联网业务发展。
据王健宗介绍,平安科技从 2011 年下半年开始布局大数据。由于计算机硬件,高性能计算的发展,以及算法的革新,特别是深度学习算法的突破,平安科技经过四五年的数据积累,自然也就从数据智能走向了人工智能。
在人工智能领域,平安科技很早就将人脸识别技术应用于平安普惠的放贷流程中,如今,平安科技的人脸识别已在包括平安证券及平安银行在内的 17 个子公司使用。此外,平安科技还在研究多模态识别、虹膜识别、眼纹识别、静脉识别以及步态识别,使这些识别技术共同作用于各个应用场景。
而在技术研究和储备方面,平安科技已拥有超过 18 项前沿新技术,包括声纹识别、图片定损、微表情、图像和语音识别及语义理解。其中,平安声纹是平安科技深度学习团队自主研发的声纹识别引擎,专注于因声识人,能实现智能身份认证,目前已应用在平安银行信用卡电话核查身份,平安产线理赔反欺诈以及 App 登录等 20 多个场景中。
专注于人工智能在金融和医疗领域的应用
于 1988 年诞生在深圳蛇口的中国平安,是中国第一家股份制保险企业,历经 30 年,至今已发展成为保险、银行、投资三大主营业务为一体的多元化集团。而在中国平安内部,2016 年初制定的 1-2-2-N 战略表明,聚焦于大金融资产和大医疗健康。由此,平安科技的人工智能业务也主要围绕金融和医疗进行。
人工智能应用于实际的场景,数据非常重要,平安科技花费将近一年时间打通各机构和业务子公司,将数据整合到一个平台,进行数据的清洗、整合和分析。在此基础上,进行数据挖掘。王健宗介绍,在数据挖掘方面,平安科技并非一步到位,而是从基于业务规则和业务经验到基于商业智能(BI),再到机器学习、深度学习,并吸取 AlphaGo 的经验,分成数个步骤进行。
在业务规则和业务经验阶段,如果是信息数据不吻合,可以帮助业务部门及时应对。商务智能阶段则是寻找数据之间的关联性,对用户按照数据特征进行分类处理,这适用于特征明显的客户群体。但是,有相当一部分特征不明显但与业务目标紧密相关的长尾用户,这时,应用商业智能的方式就不再适合。他们需要个性化的方法来提供服务,王健宗介绍,平安科技搭建的深度学习集群,通过图像识别、语音分析、文本理解等人工智能技术对数据进行挖掘。
「从底层数据的获取、采集、整合,到用户画像、产品画像,再到渠道画像的上层实现,接着是商务智能结构化分析、非结构化分析、预测、异常的监控、深度学习能力,同时支撑的八大应用,这些应用服务于金融领域各个相关的方面。」王健宗表示。
而它们都集中在平安科技的脑智能引擎,脑智能引擎主要分为四层。作为感知层的第一层主要进行数据接入、采集和整合。作为索引层的第二层,主要刻画用户画像、产品画像和渠道画像,这层主要是模型的建立。第三层中枢层聚集了商务智能、预测推荐、异常监控、深度智能等算法能力。第四层作为执行层,是平安科技核心业务的解决方案和应用场景实现层,包括风险控制、欺诈识别、运营优化、精准营销、智能监控、商务智能、智能金融、智能客服。
以风险控制为例。在金融的风控方面,传统的贷款流程比较落后,平安科技依托平安的脑智能引擎,构建多样的数万维的因子,比如企业相关的经营数据、财务信息、税务信息、财报信息,再结合外部的相关行业指数、舆情分析、企业的关系网络,甚至董事长的投资情况等,最终形成企业的风险概况,同时再加上动态趋势,比如通过市场情况综合判断抵押品的价值,在这些基础上,做出估值模型,通过模型确定是否放款。
「从模型的数据获取,到信号的生成、筛选,最后自动更新,然后进行相关的反馈。」王健宗介绍,平安科技通过对所有子公司和相关合作伙伴的数据收集,并通过内部和外部的数据整合,形成了一个非常清晰明确的体系和不同的模型。
「以企业为个体,把企业的相关信息进行搜集,搜集以后进行模型的迭代,晚上搜集完数据,早上就可以有预警信号出来,比如反欺诈,我们通过一些规则的观念分析以及一些社交网络社会计算的能力,同时也能发现一些欺诈的案件,做好风控。」王健宗说。
在医疗领域,看病难,看病耗时长,看病的服务能力差,王健宗认为这些都可以通过 AI 医生来解决。平安科技正在进行的一个重要产品是智能读片,通过医疗影像自动的识别、理解、分类,能够快速的定位患者的疾病,最后给出诊断意见。
在人工智能读取影像领域,由于全国各级医院使用的大型设备有各种型号,比如 CT 设备就近百种,这就造成很多公司数据来源单一,产品不能在医院之间通用,而平安科技在 AI 训练的时候采用了各级医院的不同数据,使系统可以让大多数医院使用。目前,平安科技的肺结节检测系统在临床的准确度已经达到 90%,正在研究糖网、胃癌、宫颈癌等疾病。
平安科技还与政府合作,进行疾病监控的预测,涉及病种包括流感、肿瘤、慢病、高血压、糖尿病等。2017 年上半年,由平安科技研发推出的人工智能+大数据流感预测模型,能够预测流感趋势,精准预测个人和群体的疾病发病风险,帮助政府及时监控疫情,从而指导民众预防疾病,降低国家疾病与防控工作的成本。
如何解决金融和医疗领域的数据稀疏
平安科技深耕金融和医疗的同时,他们发现金融领域和医疗领域的数据量有一个很大的特点,尽管数据很丰富,但是相对社交数据,金融数据和医疗数据相对低频,因而数据维度比较稀疏。
如何把这些低频的数据转化为有用的信息,王健宗介绍,从技术上来看,需要在数据基础层进行数据压缩,因为数据多了之后,很多是无用数据,数据压缩之后,就能减少数据的存储量和传输量。另一方面,提升数据的提取能力,比如利用深度学习或者一些压缩感知算法,能够快速提取相关数据的关键特征,在减少数据尺寸(size)的情况下又不损失数据的含义,王健宗认为,比如模型压缩方面的研究,都是未来的趋势。
使用深度神经网络做模型,层数越多,计算资源越大。现在有一个研究方向是如何用很小的计算资源,比如 100M 的内存,在深度神经网络的模型同样达到 300 层、400 层。而目前,大部分深度学习是使用云服务的能力,另一个研究方向是使设备小型化,包括用手机去做运算,立即出现结果,是否本地化,能否快速的迭代计算,知识的快速获取,王健宗认为这都是以后的趋势。然而,这对算法本身的模型要求更高,模型计算量,在同等的情况下模型本身的尺寸小,花费的计算的资源也可以足够减少,同时也能极度压缩计算的时间。
「理论上像超算,把我们所有的最大的数据灌进去,计算几天几夜,最后出来东西肯定好。但是很多应用场景没有这个时间给你,有时候稍纵即逝的一些东西,所以我觉得这肯定是以后的趋势。」王健宗表示。
「传到后端服务器有很多不可控的因素,比如本身的网络带宽如何,手机流量是否够用,服务器运算后返回,都需要时间。」因此,平安科技将模型前置。据王健宗介绍,平安科技在这方面的研究比较深入,平安科技的很多 App,比如定车损的 App、好车主 App,用户拍张照片进行自动图象的定损,平安科技可以把模型移植到前端,有些运算则可以在手机上快速完成。