击败马云专用速记员的阿里云ET,如何在司法领域拿下第一?

文/孙茜茜

2016年3月23日,一场人机大战在阿里云的年会上上演了。

在阿里云总裁胡晓明演讲环节,来自阿里iDST团队的“实时语音识别系统”对战常伴马云身旁的金牌速记师姜毅,分别给出演讲的文本内容,同时投屏,现场PK正确率。

姜毅在阿里云的同学们眼中是这样一种存在:“神一般的速录师,拥有超人的短时记忆功能,超级的打字速度和惊人的正确率”。

姜毅曾在世界速记比赛中获得亚军,他能够在演讲者每分钟300字的语速下, 边听边打字, “话音落、字体现”。

阿里云的同学算了一笔账,每秒钟除标点符号、回车、删除、注释外,他能敲5个字。“按照平均一个字敲4次键盘来说, 也就是每秒钟20次的敲击速度!同时还能在各种干扰下保证九十几以上的正确率!”

双方PK了7分50秒,“实时语音识别系统”最终以0.67%险胜。

iDST语音技术总监鄢志杰说,速记员更加信达雅,但人类很难持续保持更长时间的高强度脑力劳动。机器虽然犯一些语义理解上的错误,但是可以一字不落地记录下讲话内容。并且,在电路通畅的情况下,机器可以工作24小时。

击败马云专用速记员的阿里云ET,如何在司法领域拿下第一?

iDST语音技术总监鄢志杰

ET入住法院,当起了书记员和法官的“小助手”

对法庭中的书记员来说,他们是否有速记跟不上法庭节奏的痛点?“实时语音识别系统”是否能够提供帮助?不久后,这项技术被引入了浙江高院。

据《人民法院报》报道,2016年5月,浙江高院率先开发启用智能语音识别系统,使用人只要点击事先安装在电脑桌面上的软件即实现“一键开启”。软件预先设置角色,语音文字转换时自动注明发言人角色,自动区分庭审发言对象及发言内容。

2016年6月7日上午,西湖区人民法院作为浙江高院智能语音识别系统试点,完成了首例庭审语音同步转化为文字并生成庭审笔录的案件,准确率达96.2%。

击败马云专用速记员的阿里云ET,如何在司法领域拿下第一?

西湖区人民法院庭审现场

早在2015年11月,浙江省高院与阿里就签署了战略合作框架协议,双方共同开展云计算和大数据相关领域的技术与应用研究,实现新一代信息技术与浙江审判执行工作各领域的深度融合。2016年9月13日,浙江省高院宣布,将在全省105家法院全面上线智能语音识别系统。

据悉,目前阿里云人工智能ET已经为全国近300家法院、超过6000个法庭提供庭审语音转写服务。

2017年12月6日,福建省高级人民法院正式引入ET。以智能语音为切入点,将语音识别与大数据分析结合,挖掘司法大数据的价值,推进审判体系和审判能力现代化。

击败马云专用速记员的阿里云ET,如何在司法领域拿下第一?

福建省高级人民法院与阿里巴巴集团战略合作签约仪式

据悉,除了对庭审过程进行“原汁原味”的记录外,ET将担任法官“小助手”。结合语音文本、判决文书、历史案例库等相关文本数据,通过大数据挖掘、文本挖掘、机器学习建模技术等,提供相似案例的分析与检索、案情建模、案由提取、争议点挖掘、智能预判等,协助法官判案,最大限度消除或减少“同案不同判”的现象发生。

数千家智慧法庭是一夕之间冒出来的吗?

数千家智慧法庭是一夕之间冒出来的吗?鄢志杰说,不是的,这离不开技术的成熟度和积累。

单就语音技术而言,阿里从2014年起就非常严肃地在做投入了,不管是人才、数据还是计算上的投入。“技术、算法,最核心的是离不开操作的人,要不断去优化、再定义它。”

鄢志杰表示,阿里云不是把市场上别人的解决方案集成到阿里云的系统中,而是从麦克风的源头开始做技术。因为“只有这样,才能做到跟语音识别系统打通、实现联合优化;只有这样,才能确保识别的精准度。”

“我们不需要从麦克风采购做起,我们做所有的采购系统的集成。”

用户在使用产品的过程中,技术问题会一个个冒出来。比如,原告面前的麦克风能收到被告从喇叭扩出来的声音。“我们就是专注于解决这样的问题。” 鄢志杰说,大家在整个链条中各司其职,“这样,我们也更专注”。

“语音识别真正要遍地开花的时候,需要特别高效的定制能力。” 鄢志杰表示,比如怎么在保证数据安全的情况下,提高带有口音的普通话、方言的准确识别率?

除了语音识别系统,阿里云附带提供定制平台。在定制平台上,通过对方言语料的模型进行学习和运算,ET能够将方言的识别准确率从40%-50%优化到80%-90%。这样,基层法院也可以享受到ET带来的便利。

在鄢志杰看来,今天很多人谈论自然语言理解,很多时候是为搜索引擎时代的打字去做理解,而自然语言理解,尤其是口语理解的技术,非常重要。

“我们现在跟语音在一起,一定是包含了语音里的口语化现象。比如,语气词、停顿、犹豫等。在这种情况下,是不是还能做到很好的理解?”

鄢志杰表示,自己的团队基于阿里云的基础设施,搭建起了整套的、云端的、超大规模的、语音的声学模型和语言模型的训练系统。数十万小时的数据可以在非常快的时间内完成模型的训练工作。并且,“基本上半年迭代一次主要的声学模型。”

“这些东西看起来是基础设施,但一旦到定制的时候,所展现出的效率、领先的训练速度、定制化的能力是不容小视的。” 鄢志杰说,“算法+数据+计算的循环,就能够打造任意一个垂直领域、极高的语音识别准确率的一个标杆。”

阿里云的云计算能力及其在技术上下的硬功夫,如算法优化,是智慧法庭一夜之间冒出来的基础的支撑点;合作伙伴,如华宇,经过十几二十年的业务积累,则拥有大量经过清洗的数据。

牵手华宇,阿里云将探索自然语言理解的技术边界

北京华宇软件股份有限公司(简称“华宇”)是阿里云在司法领域落地的一位很重要的合作伙伴。

因为有了技术,还需要行业的合作伙伴将其包装成终端的产品,再落实到细分行业中去。

华宇和阿里云在12月19日的云栖大会·北京峰会上签订了合作框架协议,正式建立合作伙伴关系。据悉,双方将共同为客户提供基于阿里云计算平台的智慧法院、智慧检务、智慧司法等政法、司法领域的应用服务。

击败马云专用速记员的阿里云ET,如何在司法领域拿下第一?

阿里云与华宇签署合作框架协议

华宇创立于2001年,业务范围涵盖法院、检察院、司法行政、各级党委和政府部门以及各行业大型企事业单位。根据IDC中国电子政务研究报告,华宇自2006年至今连续11年位列中国电子政务IT解决方案供应商10强。在法院、检察院信息化建设领域,华宇连续多年市场占有率第一,客户遍及全国。

此前,阿里云和华宇在法院庭审智能语音识别领域开展了深入合作。

2016年,华宇旗下的北京华宇元典信息服务有限公司(简称“华宇元典”)成立,专注于为法律服务领域的从业者及相关机构等提供领先的法律数据服务及产品。

在华宇元典总经理邹绍坤看来,华宇元典有在法律行业的商业渠道和客户优势,有法律行业的专家和了解技术在法律领域落地的技术研发团队,阿里云拥有领先的人工智能技术、云计算能力。双方合作,可以组成一个三角式矩阵,为法律行业的客户提供服务。

与阿里云深度合作,华宇将不仅是技术集成,而是会对现有技术进行充分挖掘,将基于具体的法律场景提出更多技术上的要求。

邹绍坤认为,证据电子化是很多厂商都能做到的事情,对于法官而言,需要的是“证据逻辑的梳理、整理”。这不仅需要图像识别,更需要图像识别技术对被文字压着的印章、手写签名等证据进行局部优化,在此基础上做证据有效性的分析。

邹绍坤表示,法律行业本身是一个靠语言交流比较多的行业,所以目前,语音识别技术应用的更多。

鄢志杰表示,“今天,语音识别在感知层面可以做到精度非常高;但是认知方面难度很高,如何在司法领域发挥更大的价值?自然语言理解的技术边界在什么地方?这是我们下一步要去探索的。”

未来,双方也可能在图像识别、人脸识别、自然语言处理方面展开合作。

相关推荐