金山 AI Lab 首次公布落地计划,它选择了 AI 最难啃的一块“骨头”
“2014 年的时候我曾经说过,成立 30 年的金山 WPS 是被雷军一脚’踢’到移动互联网上的;现在来看,人工智能将成为金山后 30 年一块最重要的敲门砖。”
12 月末,金山办公 CEO 葛珂在北京的一场媒体发布会中表示。在该活动中,成立满一年的金山 AI Lab 首次公布了其落地计划。
金山办公 CEO 葛珂
自 2018 年 7 月金山办公推出 WPS AI 助手,通过可模拟人的智能语音助手协助用户进行智能协作起,金山办公的 AI 战略开始逐步实施,未来计划实现“AI 知识图谱技术”在金山 WPS Office 等产品的落地。
其具体的功能点包括:
“成语知识卡片”将从文档中识别成语实体,提供成语的读音、释义和出处;
“成语读音填充”将为含有生僻字的成语注音;
“成语知识问答”将针对用户对成语的提问,进行推荐常用成语;
“成语写作”可在用户比较各个成语时,展开成语对应的知识卡片。
人工智能正成为金山集团当下的核心战略。上个月,金山软件集团召开了成立 30 周年庆典,金山董事长雷军也在公开演讲与全员邮件中多次谈到人工智能的战略地位。
“未来 30 年,金山将全力投入国际化和 AI。” 雷军强调。
整个 2018 年,AI 成了互联网巨头业务板块中的“香饽饽”,这从阿里、腾讯、百度等大公司在去年的组织架构调整中可见一斑。对于他们来说,人工智能的落地既需要与现有的数据、业务积累实现联动,也需要与未来的战略发展相互映衬(诸如百度自动驾驶的 Apollo、阿里天猫精灵的语音交互)。
而在以 WPS 等办公软件发家的金山软件,其多年积累的语义处理、机器翻译等场景则成为 AI 落地的首选方向。目前,金山 WPS 全线产品月活跃用户数超 3 亿,产品已覆盖全球超过 220 个国家和地区。每天用户使用 WPS Office 来编辑的文件数量达到 5 亿左右。
2017 年 5 月,金山集团成立 AI Lab ,由金山办公副总裁姚冬直接分管,目前团队涵盖图像、文本、语音三大方向,计划将机器翻译与图文转换、知识图谱、智能协作等技术深度融合。
金山办公副总裁姚冬
相比商汤、旷视、云从等 AI 公司在视觉识别领域扎堆进场,金山选择了主攻人工智能中的 NLP(自然语言处理)方向,这样的选择有些特例独行。
一般来说,人工智能可以被简单分为自然语言处理、计算机视觉、人机交互三类模块,而在其中,自然语言处理的起源时间最早,后期落地难度也最大。
1956 年,“人工智能”概念在达特茅斯会议提出后,科学家们开始寄希望于用计算机模拟大脑理解语言学的过程,1962 年,一个名为“机器翻译与计算语言学学会”(后更名为国际计算机语言学委员会,简称“ACL”)的机构在美国成立,学界开始对包含机器翻译、语义理解等技术在内的人工智能模块进行深入研究。
“机器翻译遇到了很多难以克服的语义障碍,甚至一度进入低迷状态。”中科院研究院博士生导师宗成庆对钛媒体介绍道,2013 年,宗成庆成为国内至今唯一一位加入 ACL 的华人科学家,在他看来,在语音语义理解的机器翻译操作中,需要面临诸如“口音、标点识别不准导致语句翻译出错”、“政治经济等专业术语机器无法胜任”等诸多挑战。
不过,金山仍愿意在 NLP 领域进行尝试。在金山办公副总裁姚冬看来,这与集团在该赛道上的积累息息相关。
1997 年毕业即加入金山的姚冬,曾参与金山早期的两款产品——金山词霸与金山快译的开发工作。他认为,起初受限于当时 CPU 计算能力、存储、数据量三个问题,机器翻译只是基于规则的模型。而随着算力的升级与算法的迭代,姚冬一方面目睹了机器翻译逐步大规模地应用,另一方面,他也见证了金山集团旗下云、WPS、稻壳网等产品的延伸,这也为金山的 AI 落地提供了更为丰富的场景。
在阐释金山的人工智能战略时,“务实”是姚冬多次谈到的形容词。他告诉钛媒体:“金山做技术的风格是一定要落地,一定要把 AI 变成一个产品或服务直接面向用户。这是金山 30 年来的一贯风格。”
以金山此次宣布的 AI 落地计划中的功能点为例:当用户写作时突然忘记应该使用什么成语,只需通过对 WPS 文档中内置的智能助手提问,比如“形容勤奋的成语是什么?”,即可获得一系列描述勤奋的常用成语,同时每个成员还包含一份相对应的知识卡片,以帮助用户做出选择,并在用户选定合适的成语时实现自动插入。
金山 WPS 推出的“成语智能问答”功能可以帮助用户联想合适的成语。
“公文辅助写作”,是金山选择用 AI 进行革新的另一大主场景。这项在今年年中推出的功能包括关键词句自动校对,比如对“全面建成小康社会”这类的常用语句进行定向识别;以及对《全国人大学习方案》这类长文件进行智能要点汇总与目录检索。
根据金山办公 CEO 葛珂介绍,目前全国政务系统中,金山 WPS 的覆盖率已经超过了 50%,这就让金山在 TO G 的垂直类别里获取到足够多的训练场景;另一方面,由于政务领域对文本要求比较高,相关的格式、字体、字号都有所限定,再加上政府信息公开化的趋势,有助于为金山形成高质量的语料。