搜狗分身技术再进化,让AI合成主播“动”起来
去年 11 月的互联网大会期间,搜狗与新华社联合发布全球首个AI合成主播一经亮相,引起了人们对“AI+媒体”的广泛讨论。如今,搜狗 AI 合成主播不断更新迭代。
2 月 19 日,在新华社新媒体中心与搜狗公司战略合作签约仪式上,搜狗公司与新华社新媒体中心联合发布了站立式 AI 合成主播,这次新的 AI 合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,标志着“搜狗分身”技术再次取得突破。
据了解,初代 AI 合成主播由“搜狗分身”技术打造,这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,创造出人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。
那此次发布的站立式 AI 合成主播又开拓了哪些“技能”?据搜狗方面介绍,新版的 AI 合成主播采用了“搜狗分身”的 WaveRNN 波形建模技术,可以实现逼真的语音合成效果,让 AI 的声音更具有真实情感和表现力。而在图像生成方面,新版的 AI 合成主播实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力,而且还让 AI 合成主播“动”了起来,这提升了合成主播的表现力。
什么是“搜狗分身”技术?它诞生于搜狗“自然交互+知识计算”的人工智能理念之下,能够利用搜狗的 AI 能力,从图像表情,声音语言习惯,逻辑思维等层面对 AI 进行拟人化训练,然后克隆制造人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。
搜狗方面表示,随着“搜狗分身”技术能力的不断提高,AI 合成主播的定制周期也大为降低,合成效果和稳定性也有着显著提升。值得一提的是,此次发布会同时发布了首个 AI 合成女主播,这是“搜狗分身”技术持续复制不同类型、不同特点 AI 合成主播能力的一个体现。目前,仅靠少量用户真实音视频数据,搜狗即可快速定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。
搜狗 CEO 王小川介绍,作为 AI 合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同职业赋能,提升整个社会的信息生产力。
据悉,目前首批入职新华社的一中一英两位 AI 合成主播,已生产 3400 余条新闻报道,累计时长达 10000 多分钟,参与了包括第五届世界互联网大会、首届进博会、2019 春运、春节等报道,成为中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。
而最新推出的站立式 AI 合成主播将参与 2019 年全国两会的报道,并将在搜狗搜索、输入法等资讯平台上与用户见面。
(本文为 AI科技大本营整理文章,转载请微信联系 1092722531;添加小助手微信csdnai2,备注研究方向,入群交流)