专访搜狗CEO王小川:让同传失业非本意 今年会有大动作

专访搜狗CEO王小川:让同传失业非本意 今年会有大动作

安科科技 李根

搜狗CEO王小川在乌镇演讲时“炫”了一把技术,在现场,他一边讲,实时文字转录一边在屏幕显示——但这还不算结束,考虑到现场有不少老外,这项实时转录技术还加入了“翻译”。

也就是说,在王小川用“川普”(四川普通话)发表对人工智能的看法时,老外们直接看实时字幕就能知道他在讲什么。实际上,现场的效果是,那些老外看到有“英文字幕”时,纷纷摘下了同声传译设备。

在其后安科科技向王小川描述这一幕时,这位搜狗CEO显得非常开心,不过他也不忘谦虚了一句:“也不枉我们背了服务器过来。”还笑称调试时去掉了机器对口头禅“是的”的翻译,“因为中间有翻译的时候说是的时候,它说 yes I am。”

王小川认为这种翻译不仅会显得“傻”,而且会导致更大的问题,“做翻译的时候对语音识别要求特别高,你放个火箭的事,把卫星打到预定轨道上丝毫不能错,语音错一点在翻译上就会叠加了,所以这对语音要求特别高。”

然而,对于王小川和他的技术团队来说,今年的“炫酷”表演显然不止于此。在采访现场,他开心之余还向安科科技展示了自己手机里的最新Demo:一个实时传译功能。

当安科科技说出“好的,这个新产品,是不是意味着以后出国采访再也不用带翻译啦”时,软件很快给出了翻译并“读”道:“OK, this new product, isn`t it meant to be able to go abroad and do not have to translate it again。”

这将是王小川和他的搜狗团队在今年将交出的又一个人工智能功能和产品。

这一年以来,王小川和搜狗高管被问到最多的问题是“怎么搜狗也转向做人工智能了?”

这位搜狗CEO每每都感到哭笑不得。一方面,他觉得外界对于人工智能的技术原理还没得到普及,进而忽略了搜狗从搜索和输入法到“人工智能”的自然而然;另一方面,他害怕强调技术立身的搜狗被外界误解,认为“也玩概念”了。

从清华校园出发,通过搜索、浏览器和输入法,拿下中国搜索市场第二份额和输入法市场第一份额,王小川认为搜狗的人工智能“到时候了”。

一方面,搜索的核心本质是通过人机交互获取信息,而人工智能会让这种交互更加自然且高效;另一方面,搜索资源、和输入法语料积累的大数据,也可以通过机器算法和模型,有了进一步发挥价值的时候。

2016年下半年以来,搜狗先在输入法中推出了“快速分享”和“智能推荐”,解决聊天场景中不同App切换的问题,比如双方约定餐厅吃饭,但需要来回在聊天应用和点评App间分享切换;或者分享一首最近发现的新歌,需要在聊天应用和音乐App间切换;再或者使用浏览器搜索资料时再分享时,都无法直接利用输入法解决问题。

其后,搜狗在输入方式上,开始把此前隐而不宣的“语音输入”加强权重,并开始在公开活动上,频频展示目前“实时转录”的速度和准确率。

王小川认为这也和大环境息息相关,他表示互联网和移动互联网对于“连接”已经实现得差不多了,接下来要靠数据驱动,而数据中间则会产生智能。搜狗将主要在社会连接、商业形态提升效率方面进一步下功夫。

这位搜狗CEO还表示,年内会正式宣布新战略,详细谈下后“三级火箭”时代里,搜狗将会成为一家什么样的公司。

当然,对于搜狗来说,今年的重大事件或许还不止于“战略”。

今年6月,搜狗内部晋升了三位副总裁,分别出任COO、CTO和CMO。对于这种组织架构的完善,当时官方给出的说法是“内部激励”。但在安科科技采访现场,王小川的回答显得意味深长。

这位一手在搜狐内部实现搜狗从无到有、从弱到强的CEO表示:“我觉得时间到了吧。”

值得一提的是,在说完“时间到了”之后,他略带诡异地笑了一下,“其他考虑不能告诉你,背后有很深的思考,但是不能说。”王小川补充道。

另附经安科科技编辑的采访实录节选:

安科科技:除了实时转录和翻译,这个还能怎么应用?

王小川:你和老外就可以聊天。

安科科技:有平台考虑吗?我输中文给对方直接翻英文?

王小川:平台都可以,因为我是输入法。我们最终会把翻译的过程干掉,在你这儿显示的全是中文,在对方那儿显示的全是英文,把中间翻译的过程去掉,你也能用语音直接输入。

安科科技:也会和搜索有关系?比如你之前谈到的“跨语言”问答。

王小川: 有关系,而且翻译过来了,你看到的全是中文的,但背后是绝对的信息。因为你要知道中文信息是不靠谱的,我们做医疗就知道,医疗现在不是广告问题,广告去掉一样很烂,中国网页上充斥不靠谱的内容,西方世界则靠谱很多,你原材料不好,怎么都加工不出东西了,所以我们是去检索全球内容。

还有输入法也是,现在你输入中文,但是你一发布就是英文出来了,发出去就是英文。我给你们看一个东西,这都是内部的东西,都没有发的。今天我们参加了乌镇世界互联网大会,点这个键,然后在这儿,这个翻译,这个网比较慢,它翻译这个东西了,内部你可以输入中文然后往英文转。

安科科技:现在人工智能大家都从语音这方面入手,为什么?

王小川:第一,用深度学习的方法解决语音是最合适的武器。深度学习用来解决语音图像问题很适合,解决文字特别难,文字里面唯一能够干的东西,唯一能够往实用走的东西就是翻译,翻译不是要读懂,只是需要把两段话变过去就可以了,省略中间过程。

第二,传统翻译是靠规则的,是靠概率计算,那个翻译的结果:一是翻译的磕磕巴巴,读起来非常难受,但意思不会错,这是传统翻译的好处。我们现在用的这套技术,读起来特别流畅,但有可能意思完全不对,完全可能遇到。因为它和AlphaGo第四局棋一样,到它不会的时候是发疯的,可以完全翻成相反的意思,这套翻译技术都有这个问题。

安科科技:所以做人工智能还是得有核心数据?

王小川:要么是核心数据要么是核心技术,但一般来讲我觉得比较靠谱的是升级你的商业,你原来商业上已经跑通了,机器只是把它的效率跑得无比高,比如放贷这件事,机器以后做小额贷款就比人贷款效率高。它其实是商业的升级,纯粹从技术出发做这个事很难的。

安科科技:认同移动互联网时代过去了的说法吗?怎么看趋势?

王小川:连接这件事情差不多了,剩下要靠数据驱动了,数据中间产生智能。往下两个方向:一个方向是虚拟体验,不仅是VR眼镜,但总能带你畅想一个新的世界。我们看小说、看视频、玩游戏都是虚拟体验,这是人性的一部分,人就喜欢玩自己没有经历过的事,这是方向一,手机游戏也在这个体验里面。

方向二是机器智能或者商业智能,大家在商业社会中由于本身的技术提升,机器开始参与做决策,使得整个社会连接、商业形态里产生更高的效率。我认为大体往这两个方向走。

具体搜狗来说的话,虚拟体验我其实不太会,不在我们这里。我们是商业智能。

安科科技:那目前人工智能有缺点吗?

王小川:人工智能,第一,要靠数据驱动。它本身不是具有推理,有通用学习能力,有人的历史数据用来做复制,现在技术就到这一步。

第二,必须靠学习,大量数据的学习,不是说一点数据或者推理就能得到结果的,什么事能被机器取代?就是一件事情,人在里面靠经验重复做,这时候机器只要数据大了,就可以取代。

安科科技:现在就人工智能而言,中国和硅谷差距在什么地方?

王小川:我觉得基础研究上差距巨大,包括学校和学校上研究出来的,像Google招的那些科学家,他们真的能够发明新的算法和新的体系结构来解决人工智能的问题,像CNN这次听过吗,LSPM那些新的算法,都是人家发明的。我们基本是看论文,看谁能够最快把论文的这些东西用到我们系统里去。我给你个数据,全球前十大互联网上市公司,中国占了4家,但全球前100所高校,中国只有两家,一个清华一个北大,还只是中不溜的。在这种研究能力上你的差距是巨大的。

学校是什么原因呢?因为我们学校还需要去行政化才行,老师的目标不是真正出成果,而是为了这种怎么去升职,怎么去发论文,怎么去成国家的重点项目,所以它的目标不一样就做不好,其实老师都挺聪明的。

我们做天工智能研究院就希望给他们开个口子,因为他们有时候有的人追求的目标是升学校教授,要拿多少的科研经费,我们帮他们解决问题,看看能不能唤醒一些人。但总的来讲氛围上,就是沙漠上滴了两滴水,还是特别难。

安科科技:但整体而言今年是人工智能大爆发的一年,变化很大。

王小川:第一,今年是个启蒙运动,大家开始认识到了人工智能伟大的意义,所以也会有更多的资金、人才投入到人工智能的研究或者商业中去,因此人工智能真正启蒙运动后的大爆发刚刚开始。但是我们又有时候会高估人工智能现在的能力,开始想象人工智能是否会威胁人取代人,这是不存在的。但凡你和一些比较严肃的做学问的人聊的时候,大家都会不断给你降低这里面的预期。

第二,有一些酷炫的东西很酷,但其实智能性或实用性是不够的,比如像我讲的图像合成,拿两个图合成第三幅图,比如你拿个风景画或者一个人的照片,背后你再把中间像搞一些著名的毕加索的风格放进去,声称一幅画是毕加索风格,大家说好厉害,或者一幅图片里识别出里面有熊、长颈鹿,这种技术上的突破确实是很大的,但到整个产品实用的路径是非常远。

所以,今天我提出一个概念,我们在产品层面上人工智能有三个帮助:一是识别,语音识别和文字识别;二是生成,你能够合成图像、语音和文字,但这些可能都不够重要,真正重要的方向是让机器做决策,就是做准确决策。

安科科技:在搜狗而言,你认为人工智能会有什么坑吗?

王小川:我们觉得是好用,想得比较清楚,对技术真正了解,有些对技术不了解的公司,可能投了一个技术觉得技术做不到,或者技术转化不了产品,或者产品没有商业模式,我觉得我们以前在历史的积累中对这些问题都有自己的思考。老周踩得坑,你要看我以前的一些讲话里都提前讲了,就是这些坑他会遇到的,硬件免费,做儿童手表那会儿又是打安全牌,这些就不靠谱嘛,但他自己实践一次才知道。

另外的话,开放性,因为对我们而言,我们是一家 to C 的公司,最终是给普通的消费者提供我们的服务。

安科科技:今年你们设了CMO、CTO和COO,主要是为了激励还是有一些其他方面的考虑?

王小川:我觉得时间到了吧。其他考虑不能告诉你,背后有很深的思考,但是不能说。

相关推荐