微软全球资深副总裁王永东:今天的AI就像99年的互联网
【新智元导读】当技术突破不再狂热的时候,技术落地正在悄然推进。近年来人工智能的热度不断升温,人工智能的风口正在逐步形成。各种人工智能技术在全球也开始快速落地,人工智能应用范围不断扩大,微软全球资深副总裁、微软亚太研发集团CTO、微软亚洲互联网工程院院长王永东在 AI World 2019 世界人工智能峰会上分享了微软在AI领域取得的成就以及对AI落地的思考和实践。欢迎来新智元 AI 朋友圈与大咖一起讨论~
普通人可能体会不到,当技术突破不再狂热的时候,技术落地正在悄然推进。
近年来人工智能的热度不断升温,学术研究的参与度持续上升,国际顶级人工智能学术会议的论文提交量称得上是逐年飙升,其中企业投稿量占了非常大的一部分。
在企业和学术机构的共同努力下,从2019年开始,人工智能的风口正在逐步形成。与此同时,各种人工智能技术在国内也开始快速落地,人工智能应用范围不断扩大,数据丰富度、付费意愿和竞争程度成为AI企业场景选择的主要考量维度。
尤其是计算机视觉、计算机语音以及自然语言处理,成为了AI落地的热门领域。市值超过1万亿的微软,自然也是这些领域的引领者之一。
10 月 18 日,以“AI 元力,重启未来”为主题的 AI World 2019 世界人工智能峰会在中国北京中关村展示中心成功举办。峰会由海淀区政府、中关村科学城管委会主办,新智元、海淀园管委会、智源研究院承办。
峰会上,微软全球资深副总裁、微软亚太研发集团CTO、微软亚洲互联网工程院院长王永东向我们分享了微软在人工智能方面目前做出的成绩以及进展。他强调,人工智能技术有很多方面,从基础技术来看,计算机视觉、计算机语音、自然语言处理是非常重要的方面。接下来是王永东的精彩演讲。
微软在计算机视觉的探索
王永东展示了微软在计算机视觉技术方面的探索,主要取得了以下成果:
王永东说技术上的突破,可以应用在很多细分的应用场景中。比如物体识别,可以在一个场景里面来寻找和辨识某个物体;比如人类情绪的面部识别;再比如文本文字的识别。
综合使用上述技术,就能看到非常有趣的落地应用。王永东还展示了一段日本版微软小冰Rinna与人类对话的视频。
在水族馆,通过手机上的视觉感应,Rinna可以看到你所看到的东西,可以和你进行对话,非常生动。这里面有视觉,也有语音,也有自然语言理解,是结合起来的一个应用。
媲美人类的计算机合成语音
王永东说,微软在计算机语音方面不断突破,目前微软的语音和语言技术在特定领域已经达到了可以媲美人类的水平。
他用自己录了一个小时的声音作为素材,然后通过语音合成技术,就可以生成与他的声音几乎一模一样的定制声音。
王永东说,语音技术在过去一段时间进展颇丰。语音有两个大的方面,语音识别、语音合成,去年比较大的进展是语音合成方面,声音的自然度已经接近和达到人类水平。
语音识别方面,也有不小进展,例如识别的精确度,还有就是像微软对全球语言的覆盖范围非常广,这对国内公司走向全球市场会有很大帮助。
再有就是近场、远场不同的应用,或者就是语音助手唤醒词和语音识别模型的方法。比如在一个会议的场景,有麦克风也有摄像头,当有人进入会议室时,它可以识别谁来参会了,还可以和参会人打招呼,可以通知会议的组织者,提醒大家会议开始了,还可以识别不同人的声音和说话内容,利用机器翻译的能力让不同语言的参会人轻松交流。会议结束以后,还可以用自然语言处理的能力来概括会议讨论的内容,包括接下来要做的事情。
业界最好的自然语言处理技术
自然语言处理也有很多方面,比如像机器阅读理解、机器翻译等等。自然语言处理可能是人工智能领域中的一个最具挑战性的技术。
微软在自然语言处理方面有长足的进步,并且把这些进步应用到了必应搜索引擎,Office应用软件, 微软小冰,微软小娜等多款产品中。用一个非常简单的搜索应用场景举例, 比如搜索“姚明太太的身高”, 通过理解自然语言,和海量公开信息检索以及微软所建立的世界知识图谱, 计算机很容易找到姚明的太太叶莉,并把用户所搜寻的信息展示出来。
微软在中国市场的落地探索
王永东还讲了微软在中国市场里面的一些探索,一切人工智能离不开云作为基础,微软Azure公有云服务在全球有着广泛的部署。通过云和边缘让AI为业务所用,涉及机器学习、知识挖掘和人工智能应用等多个方面。
王永东称, 微软人工智能产品,非常全面。既可以提供人工智能平台,赋能企业的人工智能基础建设, 也可提供人工智能中台型产品, 使得企业能够根据自身的业务需要, 构建中台, 让前台的应用得以更加高效和灵活。
微软的全线人工智能技术, 都可以高效为企业的人工智能中台赋能, 例如语音、视觉和自然语言处理。这些技术型产品和解决方案, 能够大大地降低企业自建自研人工智能应用的门槛, 让企业利用技术专注于解决自身的业务挑战, 而不是被人工智能技术的高门槛所阻碍。例如微软的自然语言处理能力, 已经提供给多个企业中台, 帮助企业高效处理文本和海量信息, 提升业务效率。
除了平台及中台型技术赋能产品, 微软也为战略级别客户定制前台解决方案, 涉足金融、 制造、汽车、房地产、文化等多个领域。例如,在金融应用的场景,可以用在股票的策略研究、交易复盘或者大数据平台。上市公司的公告摘要,原来可能需要人工提取,现在都是人工智能来完成,微软和万得资讯合作,10—20秒公告就可轻松完成。
甚至可以利用人工智能技术来自动产生内容,用语音做一个金融电台。内容、包括语音播报均为人工智能生产,可以大大提高这方面的生产效率。
在中国做人工智能最为广泛知晓的就是“微软小冰”这个产品,是用我们刚刚提到的平台、中台来做的一个应用案例,现在在国内外已经有了广泛的用户群体。
王永东说,大家可能都知道微软小冰是一个能力很强的对话机器人,而今天主要介绍一下微软小冰在人工智能创造方面的能力。 微软小冰目前已出版了两本诗集,最近又开始学习画画。通过对过往400年艺术史上236位著名人类画家画作的学习,微软小冰可在受到文本或其它创作源激发时,独立完成100%原创的绘画作品。
不管小冰做诗还是画画,人们都要给她一些灵感,比如给她一些词或者一个场景。给她一幅画,根据这幅画来写诗,也可以给她一个关键词或诗来作画。前不久小冰在中央美院开了个人画展,受到很多观众的欢迎。
写诗、画画跟人工智能未来的应用、生产力产业的发展有什么样的关系?王永东称,微软最近将小冰画画和设计的能力用到纺织工业中去,大家看到的人工智能设计的风格,不仅仅只是概念。通过微软小冰人工智能设计能力做出来的产品,已经进入市场,有领带、丝巾、衣服、雨伞等等。
虽然写诗的目的不是说要让她成为世界上最好的诗人,但是写诗创作的能力也可以有很广阔的应用场景。例如,可以应用在儿童故事创作中,或者为每位家长定制他们想要的儿童故事,这方面可以大大提高创作效率。
微软未来的AI之路要走向何方?
王永东认为,今天的人工智能处在技术发展很快,应用也开始落地的时期,但其实还有很长的路要走。把今天的人工智能和互联网做一个类比的话,王永东认为今天的人工智能可能有点像大概1999年的互联网那样的状态。
从微软来看未来的发展,可以预见,在不久的将来,所有的企业及个人都将依存于,云和边缘,万物互联、无处不在的计算和人工智能。以人为中心,多感官跨设备的体验。
在发展技术的同时,我们需要认真思考技术进步给我们带来的社会影响,以及我们因此将要面对的种种挑战。先讲一下人工智能的发展对社会伦理的考虑,这个是大家特别关心的问题。
微软作为一个世界领先的公司在这方面有很多的思考,比如出版《计算未来》这本书的内容就是微软的两位领导公开发布出的公司对人工智能在社会角色方面的思考。
同时,微软提出一些重要原则,比如要负责任,要对用户透明,要公平、可靠和安全,保障用户隐私,要有包容等。这些都是对人工智能的发展至关重要的方面,如果不注意的话,技术可以继续发展,但也会有走偏的可能。微软内部设有人工智能道德委员会,微软一些人工智能方面技术的或者应用其实都要经过这个委员会的讨论和批准,这样的话可以在全公司达成共识,怎样让人工智能更好地帮助用户,帮助人类社会向前发展。
王永东还指出人工智能的发展是一个开放的生态系统。微软已经和很多单位、公司、学校、公益组织、人工智能联盟等组织合作,一起推动人工智能在社会中对人类社会的有益进展。