小米崔宝秋:走CBA技术主线,AI是未来十年的核心战略
演讲:崔宝秋
编辑:张乾
【新智元导读】去年,雷军逐步将重心转移到AI技术和应用的研发上来,AI也逐渐上升为小米未来的核心战略,不久前,小米发布2018年第一款AI手机。在3月29日的2018新智元产业跃迁AI技术峰会上,小米人工智能与云平台副总裁崔宝秋全面剖析小米的CBA技术主线。
2018年,小米发布了第一款AI手机。
去年,雷军靠着对供应链改造和内部管理实现手机销量“逆袭”,之后逐步将重心转移到AI技术和应用的研发上来,AI也逐渐上升为小米未来的核心战略。不过,相比“All in AI”、“AI in All”以及“AI First”等口号,小米的AI之路相当低调。
这种低调一方面是因为小米是一家更注重产品落地的公司 ,另一方面是因为实现AI+IoT是一项庞大的工程,需要系统性思考和布局。
小米从不缺少数据,小米在云计算和大数据方面也有很深的积累。MIX 2S使用的芯片属于高通的第三代AI平台,而手机、音箱等设备也是AI场景应用的主要实现载体。这一切因素都齐全了,小米的AI之路该怎么走?
近日,小米人工智能与云平台副总裁崔宝秋出席了2018新智元产业跃迁AI技术峰会,全面剖析小米的CBA(Cloud Computing、Big Data、Artificial Intelligence)技术主线。
C:Mi Cloud、融合云、生态云,构建小米生态
2012年,小米全年的手机销量破纪录的达到719万部,大量的照片及视频对数据存储提出了要求。
也就是那年的年初,崔宝秋被雷军说服从美国归来加入小米,负责小米的互联网后台技术架构和云平台建设。几乎是从零开始,崔宝秋开始组建小米云平台团队。小米云平台主要是一个技术平台部门,但它也负责一款产品,也就是小米云。“小米云不是一个公有云服务提供商,不对外提供服务,这是区别于阿里云、金山云等最重要的特征。”崔宝秋说,目前小米云有Mi Cloud(小米云服务)、融合云和生态云三大板块内容。
Mi Cloud于2012年7月开始成立,是小米手机用户的个人数据中心,对标苹果iCloud,小米手机中的联系人、通话记录、便签、照片、视频等信息都会同步到云端。
在小米公司内部,很多业务团队都有存储和计算的需求,例如智能语音,计算机视觉,MIUI浏览器,金融,音乐等等,同时很多工程师,例如研发,测试等等,也需要灵活的计算资源分配。为了更高效的满足公司内部需求,小米建设了小米融合云,用私有云形态为公司内部各个团队提供云服务,同时也支撑着公司的大数据挖掘和分析。
小米在智能硬件领域投资了很多家生态链企业,2014年,小米开始建设小米生态云,目的是为众多小米生态链企业以及合作伙伴企业提供一站式的云服务和解决方案,用云服务的形式打造小米的大数据生态和人工智能生态。
B:数据科学在脑海里根深蒂固,小米有天生的优势
在加入小米之前,崔宝秋曾就职于雅虎和 LinkedIn,这两段工作经验,让大数据和数据科学概念在他的脑海里根深蒂固。
当时在中国讲数据科学曾遇到一些尴尬,互联网行业中,真正理解数据科学的人不多,优秀的数据科学家更是稀缺。在崔宝秋看来,小米不仅仅是一个手机公司、更是一个移动互联网公司,一个新零售公司,最重要的是一个大数据公司,这也是他认为小米能够在移动互联网时代崛起的重要原因。
基于大量的手机和IoT设备,小米天生具备获取大数据的能力,有了数据,就有了训练模型的基础材料。
A:AI是小米未来十年的核心战略
如果潮流来了,一个公司没有准备和积累,那么它就会错过机会。
人工智能在四、五年前逐渐兴起来的时候,小米虽然有一些自然语言处理、大数据分析和机器学习的积累,但是深度学习在很多领域的应用是没有布局的。
2014年,亚马逊推出智能音箱,将语音交互技术应用在传统音箱中,让人们看到了人工智能应用的巨大场景;2016年,AlphaGo击败李世石,深度学习向世界展示了它的威力。“要感谢AlphaGo,让我们看到了深度学习的潜力。”崔宝秋说。
到了2016年,小米立项做第一款战略级AI产品——小米AI音箱。“当时我们几乎什么也没有,AI音箱的大脑团队是从大数据团队、搜索团队抽调过去,到今天这个团队就演变成小爱团队。”崔宝秋说。
2017年,小米云平台改名人工智能与云平台。依靠小米之前的数据积累、云计算积累,通过对机器学习和深度学习平台的搭建,小米抓住了AI的潮流并实现了技术落地。
截至到2018年1月,搭载“小爱同学”的智能设备累计激活数已经超过1000万,这也让“小爱同学”成为小米最有价值的智能语音交互平台。在一次内部会议上,雷军说,AI是小米未来十年的核心战略。
“我们压力很大,这是机遇和挑战并存下的压力。错过这波机会就太可惜了,团队如果没有为小米抓住机会的话,我们就成了’罪人’。”目前,崔宝秋负责的人工智能与云平台团队共有800多人,其中AI团队数量占一半左右。
以下是崔宝秋在峰会上的演讲:
崔宝秋:非常感谢杨静杨总的邀请, 很高兴有机会跟大家交流,我今天分享的题目是“小米的人工智能之路”。
我在小米负责人工智能与云平台团队,这两年在新的AI浪潮之中我感到非常兴奋,因为20多年前我自己学的也是人工智能,但是当时我学的是逻辑程序设计,基于逻辑、推理、专家系统的人工智能技术。回头看,那个时代是AI的寒冬,今天,AI迎来了另一个春天,这是非常让人兴奋的。小米在AI上做了哪些事情呢?今天跟大家分享一下。
好多人对小米的认知还停留在小米是一个手机公司,对小米做的事情不太了解。小米不仅是手机公司,更是移动互联网公司、智能设备公司、新零售公司,而真正了解小米模式的朋友知道,小米也是一家大数据公司,一家AI公司。
我在五、六年前加入小米,推动数据驱动,一年多前我把它升级为AI驱动。
在小米,我们从2012年开始在很多领域已经用到AI,只不过当时大家没有那么深刻认识到深度学习这种新的AI技术的应用。在雅虎时代、Google时代,好多做人工智能的人都不屑于或者不愿提人工智能。但是人工智能技术已经在小米或者在各个互联网公司应用得几乎无处不在,比如搜索。过去很多年我一直做搜索,AI的技术在小米十多款搜索应用里面很早就得以呈现,还有个性化推荐。小米有很多内容,如何做到千人千面,把最好的内容推送给最合适的用户,也是人工智能可以发力的。
比如,我们团队和小米电视团队合作,推出了千人千面的拼图墙,这个人工智能技术带来了流量、带来了用户的增长。小米电视的开屏率、观看时长都随之翻了几倍。
今天我想讲的是,2016年开始AlphaGo让人们认识到新的人工智能技术,也就是深度学习的兴起。我们为什么从2016年开始要真正深度拥抱AI?今天的AI在小米意味着什么?可能跟前几年完全不一样。
AI在小米将深度无处不在,两大原因:
第一,小米有丰富的产品线。刚才香蕉出行演示的翻译机就是小米生态链企业产品的一个代表,小米手机是现在人工智能技术的最大平台,围绕手机,围绕IoT,几乎所有的产品都需要AI赋能。
第二,几乎所有的AI技术,在各个垂直领域,都会在小米的产品线中得以施展,得以应用,这一点相信大家都同意。我给我的同事们讲,我们要在很多地方积累自己的力量,积累自己的技术与团队,因为随时随地都有可能有新的需求产生。今天没有的产品形态,下个月可能就有,今年没有的可能明年就有。原来说的智能设备之所以是智能,主要是因为它可以连到云端,可以和手机互联互通,但是我认为那些不是真正的智能,我们现在需要最好的AI技术,真正变得智能。
深度学习让AI火了起来,大家都在谈ABC(云计算、大数据、人工智能),过去小米的技术路线发展图实际上是从C到B到A的。我在很多地方都讲过,深度学习后面有很强的大数据功劳,没有大数据不能谈深度学习,大数据背后需要有强大的云服务、强大的算力。小米过去几年打造了强大的云技术团队,从C开始到B,组建了小米的大数据团队,招聘数据科学家,招聘这个团队花了不少时间。2016年大力投入AI,围绕深度学习打造小米AI团队。AI今天已经成为小米的核心战略,是未来10年20年最重要的战略。
有些同行跟我讲,你们小米只是用AI而不是做AI吧 ?我说小米是做AI的。小米在AI上有三大优势,不做AI实在可惜:
第一个优势,我们有很强的硬件优势,小米手机的设计制造能力代表了小米在硬件上的各种优势和水平。小米AI音箱也充分显示了我们的这个优势。
第二个优势,小米有很强的大数据获取能力。
第三个优势,小米的广深的生态链布局,也就是产品线。很多人讲,小米在AI上投入再多都不为多,这一点我非常认同。
这是小米的AI能力图谱:从基础的大数据、深度学习,到中间的感知、认知层,再到上面的开放平台,对接小米的各个业务与产品,以及生态链的产品。
小米在AI上有了一定的技术积累,哪些技术在哪些产品上落了地呢?
首先看看视觉,视觉算法在一些产品上的应用,包括相机,人脸解锁、美颜还有云相册。我们领先苹果iCloud一年左右的时间推出了面孔相册,算法团队做出的魔法消除和智能补全,可以把你照片中不想要的内容去掉。
3月27日我们发布了MIX 2S,带来了我们的AI相机功能,场景识别今天可以识别25个大的种类,细分有206种之多。基于场景识别,比如会场内、室外、还是雪山等等,动物、植物,以及美食,在不同场景下需要用不同的设置,不是摄影高手很难做到完美,AI可以帮你近乎做到完美。再举几个例子,这几张图片前天发布会上雷总也讲了,左边是没有处理的,右边是AI相机做的,感觉很不一样。还有多云天气左边是什么样的,右边是什么样的,AI场景模式截然不同。另外,我们的人脸解锁,也即将在一些产品上落地。
AI单摄背景虚化,这是今年团队做的我个人比较满意的一个亮点。大家都知道现在各种厂家在硬件上投入很多,长焦、广角、双镜头等等,对背景虚化很有帮助。中国的女性用户特别喜欢自拍,如何把自拍拍好,而前置的摄像头基本都是一个镜头,怎么做好?小米做出了自己的算法,在印度版和中国版红米Note5上面发布,印度的专业媒体发表一致好评,超过很多知名品牌。我们与众不同的地方,比如头发丝还有衣服的毛领部位都处理得很好,细节处见精神,小米为此打磨了很久。
针对印度人群我们也做了一些优化,比如印度的男性朋友也特别喜欢自拍,对他们的胡须做一些特殊处理。还有印度妇女穿的很多民族服装以及饰物,也做了特别优化。为什么我们的算法在印度获得一致好评?离不开团队在这方面做出的努力。
前天发布会引起观众尖叫的一个功能就是手机上的”小爱同学”。很多人可能知道,今年我给团队的一个目标,就是把“一句话的事儿“在手机上做到极致。小爱同学是一个唤醒词,去年发布了小米AI音箱,大家称它为小爱音箱。选AI音箱作为小米第一款AI战略性产品是有原因的,因为音箱这款产品可以把团队的积累,从大数据、搜索、推荐、NLP、语音识别到合成、声学、深度学习平台等等技术全部串起来。除了视觉以外,小爱同学或者小爱音箱促进了整个AI团队的成长壮大。小米AI音箱一经发布,受欢迎的程度超出预期,在京东上获得了令人无法置信的百分之百的用户好评。从用户体验和用户好评度上看,虽然发布的不是最早,但是小爱同学几乎成了智能音箱的代名词。前天我们发布了小爱音箱mini版,每个家庭里面每个卧室都可以放一个。
在小米手机上我们也内置了小爱同学,把原来小米手机的语音助手,类似苹果的Siri,重新命名叫做小爱同学,可以做到熄屏唤醒。小爱同学背后积累了很多AI能力,先给大家放一段视频看一下。
小爱同学的知识水平会越来越丰富,越来越可爱,越来越懂你,将来我们会深度打造小爱同学背后的一个小米虚拟助手。
小爱同学是一个智能语音交互平台,有很多种技能,每周会有更多的更新,大家可以期待。它现在可以控制很多智能设备,是我们的一个战略性产品。小米希望通过小爱同学控制所有的IoT设备,也就是所谓的智联网。目前小米的IoT平台有8500万个在线的联网设备,小爱同学将来可控制的产品会越来越多。小爱同学促进了小米AI领域的全面提升,包括远场增强、分布式拾音、唤醒等等。我们打造了国内首家全自动远场声学实验室,同时也在牵头、联合行业中的多家公司、学术界、政府来推动小米的声学标准。我们的ASR算法线上业务语音识别的字准确率非常惊人。15年前我在IBM工作的时候曾参与IBM语音识别测试,但数年后也未见语音产品落地。今年我们小米语音识别团队用不到一年的时间达到这个数字,靠的是什么?靠的是深度学习技术,靠的是后面丰富的语料。
小米的知识图谱在快速发展,现在小爱同学背后的知识每个季度都在翻番往上涨,将来小爱同学只会越来越聪明,智能问答团队在为小米用户提供各种知识获取来源。
从云计算到大数据到今天的AI,开源技术是我们一直拥抱的。在深度学习方面,基于TensorFlow、Kubernetes,我们一早就推出了小米自己的深度学习云服务,从PaaS到SaaS,对小米内部各个业务开放,也对小米生态链企业开放。另外,我们准备开源小米自己的移动端深度学习框架,今天这个框架已经支持了CPU、DSP、GPU、高通和我们自己的澎湃芯片,支持TensorFlow和Caffe等模型,我们的目标是打造业内最好的移动端深度学习框架,Q2即将开源。
我们坚信智能手机是人工智能的最大平台,智能手机加上IoT将为AI带来一个无限的生态。我们相信,利用AI的最新技术,我们可以更快实现小米的愿景——让每个人都能享受科技的乐趣。
谢谢大家!
相关推荐
小米无疑是今年国内除了华为之外最受瞩目的手机厂商了,随着5G时代的到来,友商都在争先恐后地想要推出自家最核心的研发技术,OV开始了向高端和极致性价比转型,小米也是开始了着力研发阶段,华为则是非常的稳。