「Science特稿」中国成数据沙特,美国至多领先半年
新智元编译
来源:science
作者:Christina Larson
编译:文强
【新智元导读】Science特稿,从学术、产业和政府多个角度,对比中美在人工智能实力和认知上的差异。在AI私人投资、科学家的数量和经验方面,美国仍然领先中国,但是中国有更多的数据,更好的政策环境,正在全力追赶。AAAI主席Subbarao Kambhampati说,“一直以来,人们普遍认为中国的技术水平一直处于二流,这可能是事实,但这正在迅速改变。”MIT&哈佛大学Broad研究所所长Eric Lander上周在《波士顿环球报》发表社论,警告说美国在人工智能方面至多领先中国6个月。
在北京北部高楼林立的海淀区,两个20多岁的硬件工程师正在测试新的计算机芯片,这些芯片有朝一日可能使智能手机、机器人和自动驾驶汽车真正拥有智能。旁边,站着一个穿着法兰绒格子衬衫、温和的年轻人。今年34岁的计算机科学家,同时也是寒武纪科技的创始技术顾问陈云霁解释说,传统处理器在最近的人工智能(AI)研究热潮兴起几十年前被设计出来,它们在处理AI所需的大量数据时,“速度和效率都很低”。陈云霁说:“即使你有一个非常好的算法或应用程序”,如果不能在你的手机、汽车或电子设备上运行,它在日常生活中的用处还是有限,“我们的目标是改变一切生活。”
2012年,Google Brain识别猫的开创性项目,用到了16,000个微处理器内核来运行相关的算法。这一壮举被誉为深度学习的突破:在没有人类程序员的指导下,从庞大的训练数据集中寻找模式。一年之后,陈云霁和他的弟弟,现任寒武纪首席执行官的陈天石,联手设计了一种新的芯片架构,可以使便携式消费电子设备识别人脸、道路导航、翻译语言,发现有用的信息,或者识别“假消息”。
开发人员希望像Cambricon-1A这样的人工智能优化芯片能够使移动设备自行学习。来源:SHAN HE—IMAGINECHINA VIA AP IMAGES
AI芯片已经成为未来技术产业的核心,全世界的技术公司和计算机科学部门都在推进AI芯片。谷歌首席执行官Sundar Pichai去年十月份在接受The Verge采访时表示,他如今思考的一个重要问题是:“我们如何运用AI来重新思考我们的产品?”陈氏兄弟无疑是在这方面走在最前面的人,他们的Cambricon-1A芯片去年秋天首次商业亮相,用在了华为的智能手机上,这款手机也被称为世界上第一款“真正的AI手机”。香港科技大学(HKUST)计算机科学家杨强说:“陈氏兄弟在专用芯片架构方面的工作是开创性的(pioneering)。”
美国正在失守:在人工智能方面至多领先中国6个月
几年前,这种远在硅谷之外的突破性进展是难以想象的。位于华盛顿的欧亚集团(Eurasia Group)分析师Paul Triolo表示:中国在尖端硬件设计方面落后于美国,但它希望赢得AI芯片竞赛。中国正在AI的整个领域大规模投资,从芯片到算法。例如陈氏兄弟,在中科院计算所工作的时候开发了他们的芯片,计算所在2016年把寒武纪分离出来,并且提供了种子基金。(现在,寒武纪已经价值10亿美元。)
去年夏天,中国国务院发布了一个雄心勃勃的政策蓝图,呼吁国家在2030年前成为“世界主要的人工智能创新中心”,并预测届时中国的人工智能产业可能价值1500亿美元。图灵奖获得者、AI先驱、斯坦福大学和卡内基梅隆大学的Raj Reddy说:“中国正在信息技术的各个方面投入巨资,从量子计算到芯片设计,所有这些都是AI的基础。”
近几个月来,中国政府和工业界纷纷开展人工智能相关的计划。新华社上月报道,中国将在北京西郊建设一个价值21亿美元的人工智能科技园区。虽然其回报还需要很多年才能看清,但单从数字上看,中美两国之间,明显中国占优:美国情报部门研究机构In-Q-Tel表示,美国政府在2016年的非机密(unclassified)人工智能项目,总支出约为12亿美元。Reddy担心,美国的优势正在失守。“我们曾经是科研经费和科技进步的大佬。”
中美两国AI投资对比:在AI私人投资、科学家的数量和经验方面,美国比中国领先。但是,中国企业可能从拥有更多数据(包括不在公有领域的数据)中获得更多的优势,从而提升算法。
中国在人工智能方面的优势不仅在于政府投入。由于人口众多,在线商务和社交网络活跃等因素,中国拥有大量数据,而数据是深度学习系统的命脉。陈云霁认为,人工智能是一个新兴学科的事实也对中国有利,通过鼓励学术创新和发展,有机会使中国与长期处于AI研究领先地位的美国一较高下。“在传统科学领域,中国科学家要赶上美国或欧洲还有很长的路要走。但计算机科学是一个相对较新的事物,年轻人可以竞争,中国人可以竞争。”MIT&哈佛大学Broad研究所所长Eric Lander上周在《波士顿环球报》发表社论,警告说美国在人工智能方面至多领先中国6个月。他写道:“中国在掀起人工智能革命方面没有任何作用,但正在取得惊人的进展追赶上来。”
中国是“数据的沙特阿拉伯”,AI教授在中国工业界每年能挣50~100万美元
激烈的全球AI竞争也有缺点。公司纷纷到高校挖掘顶尖人才,大学的计算机科学系人才流失严重。加拿大多伦多的约克大学的计算机科学家Michael Brown表示:“这么多年有各种各样的趋势,但这是我见过的最大的一个——在美国或中国,一位教授去工业界每年可以挣50万到100万美元。”
中国政府已经开始使用面部扫描来识别行人和流浪者。来源:REX FEATURES VIA AP IMAGES
正如石油是工业时代的驱动力,数据推动了AI时代的进步。创新工场创始人、计算机科学家李开复说,人工智能的很多实际进步,“更多是拥有大量不断更新的数据和能够利用这些数据的足够好的人工智能研究人员,而不是拥有一群没有什么数据、超凡卓绝的人工智能理论家。”而中国,正如《经济学人》最近一篇报道中所说,是“数据的沙特阿拉伯”。
每当有人在百度搜索,用微信钱包支付,在淘宝商店付款,或叫一辆滴滴,等等,这些用户数据都可以反馈到算法来提高其准确性。在美国也有类似的现象,但中国目前有7.51亿网民,其中95%以上的人使用移动设备上网。中国上海的咨询公司艾瑞咨询(iResearch)估计,2016年,中国移动支付交易总额达5.5万亿美元,约为当年美国的50倍。
百度在收集这些数据的同时,也利用了大部分这些数据。在百度位于北京的园区,安装了激光雷达传感器的汽车在试运行中收集地图数据,这些数据将为百度的自动驾驶实验室提供支持。在百度主楼,人脸识别系统扫描员工的脸部然后开门。在中国的科技巨头百度、阿里巴巴和腾讯中,百度是最先投资人工智能的。现在百度雇用了超过2000名AI研究人员,包括在硅谷和西雅图的员工。
几年前,百度在其手机应用程序中增加了一个由人工智能驱动的图片搜索功能,用户可以拍下一张商品的照片,搜索引擎自动识别,然后查找价格和商店信息。
早期的物体识别项目集中在轮廓上。但是,很多东西,例如餐馆里的食物盘子,基本上都有相同的轮廓。百度细粒度图像识别实验室(Fine-Grained Image Recognition Lab)负责人、数据科学家周峰说,需要的是对更精确的内部模式,或者“纹理”的检测。现在,百度的AI图像搜索可以区分麻婆豆腐和油炸豆腐(类似检测燕麦和大米之间的差异。)周峰说,更好的算法当然有用,但同样互联网用户上传丰富的训练数据也起到了很大的帮助。
数据洪流也在改变学术界。杨强说:“当年写AI教科书的时候,我们还没有这类数据。大约5年前,我们认为课堂教育不够,我们需要与行业建立伙伴关系,因为大型科技公司不仅拥有大量的数据,还有各种数据来源和许多能够应用AI的有趣场景。”现在,香港科技大学的教授和博士生正与腾讯合作开展人工智能项目。他们可以获取微信的数据,并且正在开发从客服到佛教精神建议等各种“智能”聊天功能。
但是,这样的合作是脆弱的,中国的学术界正在努力让有能力设计新的AI算法的教师留下来,不要离开校园去往工业界。陈云霁说:“大学生知道人工智能是件很酷的事情,也可能让你变得很富有。”
中美对人工智能进步态度的不同:隐私和监控
中国政府也在积极利用数据,国务院规划的AI路线图中明确表示,人工智能能“显著提高社会治理能力和水平,为维护社会稳定发挥不可替代的作用”。
使用面部扫描授权某些快餐店进行数字支付。来源:JIN KE—IMAGINECHINA
其中,位于核心地位的是AI支持的人脸识别技术。面部识别现在在中国经常用于购物和获取一些公共服务。例如,在中国的肯德基餐厅,顾客可以通过面部扫描来授权数字支付。百度的面部识别系统在机场安检门确认乘客身份。得益于人工智能的发展,现在不仅能识别近距离照片的某个人,还能够在视频中识别,完成更为复杂的科学任务。
中国对这种进步的态度与美国的反应相反。当美国海关与边防局去年5月透露,计划使用面部配对技术来验证离境航班旅客身份时,爆发了一场公开辩论。华盛顿美国公民自由联盟的Jay Stanley在分析中警告这项任务发生本质变化的可能:使用新的人工智能技术,“你可以在一小时内识别经过人行道的成千上万人的面部,在他们不知道自己被识别的情况下。”
在公共厕所,经过面部扫描后,提供一定量的卫生纸。来源:来源:WANG ZHAO/AFP/GETTY IMAGES
研究、产业和政府加大投入,越来越多的人选择留在中国做AI
中国的AI研究人员没有显示出放缓的迹象。2016年10月,一份白宫报告发现,中国研究人员在所有的期刊上发表的深度学习论文,数量比任何其他国家的研究人员都多。根据麦肯锡全球研究院(McKinsey Global Institute)最近的分析,在调整出版物影响因子后,美国AI论文的影响力仍然是最高的,其次是英国,中国则以微弱的劣势居于第三。
AAAI主席Subbarao Kambhampati说,在2012年左右,中国向人工智能顶会提交的论文数量“非常小”。而在前不久于奥尔良举行的AAAI 2018,中国的论文数量几乎与美国相当。“一直以来,人们普遍认为中国的技术水平一直处于二流,这可能是事实,但这正在迅速改变。”
中国政府希望AI热潮能够继续。2017年底,科技部发布了“人工智能发展三年规划”,并在几个关键领域给出了“国家队”,比如百度的自动驾驶、腾讯的计算机视觉医疗诊断。北京大学机器感知与智能教育部重点实验室教授查红彬在为政府提供咨询时表示,中国正在计划扩大提供机器学习和人工智能课程的大学的数量。
与此同时,行业也继续大量下注人工智能。去年10月,阿里巴巴宣布计划在三年内投入150亿美元,在四个国家建设7个实验室,重点是量子计算和人工智能。
十年前,中国最好的人工智能研究人员可能会寻求在硅谷工作。但现在,越来越多的人正留在中国,振兴中国的AI产业。自动驾驶初创公司Momenta联合创始人、30岁的数据科学家夏炎表示,“我们中的很多人都选择从学术背景走到产业,经营公司。我们希望在现实世界中看到我们的工作,这是一个全新的时代。”
原文链接:
http://www.sciencemag.org/news/2018/02/china-s-massive-investment-artificial-intelligence-has-insidious-downside