从LeCun调职看Facebook剧变:为AI军备竞赛改变方向
选自:WashingtonPost
作者:Drew Harwell
近日,人工智能先驱、纽约大学教授Yann LeCun卸任Facebook人工智能实验室(FAIR)主任一职,改任首席AI科学家,接任者是Jerome Pesenti,LeCun将向其汇报。这在业界引起了一场舆论风波。比如,华盛顿大学教授、《终极算法》作者Pedro Domingos在华盛顿邮报的一篇文章中声称Facebook与谷歌、微软在人工智能方面还存在不小差距;LeCun的卸任折射出了Facebook人工智能的研发与工程化之间的深层矛盾。面对这些外界看法,FAIR内部人员如何看待LeCun卸任一事呢?卡耐基梅隆大学机器人系博士、FAIR人工智能研究员田渊栋发表了自己的观点,机器之心经授权获得转载。
FAIR现在一切风平浪静,大家该干啥干啥,没见到和之前有什么区别,还是做long-term的工作,还是偏重科研,还是没有产品压力。我都不知道这些传言是怎么来的。
FAIR基本上是自底向上的管理模式,给一个环境让研究者们去探索,只要有进展,老板们不会干涉。现在大家知道围棋是好方向了,但退回2015年做围棋,碰到个有点控制欲的老板还不把你一脚踹到爪哇国去,但是FAIR不会,大家以“与别人不同”为荣,并且愿意沿着自己看准的方向坚持下去。当时我做围棋大家会质疑,但我可以继续做。做原创研究要”于无声处听惊雷“,要是都听着上头的,上头指哪下头打哪,就没有原创性了,很多时候大佬说的都是错的。
之前Yann的reports太多,他不想管也很正常。国外管人很难的,手下人都是大爷,要好好伺候着,有啥不顺心的要负责解决,出活碰到障碍要提供便利,没思路了要经常一起讨论,要拉合作,作统筹,而且还到处是坑,说错话做错事责任全在管理者头上。
研究其实分两种,一种灌水式研究,以文章中稿为目的;另一种是解决式研究,以解决问题为目的。FAIR从成立之初就是做后一种研究,文章不看多而看精,看效果和质量,不仅看文章,还看开源代码,看影响力。FastText,Convolutional Machine Translation,MaskRCNN,还有最近的detectron,包括我这边的ELF,都是被广泛关注并且可以在各种场景下用上的。在过去的四年里,FAIR给公司带来了不可估量的价值,让大家觉得FB也是一个技术上很厉害的公司,牛人会纠结是去Google Brain,DeepMind还是来我们这里,这还不够么?
站在解决式研究的角度上看,它和产品没有什么不可调和的矛盾,最大的区别是检验标准。产品组标准相对客观简单,可能就几个数字,多少人在用,时长是不是涨了,等等;研究这边就多元化了,新方法,新方向,新思路,就算一时的”大逆不道“都可能是好的。所以一个研究团队要有好的头儿带,要有好的鉴赏力,知道什么是好的研究,什么是一般的研究,什么是在浪费时间,什么需要给空间让大家探索,并且可以把这个标准坚持下去。这个很重要,别看人家到处做讲座好像没干啥,大佬就是起这个作用的。
另一个是长期和短期的区别。太过注重短期效益,逼得紧,每周都要有进展,那就只能在原方法上修修补补(我以前在Google的组就是这样);给一个宽容的环境,鼓励大家坚持长期的方向,就会有创新出来。如@吴育昕所说,对长期的项目现在投入是越来越大了。注意宽容并不意味着我们很闲,事实上像我基本上是7天13-14小时工作制,算法到系统到理论分析都搞,搭建系统的速度,产品组同事们看了commit的频率都无法插手。宽容只是容许失败,容许尝试很多不一样的方向,只要你努力了,就算失败也不会让人难堪,反而可以堂堂正正说试过了,换一个方向再试一次。
所以,你们觉得这样的组会被干掉么?
另外附带说一句,一直以来FAIR宣传自己是研究组,宣传各种文章各种研究成果,可能有点用力过猛,导致大家对它有误解,以为它只做研究,和产品关系不大。其实FAIR虽然没有产品压力,但和以前MSR有点不一样的地方是它一直在deliver,一直有各种东西放进产品里面去,我上面列举的那些好项目,难道都是看着当摆设的?现在因为AI平台兼容性强很多,技术转化相对方便,要送训练好的模型去服务产品,真的不是什么难事情。以前听说MSR要花上一年时间才能转化研究成果,现在FAIR这里搞个新闻,明天一封email就来了要谈内部合作。我来FAIR的第一个小项目就是完全出于个人兴趣和我的bootcamp mentor做了个内部产品,不仅发布了还被VP点名了。不过我为啥要宣传这事呢?还是讨论高大上的游戏和强化学习比较吸睛啊。
可能大家只有“科研”,“工程”这几个概念,所以不知不觉把事情往非黑即白的方向上去想了,其实世界都是灰的。