商汤科技: 以原创技术为杠杆撬动AI生态
给我一个支点,我就能撬动地球。
阿基米德的这句名言,早已不仅仅只适用于物理学的范畴,更成为企业在商业社会中通往成功的圣经。企业如果能够制造一个支点,便能撬动起整个商业帝国,甚至可以在短时内,呈现突变式的爆发增长。
AI就是这样的一个领域。在人脸识别、自动驾驶等犹如雨后春笋一般成为行业热词的背后,是技术导向型新锐公司的不断涌现,其中商汤科技就是最具典型的代表。作为一个成立仅仅三年的公司,商汤科技的技术产品已覆盖安防、金融、汽车、智慧零售、智能手机、移动互联网、机器人等多个行业。而商业化短短两年的时间,订单已经达到了“平均每个工作日新签一个客户”的速度,成为中国领先的新锐人工智能公司。
究其原因,业界普遍认为,商汤科技以原创技术为支点,将其应用到众多领域,形成规模效应,同时通过平台策略快速吸引行业伙伴,构建生态系统,可以说,整个商业模式的形成,都是靠其底层原创技术撬动的。
聚焦商汤不难发现,“原创技术”是他们在市场和资本圈都反复强调的关键词。但做原创的价值,到底体现在哪里?为何原创技术能够成为商汤的支点?
原点出发,创造支点
计算能力、大数据、深度学习被公认是掀起现代AI浪潮的三大要素,但其中哪一个更加重要则各说纷纭。得益于大量数据的训练,人脸识别、语音识别的精准度不断攀升,已经大规模商业化,巨头们也纷纷展示自身的数据实力。表面来看,似乎采用深度学习之后,数据成为了AI最核心的竞争力。但事实上,算法演进的速度仍在快速颠覆人的想象,AlphaGo便是最典型的例子。经历短短不到2年时间的升级,最新的AlphaZero只需8小时训练就能击败对决李世石版本的AlphaGo,最令人震惊的是,它不再依赖人类数据做训练,获胜的关键在于泛化强化学习。
深度学习的确带来了巨大的突破,但强化学习、GAN、迁移学习等名词仍在不断涌现。诸多前沿的技术领域仍亟待探索,减小对数据的依赖便是公认最重要的挑战这一。这无疑在说明,把握核心技术的突破,才是把握未来AI发展的脉搏。
从行业来看,谷歌的TensorFlow、Facebook的Torchnet等系统带动了业界的繁荣。利用这些开源平台虽然可以快速发展应用,但是最核心的技术依然掌握于他人手中。当自身的需求无法由开源平台满足时,就难以继续深入发展。商汤的早期创始团队正是认识到了这一点,在2011年切入深度学习研究时,就确立了“从源头自主研发”的路线——他们深信,只有从原点出发,才能走的更远。
深度学习系统可以比作生产深度学习模型的流水线,自己设计的流水线可以按照自身需求随时修改,从而生产新的模型,乃至别人做不出来的模型。商汤将自己的原创流水线命名为Parrots,为了加速流水线的迭代速度还自主建立了GPU超算中心。
过去几年间,商汤科技不断强化在人才和基础设施层面的投入,目标就在于不断演化自己的原创技术“大脑”,这也是商汤能够吸引顶尖人才的重要因素,以150余名AI博士成为当今博士密度最高的中国企业。商汤的原创技术体系,也成为了承载商汤快速发展的支点。最典型的体现即是商汤在ImageNet 2016上创造出的当时行业最深的1207层神经网络,以及今年CVPR披露的Very Deep PolyNet这一已发表的性能最高的网络。
底层爆发,规模扩张
拥有领先的原创技术,到底能够带来什么?
商汤科技联合创始人、副总裁杨帆曾说,商汤自主研发的深度学习引擎和技术体系,可以在进入不同行业、面对新问题时,能够在短时间内快速达到较好结果,这个速度可能会领先于同行,并推动相关技术的快速落地。
这句话翻译过来便是,基于自身的原创技术体系,不仅能做得多,而且还都能做得更好!这也为商汤的规模化扩张,铺平了道路。
如果横向盘点国内CV领域的多家新锐企业,你就会发现,商汤目前涉及的技术领域,可能是同类企业中最多的。不仅拥有应用于智慧城市、互联网金融、线下智慧商业的人脸技术、图像识别等技术,其针对手机提供的背景虚化、图像增强等技术,以及面向短视频直播行业提供的AR技术,都有诸多大量成功的应用案例。商汤科技最近还公布了与本田的合作,意味着其自动驾驶技术也正式得到商业应用。其它的领域还包括遥感图像分析、算法芯片化等。
技术的领先性层面,最具代表的便是商汤的人脸识别技术在2014年率先超越人眼准确率。在最近3年间仍在快速升级,不仅准确率高,面对大角度侧脸、模糊人脸等现实场景经常遇到的问题,依然有很好的表现。今年6月一家安防集成商对比多家算法测试,商汤算法在这些场景下的表现几乎一骑绝尘。
商汤的技术优势更体现在视频的分析和理解上,例如其今年首创的240人脸关键点定位,表面上看只是点数的提升,背后则是网络小型化的关键创新;商汤今年推出的SensePose,是业内首个只需要单个普通RGB 摄像头就可以实现动作估计的解决方案,而不需要依赖传统方案中所需的红外光或结构光。商汤近日所宣布的与本田的签约,后者看上的也正是商汤领先的图像识别及移动物体识别技术。
对于AI这种技术驱动的行业来说,一旦能够在技术上保持领先,便能够创造时间窗口,通过领先的差异化的产品,吸引更多的合作机遇,从而带来更多的数据和反馈,这些反馈可以进一步反哺技术的提升。这就能够形成“领先技术-行业应用-技术升级”的闭环。
可以说,领先的原创技术的杠杆效应,在进行规模化扩张时极具凸显。
平台驱动,百业智能
拓展客户,就要提供更好的支持和服务;扩张生态,多企业联手是最好的选择。这两点驱动企业商业帝国构建的模式,在商汤均有良好的体现,最终实现“赋能百业”。
领先的技术,让商汤可以提供性能更优的算法。但商汤并不仅仅只是一家算法服务供应商,基于Parrots,商汤还可以为合作伙伴提供开发平台,客户可以利用这套平台进行部署训练,发展自己的应用。这一点,也鲜明地体现在商汤与本田的合作中。
这种模式虽然看上去与谷歌面向开发者提供TensorFlow的做法很像,但是,商汤的核心优势在于对一线垂直行业的深度挖掘。在这一前提下,商汤所提供的平台级支持,无疑可以为每一个客户在垂直场景下释放巨大价值。
与上游头部企业建立合作,共同打造生态系统更将放大这一价值。
事实上,多企业联合是AI浪潮之下的必然趋势。因为实现传统企业的升级,AI算法的支持不可或缺。企业虽然也可以通过SDK或SaaS来获取智能技术,但倘若上游企业能够联手,实现底层平台的业务绑定,通过打包的方案,自然可以加速这种智能化的升级步伐。
随着商汤近两年在商业化方面的快速推进,这一模式也有了鲜明的体现和成果。例如商汤与英伟达在智慧城市领域构建的合作关系,同时与华为也保持着长期核心合作关系,最终就可以面向客户提供商汤算法+GPU超算,或者商汤+华为Atlas云硬件平台的整合解决方案。
终端侧AI的发展正逐渐成为重头戏,今年10月美国高通公司与商汤签约战略合作,就能够以算法+芯片融合的优势,将创新视觉和基于摄像头的图形处理等技术,广泛应用于智能手机等终端设备。
可以想象的是,在商汤的上游合作伙伴列表中,必将还会出现更多巨头企业的名字。“平台驱动”将成为一大鲜明的战略,而“百业智能”则是最终的结果。
对商汤来说,原创技术是撬动其整个商业模式的支点,但也正是其平台战略所能够带来的无穷价值,其原创技术更可以说是撬动整个AI生态的支点。倘若以1代表商汤的原创技术,N代表平台驱动实现规模化的扩张,那么∞则代表建立的下游生态能够带来无限的价值。这便是商汤“1的N次方=无穷大”的定义。当然,无穷大,也与商汤科技全新Logo中体现无穷、无限之意的莫比乌斯环不谋而合。