获芯片巨头英伟达投资,图森未来打造核心算法,瞄准高级别无人驾驶卡车市场
机器之心原创
分析师:高静宜
编辑:刘燕、杨筱卿
8 月 3 日,国内自动驾驶初创企业图森未来(TuSimple)正式宣布,已获得来自全球芯片巨头英伟达(NVIDIA)的投资,此次投资后,英伟达占图森未来 3% 的股份。此次投资被计入图森未来的 B轮融资中,具体投资额未披露。据图森未来 CEO 陈默介绍,数月前英伟达即已达成投资意向,目前融资已交割完毕,投资款已到账,双方才决定对外公布这一信息。
自动驾驶卡车市场的蛋糕很大,每家公司切入点也不相同。「这个领域的竞争是一件好事,更多的人认可这件事情可以促进政策层面的推动,也能帮助图森未来走得更远。」图森未来 COO 郝佳男说。
逐步步入老龄化社会将造成的运力危机;货车事故率远高于乘用车的安全隐患;不良驾驶习惯造成的油耗浪费…… 中国长途货运长期处于这样一些行业痛点之中,图森未来则瞄准这一细分市场试图通过自动驾驶卡车方案重塑货运行业。
「我们的着眼点是尽快落地,从商业角度做靠谱的东西,而不是从技术角度做炫酷的东西。」图森未来 COO 郝佳男说。
在这之前,图森未来曾进行业务定位的调整。前身图森互联成立于 2015 年 9 月,其研发方向主要针对图片识别,以广告投放等业务为主。经历了最初的摸索期后,2016 年 3 月正式转型,开始把目光聚焦于高级别无人驾驶卡车市场,自此成为无人驾驶领域的新贵。
本文将从商业模式、技术方向等角度展开,对图森未来在无人驾驶卡车领域的部署进行解读。
定位高级别无人驾驶卡车市场,深入运营场景
图森未来 CEO 陈默曾多次在公开场合表示图森没有乘用车的规划。在成立之初,和大多数拥有技术的创业公司一样,图森未来通过选择人工智能技术感较强的领域,来决定公司的业务方向。但在实践中他们发现,人工智能技术虽然有一定程度的突破但还是存在限制。另外,在不同的细分领域,人工智能的价值也截然不同。是开发一个短期内就能落地的项目,还是构建一个五年之后才能完美成型的方案?是用技术取代人类、帮助人类,还是让技术具有酷炫的效果?每个团队都需要对此进行抉择。基于这样的洞察与考量,图森未来致力于建立自己的技术壁垒以避免陷入红海,再根据场景需求将技术积累转化成市场壁垒,最终将目光锁定了高级别无人驾驶卡车市场。
据统计,中国作为物流运输大国,整体物流成本占国内生产总值的比重高达 16.6%。其中,公路运输的比例约为 70%,市场规模达上万亿以上。货运领域的蛋糕非常巨大,瞄准了机会的各家公司正在努力切入这块市场,以谷歌旗下 Waymo、Uber 旗下 Otto 为首的一批美国科技创新公司正在专攻自动驾驶卡车的研发,并相继开始测试。在国内市场,百度与福田展开合作,致力于 L3 级别无人驾驶卡车的研发。
郝佳男表示,自动驾驶卡车解决方案能降低货运成本、提升货运效率,从这个角度来说,商业逻辑成立。而货运卡车的场景相对固定,大部分为高速路段,技术上也是一个做减法的过程。
然而,为什么直接将技术定位在 L4 及 L4 以上的高级别自动驾驶时,郝佳男认为,在自动驾驶的产业链中,创业公司从 L2、L3 级别的自动驾驶切入并不存在明显优势。Tier1、Tier2 供应商早已从低级别自动驾驶入手完成市场瓜分,作为一项辅助功能,它可以作为汽车的附加值进而增加售车利润。相比之下,高级别自动驾驶意味着司机概念的消失,车辆的大部分行为由系统主宰。对于车厂来说,承担风险为别人铺路并不划算。所以需要方案解决商深入到运营中,承担起车在运营过程中出现问题的责任。而据郝佳男介绍,图森未来目前有两种模式,一是在有货运需求时,使用属于他们自己资产的货车完成运输;二是与货运公司合作,对所有技术方案进行维护,并承担相应的责任。
构建多目摄像头 + 毫米波雷达传感器融合方案,探索激光雷达更多可能性
自动驾驶一般分为感知、定位、决策和控制四大模块。利用各类传感器对车辆周围环境进行车信息实现精准感知为后续模块打下基础,其重要性不言而喻。
图森的传感器方案以计算机视觉为主,将 8-10 个具有不同焦距的摄像头部署于卡车车顶,同时结合毫米波雷达进行数据采集。作为自动驾驶的主流传感器,摄像头以单目、双目甚至多目等方式基于计算机视觉技术实现物体测距、物体识别等功能。但仅仅依赖摄像头的传感器方案存在缺陷,会受到极端天气及光线等因素影响。毫米波雷达的加入解决了这一问题。通过数据融合等技术对来自不同传感器的数据进行分析处理,能够实现优势互补从而计算出行车视野内物体的位置、速度、轨迹等相关信息。这样的传感器融合方案为之后的决策、预警等功能提供良好的铺垫,也为自动驾驶的感知提供了一种更为完备的解决方案。
在郝佳男看来,传感器技术是无人驾驶的门槛之一,对 10 米、20 米开外的物体进行测距是研究生就可以完成的任务。但是探测 100 米以外的物体就不再那么简单,这对双目摄像头硬件的要求非常高,壁垒主要体现在芯片选型、镜头搭配、工艺结构等方面。图森未来目前采用的传感器方案则是针对特定自动驾驶场景高度定制的。
除此之外,激光雷达也在图森未来的算法及实验训练阶段发挥指导作用。虽然激光雷达在测距精准性上具备绝对优势,但是目前其成本还是一大问题,谷歌的自动驾车汽车采用的 Velodyne 64 线激光雷达的价格就高达 75000 美元。除了成本问题,激光雷达测距范围、耐久性也成为图森未来现阶段没有在传感器部分使用激光雷达的原因。不过,随着固态激光雷达等技术的突破与发展,这些问题或将在未来得以解决。图森未来已经与国内激光雷达供应商速腾聚创展开了相关合作,共同探索激光雷达落地的可能性。
自主测绘 + 合作构建高精地图,定位误差小于 5 厘米
定位模块是自动驾驶技术中不可或缺的一个环节,根据采集到的数据信息实时构建高精度的三维地图,有助于自动驾驶车辆对自身环境更深的理解。图森未来的建图车辆搭载了 GPS、IMU、摄像头和激光雷达,多传感器返回的特征点完成匹配,对车道线、隔离带、交通指示牌等信息进行精准构建,确保车身定位误差小于 5 厘米。郝佳男介绍,鉴于图森未来自动驾驶卡车的应用场景仅限于固定路段,所以地图构建的成本并不高。
事实上,图森未来选择自主绘制高精地图的一个重要原因在于图商提供的数据并不满足他们的需求。郝佳男表示,目前高精地图领域并没有现成的标准,每家图商的定位技术也不尽相同。另外,如果画一个北京城的高精地图是非常有难度的,而且成本也比较高;但是如果只针对高速路段则简单很多,因为中国只有 40 余条干线。除此之外,图森未来也将与一些国内的合作伙伴一起构建高精地图。
自主研发核心算法,开放部分训练数据集
自研算法是图森的技术核心,在环境感知、定位导航、决策控制等自动驾驶环节均有所体现。以决策环节为例,图森采用规则与学习融合的算法。基于规则的短程决策以及基于学习的长程决策帮助自动驾驶车辆决定下一步动作,如刹车、减速、循迹等。
但是,自动驾驶并不是一个简单的神经网络。「在自动驾驶技术中,端到端的深度学习从数学角度看是无法实现的,可能永远有解决不掉的问题。目前的技术还做不到可以达到人脑水平的黑箱子。」郝佳男说。
去年九月,图森未来研发的深度学习感知算法在第三方公共平台 KITTI 和 Cityscapes 数据集上夺冠,而对算法进行优化则花费了团队两个月左右的时间。郝佳男解释,刷榜的目的是为了证明实力。但在这个过程中,团队发现,KITTI 等数据集解决的是非常传统、相对学术的问题,因而在今年上半年,图森未来推出了一个全新的更贴近落地的数据集,以此回馈学术界并表达他们对自动驾驶的理解和态度。
郝佳男介绍道,图森未来的标注数据集数量非常庞大,这次推出的数据集公开了图森未来的一部分数据。相较于现存的自动驾驶领域数据集,图森未来的数据集把先验、信度等问题考虑在内。例如,相对平坦的路面汽车不会起飞也不会瞬移,在实际场景中,不考虑类似这样的假设是不明智的,而这样的先验知识并没有在过去的数据集中应用起来。先验的概念是非常重要的,图森未来会把采集到的所有数据放到超大规模的 AWS 云平台上,基于先验知识对决策系统进行训练。
不过,图森未来的自动驾驶解决方案中所有的计算都是基于英伟达的 PX2 平台,在本地进行处理。由于网络可用性及延迟问题,自动驾驶放在云端计算在理论上是不现实的。「云端的信息可以告诉卡车前面有路障让其绕开从而实现更加顺畅、安全的目的,但是如果没有这样的信息,卡车也必须能够完成基本的行驶决策,因为我们不能期待一个百分之百可用的网络。」郝佳男表示。
在确定了下一步响应及行车路径后,将由控制模块来实现车辆的具体动作。在这个环节,郝佳男提到了卡车应用场景的特殊性。由于卡车的重量及体积较大,控制方面会存在一些难点。例如,货物分布不均的情况下,卡车需要通过惯性制导进行侧偏修正;满载与空载情况下,由于抓地力存在的差异需要重新计算模型等。不仅在控制模块,由于货运卡车高速行驶的特殊性,决策的难度也有所增加。图森未来的底层控制采用 Wabco 控制器,需要把平面的行驶信息还原成执行的信号,即刹车力度。
对于未来的研发方向,郝佳男提到,目前图森未来正在以单车为单位进行测试,下一步可能会以车队为单位进行测试。测试车队的好处是后车可以跟随前车,可以精减传感器,同时风阻减小进而降低油耗,凝聚力也得以提升。但是从技术的角度,车队对通信的可靠性要求比较高。图森未来正在做一些前期性的模拟,之后有计划在高速路段上实现。此外,根据具体的业务场景,人机交互也可能会成为图森未来下一个版本的更新内容。
自动驾驶卡车市场的蛋糕很大,每家公司切入点也不相同。「这个领域的竞争是一件好事,更多的人认可这件事情可以促进政策层面的推动,也能帮助图森未来走得更远。」郝佳男说。