数据标注,自动驾驶汽车的新“引擎”丨曼孚科技
1.汽车自动驾驶真的来了
2018年,世界上首个无人出租车正式上路。这是硅谷初创公司 Drive.ai 在美国得克萨斯州 Frisco 实现的第一批无人出租车出行。
国内领域,百度是汽车自动驾驶行业的佼佼者。今年11月30日,百度在广州开启了RoboTaxi的试运营服务,这是百度的自动驾驶出租车在长沙试运营后,又一个城市开始了自动驾驶汽车的试运营。
如果算上滴滴年底在上海推出自动驾驶出租车的计划,2019年有可能在三座城市中看到自动驾驶出租车的身影。
可以说,自动驾驶汽车真的要来了。
2.汽车自动驾驶背后的技术支持
在汽车自动驾驶的过程中,汽车本身需要具备感知、策划、决策、控制等多项“技能”,这些技能可以统称为“人工智能”。
然而,所谓的智能只是一个结果,想要让汽车本身的算法做到处理更多、更复杂的场景,背后就需要有海量的真实道路数据做支撑。
而这就需要依靠数据标注。
数据标注存在的意义是让机器理解并认识世界。在汽车自动驾驶领域,数据标注处理的标注场景通常包括换道超车、通过路口、无红绿灯控制的无保护左转、右转,以及一些复杂的长尾场景诸如闯红灯车辆、横穿马路的行人、路边违章停靠的车辆等等。
3.汽车自动驾驶领域常用的几种数据标注工具
数据标注通常处理的数据类型有语音、文本、图像等内容,标注的类型有分类、画框、注释、标记等等,具体到汽车自动驾驶领域,经常使用的标注工具有2D框、3D立方体、车道线、多边形、语义分割等等。
我们从曼孚科技数据标注后台挑选了几张示例图,可以帮助大家对标注场景有更好的理解:
曼孚科技2D框标注效果图
曼孚科技3D立方体标注效果图
曼孚科技车道线标注效果图
曼孚科技多边形标注效果图
曼孚科技语义分割标注效果图
正是有了以上这些标注好的数据做支撑,自动驾驶汽车才可以畅行在科技的快车道。
4.高质量的数据才是行业的未来
随着自动驾驶汽车开始从实验室走向现实,自动驾驶汽车的安全性就越来越受到社会的广泛关注。
作为自动驾驶技术的基础,标注数据质量的高低直接影响最终模型效果的好坏。海量且高质量、精细化的数据可以在很大程度上提升汽车自动驾驶的安全性与实用性,助推自动驾驶落地化进程。
事实上,汽车自动驾驶领域对于标注数据质量的新要求也是数据标注行业未来发展方向的一个重要缩影。与人工智能行业“高精尖”、“高科技含量”的标签不同,数据标注仍然属于劳动密集型产业,长期处于粗放的状态中。
随着以汽车自动驾驶为代表的人工智能项目开始纷纷落地,越来越多的AI企业意识到,高质量的数据集是影响人工智能项目落地的关键。
未来,精细化、场景化、定制化将是数据标注行业发展的重要方向,产业变革的大门已然开启,高质量的标注数据集将撑起人工智能行业新的未来。