自动驾驶数据服务进入2.0时代
编者荐语: 在“数据服务2.0时代”,软件定义汽车带来了对功能迭代升级频率的高要求,其本质则是数据资产的价值竞争。对于数据服务供应商而言,能够深度绑定汽车全生命周期,并提供完整、高质量的数据供应服务,在当下至关重要。 以下文章来源于高工智能汽车 ,作者特别报道。
导语:何谓“数据服务2.0时代”?高工智能汽车认为,过去,数据标注多数只服务于自动驾驶POC项目,属于“一锤子买卖”。而在2.0时代,软件定义汽车带来了对功能迭代升级频率的高要求,背后则是每家车企积累的数据资产的价值竞争,并直接影响汽车智能化的功能优化和体验升级能力。 过去几年,尽管自动驾驶的技术迭代速度不断加快,但商业化一直是横亘在所有自动驾驶从业者面前的一座大山。而现如今,无论是环卫、干线物流,还是港口、矿山等场景下,自动驾驶的商业化号角已经吹响。 而在商业化落地的阶段中,自动驾驶面临的挑战往往不是自动驾驶技术本身,而是客户要求自动驾驶公司能够快速适配各种车型的同时,还要快速适配多种应用场景。 由此,自动驾驶公司则需要更多数据燃料来不断地进行产品迭代。相应地,行业对于数据标注与处理的需求量也在水涨船高。 另一方面,随着大算力智驾平台在未来几年的规模化落地以及辅助驾驶普及的加快,配套的车载传感器市场也进入了一个高增长周期。 高工智能汽车研究院监测数据显示,在前装市场,传感器的搭载量正处于上升周期。今年一季度前装搭载主要舱外ADAS相关摄像头835.97万颗,同比增长41.35%。前向双目、三目,周视等更多摄像头配置成为主流,基于数据认知的训练也成为刚需。 尤其是4D毫米波雷达以及激光雷达的搭载也正处于最关键的导入期,这带来了一个全新的市场:多传感器感知的数据融合。此外,舱内人机交互的体验升级,也同样需要数据迭代支持。这也再次表明,无论是在自动驾驶还是辅助驾驶领域,数据标注的需求量都将迎来增长的高峰期。 以一辆搭载8个摄像头(前向3颗、周视4颗、后视1颗)的智能汽车为例,每个摄像头以30帧/秒的速度拍摄1小时,将会产生约86万帧的图片,按10万辆存量车计算,就是接近1000亿帧的数据。即便其中有大部分数据可以进行快速自动化过滤处理,剩下的需要精确标注的数量仍然非常惊人,这还不包括雷达的融合数据。 总体上,企业的数据科学和开发所需机器学习 (ML) 模型的能力已经成熟。然而,他们中的许多人开始意识到真正的挑战在于整个 AI 生命周期中的数据。
数据生产瓶颈
众所周知,自动驾驶想要真正落地,就需要大量高质量的、安全无偏差的数据。与此同时,下游企业对数据也在不断地提出更高的要求。 但某自动驾驶公司负责人表示,获取低成本、高质量的数据依然是当前行业发展的一大痛点。普遍而言,企业并没有过多的资源投入数据标注工作。因此,全球绝大多数企业都在某种程度上采用了专业数据供应商的服务——这也意味着数据采集、分析处理和管理是AI面临的首要挑战。 另一方面,在与诸多客户对接的过程中,数据标注公司也逐渐发现,自动驾驶公司对于数据服务强有力的诉求便是随着算法的调整,标注公司可以实现灵活配合。例如,随着算法的更迭与进步,下游客户对于数据标注的准确度会由原来的90%提升至95%,甚至99.99%。 然而,对于数据标注公司来讲,质量的提升也就意味着更多的成本的投入,这与下游客户对于成本的控制又相违背。因此,目前的当务之急便是在提升数据质量的同时又能降低成本。 此外,自动驾驶在不同细分场景的快速开拓意味着下游客户的研发势必会出现波峰与波谷,这也就需要数据标注公司提供持续稳定的产能来应对客户的弹性需求。而对于多数数据服务商而言,这势必带来了更高难度的挑战。 比如,在高阶智能驾驶传感器配置上,摄像头的数量在快速增加。高工智能汽车研究院监测数据显示,今年一季度,ADAS周视/后视摄像头搭载量为69.39万颗,同比增长93.66%。这是基于360车身感知在高阶智能驾驶上的重要性,也带来了区别以往仅仅是关注前向感知数据标注的新市场。 在具体技术方案上,环绕感知系统采用前视、周视、环视、后视实现360度环绕感知,能够精确识别、定位、追踪动态和静态物体,包括车辆、行人、自行车、电动车、车道线、标识牌、交通灯、可行驶区域等。 同时,加上高分辨率毫米波雷达、激光雷达的融合感知,意味着数据类型、数据量都比普通的前向感知方案增加几个数量级。 针对上述痛点,业内一家有着超过25年历史的人工智能训练数据服务的“尖子生”——澳鹏给出了自己的答案:由于深度学习算法是算力与大数据的产物,因此深度学习算法模型的工业化优化,也就需要AI数据供应链的工业化。
“工业化即以自动化、标准化和规模化可扩展方式为标志。此前,AI标注数据的供应基本以作坊式为主,难以保证AI标注数据的高质量供给,接下来AI标注数据的供给将迎来工业化爆发。”澳鹏数据科技(上海)有限公司产品及研发总监钱程表示。 钱程介绍,在数据的整个生产环节中,数据获取、数据准备和模型评估最为费力并涉及海量数据。如果处理不当,可能会导致项目质量问题和项目启动延迟。AI从业者将80%以上的时间都花在数据管理上,因此他们需要最佳的工具和服务来完成这一过程中极其关键的部分。澳鹏专注研究这三个阶段,并与专业从事模型训练和部署的供应商建立战略合作伙伴关系。 澳鹏数据科技(上海)有限公司销售副总裁马冀则表示:“毫米波和4D代表了未来的标注方向,对服务商的标注能力以及研发能力都有很高的要求。澳鹏会陪伴客户共同探索和发展高精尖标注诉求。目前我们已经有毫米波、4D点云标注等项目正在和客户积极研讨中,期待在今年第三季度会有不错的进展。” 联系我们,了解澳鹏如何帮助您应对自动驾驶中的数据挑战。
澳鹏提供自动驾驶以及智能驾舱的全面数据采集标注服务,包括海外路采、语义分割、3D标注、4D标注、语音标注以及驾舱标注等,为您的智能驾驶人工智能提供高质量数据支持。