您当前的位置 : 行业动态

加快自动驾驶落地,只能寄望于数据开放?

来源: 雅斯顿  作者:
2019-07-31 08:44:07
分享:

  自动驾驶领域正在从技术积累向数据共享的阶段发展。

  今年以来,多个自动驾驶研发团队陆续宣布开放自动驾驶数据集,其中,Waymo的数据包含了3000个驾驶场景,长达16.7小时,Lyft的公开数据则涵盖了5.5万张3D高清截图。在此之前,百度也在去年开放了AppolloScape的大规模自动驾驶数据。

  1数据的意义

  2014年9月,美国加州颁发了全球首张自动驾驶路测许可证,截至2018年底,在加州获得无人驾驶路测牌照的企业已经超过60家。在中美两国,一大批主机厂和科技公司正在奔赴自动驾驶的技术竞赛。

  按照商业咨询公司IHS Markit的预测,到了2040年,全自动驾驶汽车的销量将达到3300万辆,成为一个价值7万亿美元的市场。

  虽然目前全球乘用车市场仅停留在L2级别驾驶辅助技术的普及阶段,但没有人会否认自动驾驶的发展意义。尤其在中国,截至今年6月,中国内地已经有18个城市发放了自动驾驶的路测牌照,50家企业参与其中,拿到的牌照接近200张。在对外宣传上,这是科技公司和主机厂的实力体现,但回到行业意义上,每一张牌照背后的车辆数据都在推动自动驾驶技术的量产落地。

  数年前,自动驾驶领域曾经掀起了一场算法与数据之争。在自动驾驶技术的发展进程中,到底是数据重要,还是算法重要?

  谷歌的支持者认为,其在大数据层面的优势决定了Waymo可以超越绝大多数车企,为自动驾驶的深度学习提供足够充分的数据支持。公共道路、尤其是城市驾驶中的复杂性并不是所有公开测试路段可以覆盖的,但哪怕1%的风险场景都有可能带来100%的意外事故。

  因此,自动驾驶领域的道路测试和数据收集,很重要的一个作用是系统完善,当拥有自动驾驶技术的车辆更多地投入到市场,就能从中收集更多的行驶数据,以提高系统的学习和处理能力。

  在自动驾驶技术发展的初期,企业对数据的所有权非常谨慎,一方面,各家收集的数据代表着它们的用户、资源和技术,另一方面,海量数据最终指向的是系统算法与模型。这一度被认为是各家的重要产权和商业机密。即便美国曾经在政府层面要求各企业在无人驾驶测试车辆发生事故是共享相关数据,企业的反应也不甚热情。

  2、数据从何而来

  前些年关于Waymo和特斯拉无人驾驶技术之争,一个重要观点是两者的数据来源。2016年,特斯拉在全球市场落地的车辆超过30万辆,而Waymo投放到道路测试的车辆只有不到600辆。争议在于,两者在真实道路中收集的真实数据是不一样的。

  特斯拉坚持从真实用户使用Autopilot的过程中收集收据,但截止2016年行驶数据不到2亿公里,而Waymo擅长的是虚拟驾驶,即便在真实路况下仅收集了800万公里数据,但在虚拟行驶过程中已经有超过80亿公里。

  特斯拉的支持者指出,在人类复杂多变的驾驶习惯和道路状况中,只有真正来自公开道路的数据才是对自动驾驶技术进步有意义的。然而,特斯拉采用的数据收集方式仅来自于超声波传感器和摄像头,而Waymo则来自于激光雷达传感器、雷达传感器和摄像头。但特斯拉由于没有采用激光雷达,同样被指责数据的精准度不足。

  Waymo被认为更具有技术优势,除了数据收集领域,还包括了数据处理方式。Waymo设计的城市全电脑模型每天可以测试2.5万辆虚拟无人驾驶汽车,这种封闭的数据回路可以让Waymo在海量驾驶数据中反复测试成千上万种变化场景。相比之下,特斯拉认为从真实路况中收集数据再对Autopilot进行培训学习,本身就是一个庞大工程。

  两者在数据收集和处理上,技术差异显而易见。事实也证明了,Waymo从虚拟场景中获得的海量数据和反复测试验证,对系统的技术提升有很大帮助。去年谷歌在一份“自动驾驶脱离报告”中获得最佳成绩,大约行驶17950公里才出现一次人工接管系统的情况。特斯拉在这份报告中的成绩几乎垫底。

  值得注意的是,虽然理论上Waymo的自动驾驶系统能够在更多出行场景中作出更加聪明的选择,但真正的考验仍需要放到更加真实的出行场景中。如今Waymo的测试车辆数量不够大、测试路况相对宽松,这些都严重制约了这套自动驾驶系统接受安全性考验。

  3、数据竞赛

  自动驾驶车辆数据共享的重要性得到了整个行业的认可,但出于行业竞争、产权保护等等方面的考虑,企业之间大概不会无私贡献所有数据,同时也不会完全信任公开数据。

  一向以数据优势自居的Waymo在近期公布了开放数据集Waymo Open Dataset,其中包括3000段驾驶记录,每段视频平均时长20秒,总长度16.7小时。

  业内统计,这个公开数据集包含了超过60万帧的图像数据,对无人驾驶领域的技术研发和学术研究都有很大的参考意义。即便这些数据比起Waymo数十亿的行驶里程,仅仅是冰山一角,但作为目前自动驾驶领域最领先的企业之一,Waymo的高质量数据足以给行业研究提供极具价值的信息。与此同时,这60万帧数据背后,也是行业对于Waymo传感器技术的考察和研究。

  Waymo率先亮出数据之后,多家企业迅速跟进、甚至反击。最开始是通用和宝马等传统车企表示要组成“移动开放区块链计划联盟”,推动各家企业打破数据壁垒,彼此开放有价值的数据,以加快自动驾驶技术的提升。

  另一种模式是数据量的比拼。紧随Waymo之后, Lyft也表示将会公开一套自动驾驶数据集,其中包括了5.5万张3D高清截图,并自称“业内最大的自动驾驶公共数据集”。

  作为一家网约车公司,Lyft在2016年加入到自动驾驶研发领域之后,其选择的发展思路是与多个先进的科技公司进行合作,其中包括Aptiv、Cruise甚至Waymo。与Uber从零开始所经受的各种质疑和考验不同,Lyft只在意与之合作的伙伴是否领先。简单来说,Lyft要做的只是一个开放生态平台,只不过,基于Lyft目前在美国布局的网约车网络,Lyft与其合作伙伴可以通过更广泛和真实的运营场景收获数据。

  从技术之争到数据之争,自动驾驶企业的竞赛本质上是加快自动驾驶技术落地到真实场景。今年,通用Cruise延迟自动驾驶出租车计划,让整个行业意识到,自动驾驶技术落地仍然极具挑战。以Waymo为首的车企开始公开数据,看似推动了行业的发展,让自动驾驶汽车更早上路,但实际上,数据背后代表的技术优势已经开始让这些企业抛离对手。新一轮的竞争才刚刚开始。

  本文由长城网汽车频道内容合作方“雅斯顿”授权转载。

关键词:自动驾驶,数据,共享责任编辑:刘复宁