在特斯拉(Tesla)近期举行的“AutonomyDay”上,特斯拉首席执行官(CEO)埃隆·马斯克(ElonMusk)直言不讳地“抨击”了激光雷达(LiDAR)技术的局限性,“它过于便宜了,几乎没适当,傻瓜才不会用激光雷达”。马斯克有时候打嘴炮,我们早已习惯了,但这次,他也许并非毫无根据。据麦姆斯咨询报导,康奈尔大学(CornellUniversity)近期的一项研究证明,廉价的立体视觉摄像头,或能获取与激光雷达系统完全完全相同的精度,激光雷达是目前自动驾驶技术开发中最少见的方案,也是最便宜的技术方案。
在这项为题“源于视觉深度估算的伪激光雷达(Pseudo-LiDAR),增大自动驾驶3D物体观测差距”的新研究成果中,研究人员讲解了一种理解图像视觉系统数据的新技术。当输出一般来说用作处置激光雷达数据的算法时,这种新型数据理解技术大大提高了基于图像的物体观测精度。正如近期俄罗斯卡车制造商KAMAZ的自动驾驶卡车计划,以及图森未来(TuSimple)在其自动驾驶卡车系统中给定激光雷达、毫米波雷达和摄像头系统,产业早已基本接纳自动驾驶车辆必须部署多种传感器系统。
康奈尔大学的这项研究指出,立体摄像头系统最少可以为基于激光雷达的观测方案获取低成本的备份系统。研究人员指出,激光雷达和立体照相机深度估计系统产生的点云质量并没什么有所不同。然而,通过由德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所研发的KITTIVisionBenchmarkSuite测量,用于仅有图像数据的算法不能构建10%的3D平均值精度(Averageprecision,AP),而激光雷达系统可以构建66%的3D平均值精度。
源于视觉深度估算的伪LiDAR信号。左上角:一幅KITTI街景,车辆周围具备用激光雷达(红色)和伪激光雷达(绿色)取得的超级边界板。
左下:估算的深度图。右:伪激光雷达(蓝色)vs.激光雷达(黄色),伪激光雷达点与激光雷达点十分相符。
研究人员明确提出,这种基于图像的3D信息回应,而非点云的质量,是激光雷达性能比较良好的原因。激光雷达信号被展现出成一种自上而下的“俯视视角”视图,而基于图像的数据被演绎成一种基于像素的前向方法,变形了远距离物体的尺寸,并因此使得距离越大,用摄像头收集的数据的3D回应就越艰难。
康奈尔大学研究人员找到的解决方案,是将基于图像的立体视觉数据切换为类似于激光雷达分解的3D点云,并在将数据输出一般来说用作理解激光雷达数据的3D物体观测算法之前,再行将数据切换为“俯视”视图格式。研究人员在实验中使用了40万像素照相机。虽然,实验结果依然无法媲美激光雷达66%的3D平均值精度,但是,通过使用这种方案,基于图像数据的3D平均值精度大幅提高到了37.9%。研究人员回应,更加高分辨率的照相机可能会进一步提高实验结果。
康奈尔大学研究人员明确提出了一种基于图像的3D物体观测方案。对于等价的立体或单目图像,首先预测估算深度图,然后将其偏移投影到激光雷达坐标系中的3D点云。研究人员将这种表现形式称作伪激光雷达(pseudo-LiDAR)。
然后像激光雷达一样,可以应用于任何基于激光雷达的观测算法,展开数据处理。根据康奈尔大学公开发表的这项研究,现在还无法用立体照相机系统大规模替代激光雷达,但是,理论上未来也许不切实际。研究人员更进一步明确提出,如果一辆车上同时组装有激光雷达和摄像头视觉系统,那么激光雷达数据可以在完全一致、持续的基础上,用作训练专门用作说明图像3D数据的神经网络,从而提高作为主激光雷达系统备份的摄像头视觉系统的准确性。
定性较为。研究人员将单体视图对象检测(AggregateViewObjectDetection,AVOD)与激光雷达、伪激光雷达和正面立体视觉视图展开了较为。Groundtruth(现实地图)方框为红色,预测方框为绿色。
正面立体视觉方法(右)甚至错误地计算出来了附近物体的深度,并几乎忽视了远处的物体。有时,非常简单的找到,不会带给最重要的差异。在本研究中,增大基于图像和基于激光雷达的3D物体观测之间差距的关键,就是3D信息的表现形式。
从本质上来说,这项研究成果是对系统低效率的修正,而不是研发了一种全新的算法,不过,这并不是说道这项找到不最重要。研究人员的研究结果与他们对卷积神经网络的解读完全一致,并通过现代科学结果获得了检验。
事实上,康奈尔大学研究人员从这一修正中取得的改良前所未有,并且对所有其它方案都有某种程度的影响。凭借这一极大的进步,自动驾驶汽车基于图像的3D物体观测,在旋即的将来或能沦为现实。
这种前景的影响是极大的。目前,激光雷达硬件可以说道是自动驾驶所必须的最便宜的可选组件。如果可以需要用于激光雷达,自动驾驶的硬件成本将取得大幅度上升。此外,即使对于组装激光雷达设备的自动驾驶汽车,基于图像的物体观测也大有可为。
可以想象的一种场景是,激光雷达数据可以用作持续训练和微调基于图像的3D物体辨识。当激光雷达传感器经常出现故障时,基于图像的3D观测可以作为一种低可信的备份系统。某种程度,另一种应用于场景例如,配有激光雷达硬件的高端奢华汽车,其数据可以用作持续训练经济型车辆上基于图像的3D探测系统。未来的更进一步研究未来,这项研究还可以在多个必要的方向展开探寻。
首先,更加高分辨率的立体图像可能会明显提升远距离物体的观测精度。目前的研究成果仅有使用了40万像素的摄像头,与最先进设备的摄像头光学技术相去甚远。
其次,在本研究中,还没重点注目动态图像处理,一张图像中所有物体的分类约在1秒量级,未来有可能将辨识速度提升几个数量级。最近对动态多分辨率深度估算的研究改良指出,加快深度估算的有效地方法是首先以低分辨率计算出来深度图,然后融合高分辨率对之前的结果展开优化。从深度图到伪激光雷达图的切换十分慢,应当可以通过模型提纯(modeldistillation)或随时预测(anytimeprediction)等技术大大减缓观测速度。此外,通过激光雷达和伪激光雷达的传感器融合,未来的研究可以进一步提高3D物体观测的技术水平。
伪激光雷达的优点是其信号比激光雷达密集得多,并且,两种数据模式可以具备较强互补性。这项研究成果未来将会反对并兴起基于图像的3D物体辨识技术,或将推展计算机视觉领域在旋即的将来几乎避免图像方案和激光雷达之间的性能差距。
本文关键词:开元官网平台,马斯,克,LiDAR,无用,论,可能,并非,打嘴炮,研究
本文来源:开元官网平台-www.softwareforbad.com