新交通 - 交通科技第一新媒体新交通微信号

Scale AI发布免费激光雷达数据集,助力汽车自动驾驶

2020-05-29 11:43来源:新交通
  高质量的数据是驱动人工智能算法的燃料。如果没有连续的标记数据流,就会出现瓶颈,算法会慢慢变差,给系统增加风险。 这就是为什么标签数据对于Zoox、Cruise和Waymo等公司来说是如此重要的原因,这些公司利用标签数据来训练机器学习模型,以开发和部署自主车辆。
  正是这种需求催生了Scale-AI,这家初创公司利用软件和人员来处理和标记图像、激光雷达和地图数据,为构建机器学习算法的公司服务。Airbnb、Pinterest和OpenAI等公司也在使用该平台。
  该公司与激光雷达制造商和硕(Hesai)合作,于本周推出了一个名为PandaSet的开源数据集,可用于训练自动驾驶的机器学习模型。该数据集是免费的,可用于学术和商业用途,包括使用Hesai的具有类似图像分辨率的前向PandarGT激光雷达以及其机械旋转激光雷达Pandar64收集的数据。据该公司称,这些数据是在旧金山和硅谷的市区行驶时收集的。
  Scale首席执行官兼联合创始人亚历山德王(Alexandr Wang)在最近的一次采访中告诉TechCrunch:“人工智能和机器学习是不可思议的技术,具有难以置信的潜在影响,但也会给人带来巨大的痛苦。”。“机器学习绝对是一种垃圾输入、垃圾输出的框架——你真的需要高质量的数据来支持这些算法。这就是我们建立规模的原因,也是我们今天使用这些数据集从开源角度推动行业发展的原因。”
  这个激光雷达数据集的目标是免费访问一个密集和内容丰富的数据集,Alexandr Wang说,这是通过在充满汽车、自行车、交通灯和行人的复杂城市环境中使用两种激光雷达来实现的。
  该数据集包括超过48000张相机图像和16000次激光雷达扫描,据该公司称,超过100个8秒的场景。它还包括每个场景的28个注释类和大多数场景的37个语义分段标签。例如,传统的长方体标签,那些放在自行车或汽车周围的小盒子,不能充分识别所有的激光雷达数据。因此,Scale使用一个点云分割工具精确地标注复杂的对象。
  开源AV数据并不完全是新生的。去年,Aptiv和Scale发布了nuScenes,一个来自自主车辆传感器套件的大规模数据集。Argo-AI、Cruise和Waymo等多家AV公司也向研究人员发布了数据。Argo-AI发布了精确的数据和高清地图,而Cruise共享了一个数据可视化工具Webviz,它将从机器人上的所有传感器收集的原始数据转换成视觉效果。
责任编辑:新交通
分享
您可能更感兴趣的文章

名企动态

阅读排行