8月21日,谷歌母公司Alphabet旗下的自动驾驶公司Waymo在其博客公布了数据开放项目。
Waymo团队表示,将发布以高质量多模态传感器数据为主的Waymo开放数据集(Waymo Open Dataset),数据集将免费提供给研究机构,获取地址为waymo.com/open。这些数据涵盖了Waymo在收集的多种环境信息,包括白天与黑夜、黄昏和黎明、阳光和雨天,涵盖了城市中心和郊区。
“我们相信这是有史以来规模最大、最丰富和最多样化的自动驾驶数据集之一。”Waymo团队表示。
Waymo对数据集做出了详细介绍。
一是规模和覆盖范围:数据集包含1000个驾驶片段,每一片段包含20秒的连续驾驶画面。连续镜头内容可以使得研究人员开发模型来跟踪和预测其他道路使用者的行为。
二是多样化的驾驶环境:数据采集的范围涵盖凤凰城、柯克兰、山景城、旧金山等地区,以及各种驾驶条件下的数据,包括白天、黑夜、黎明、黄昏、雨天和晴天。
三是高分别率的特点和360度的视图:每个分段涵盖5个高分辨率Waymo激光雷达和五个前置和侧面传感器的数据。
四是密集的标签信息:车辆、行人、自行车、标识牌等图像都经过精心标记,一共捕获了1200个3D标签和120万个2D标签。
五是相机-激光雷达同步:Waymo称,该团队致力于融合了多个摄像头和激光雷达数据的3D感知模型。Waymo设计了全套的自动驾驶系统,包含硬件和软件,用以无缝地协同工作,其中包括选择传感器的位置和高质量的时间同步。
Waymo团队表示,在机器学习领域,拥有数据才能让想法变成现实,此次的数据开放将有可能帮助研究者在2D和3D感知、场景理解、行为预测等方面取得进步。
英国金融时报报道称,Waymo被广泛认为是在自动驾驶领域技术最为先进的公司。对于开放数据,Waymo研究负责人Drago Anguelov告诉记者,公开数据是一种“让步”,“这并不意味着我们在解决这些研究问题上存在障碍。而是我们感觉,在该领域(指自动驾驶)正因缺乏合适的数据集而发展受阻。”Waymo产品负责人Vijaysai Patnaik表示,“这一做法的意义是,我们希望赋能那些难以获取如此大量数据的研究机构。”