趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命( 三 )


趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命
本文插图
基本上 , 在特斯拉官网上标明的 FSD 完全自动驾驶功能 , 还剩下一项最难的、也最能代表 L4 级自动驾驶能力的更新:在城市街道中进行自动辅助驾驶 。
为了实现这一难度最大的更新 , 特斯拉给出的最优解就是重写 AP 。
基于以上分析 , 特斯拉重写 AP 的原因便包括突破「Local Maximun」、挖掘 FSD 芯片的极限性能以及将系统能力从 L2 进化至 L4 。
4、特斯拉重写 AP , 是重写什么?
先来看看特斯拉 AP 现在最新的 AI 软件堆栈是怎么样的:
趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命
本文插图
最底层的是数据、GPU 集群以及 Dojo 计算集群 , 这一层主要进行数据采集、标注和训练 , 生成算法模型;往上走就是采用深度神经网络对模型进行分布式训练;再往上走就是用损失函数对模型进行评估;在评估层之上 , 是云端推理层和车端 FSD 芯片推理层 , 到这一层 , 意味着算法模型走完了大部分流程 , 然后就是部署到车端;在车端 , 特斯拉通过影子模式(Shadow Mode)将这些算法模型与人类驾驶行为进行比对 , 检测是否存在异常 。
趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命
本文插图
这样的从数据采集到算法部署的闭环 , 目的就是让系统性能不断迭代 , 更加优秀 。
在这个闭环当中 , 涉及到数据集、模型训练神经网络、云端和车端推理算法等等要素 。
所以 , 当数据形式从二维的图像数据(2D)转换成四维的视频级数据(4D)后 , 相应的神经网络和推理算法都需要进行重写 。
据马斯克透露 , 特斯拉 AP 新版本的深度神经网络会将包括感知、路径规划、目标识别等所有子神经网络综合于一体 。
特斯拉 AI 高级总监 Andrej Karpathy 在此前的一次演讲中表示:
「我们无法让每一个任务都享有单独的神经网络运算 , 因为同时处理的任务数实在太多 , 我们只能把一些运算分摊到共享骨干网络上」 。
趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命
本文插图
Andrej Karpathy 将这一骨干网络称为 HydraNets(Hydra 意为九头蛇) , 意思就是有一个主干网络(Backbone) , 在这个网络上有多个不同的出口(Head)来做应用 , 然后输出各自的结果 。
趣头条全面重写Autopilot,特斯拉自动驾驶的升维革命
本文插图
在特斯拉 AP 最新的 AI 软件堆栈中 , 有一个最值得关注的部分就是 Dojo 训练集群 , 这个集群可以处理海量的图像、视频数据 。
引入这一训练计算机 , 一方面是为了满足特斯拉 AP 系统此后的 4D 视频数据处理需求 。
另一方面 , 特斯拉在全球有超过 82 万辆搭载 HW 2.0/3.0 硬件的车辆每天在道路上行驶 , 可以采集海量的数据用于 AP 的训练 , 而如此海量的数据 , 必然需要具备强大计算性能计算机来进行处理 。
Dojo 还有一个特别之处在于 , 它可以与无监督学习进行配合 。
所谓无监督学习 , 就是无需人工对训练数据集进行标注 , 系统可以自行根据样本间的统计规律对样本集进行分析 , 常见任务如聚类等 。
例如无监督学习在不给任何额外提示的情况下 , 仅依据一定数量的「狗」的图片特征 , 将「狗」的图片从大量的各种各样的图片中将区分出来 。
有了无监督学习技术加持的 Dojo 计算机 , 便能以极低的成本对数据进行自动标注和训练 , 实现算法性能的指数级提高 。
不过 , 用上了无监督学习技术的特斯拉 , 依然有一支大约 500 人规模的数据标注团队 。