毫末DriveGPT才是大模型'卷王”！主打一个'降本、增效、老司机”-人工智能-PHP中文网

首页

科技周边

人工智能

毫末DriveGPT才是大模型'卷王”！主打一个'降本、增效、老司机”

王林

Sep 17, 2023 am 09:01 AM

产业

2023年中国国际服务贸易交易会以“开放引领发展，合作共赢未来”为主题，在9月6日圆满落幕。在本届服贸会上，一批在人工智能、自动驾驶、卫星遥感等领域深耕多年的领军企业，展示了它们最新的科技成果，展示了它们迈向未来的步伐

国内自动驾驶独角兽企业毫末智行的数据智能科学家贺翔带来了《毫末DriveGPT雪湖·海若，驱动自动驾驶3.0时代加速到来》的主题演讲，并在会后接受了媒体的采访，针对大模型时代自动驾驶技术研究与应用探索为我们带来了全面解读

毫末DriveGPT才是大模型卷王”！主打一个降本、增效、老司机”

图片说明：毫末智行数据智能科学家贺翔（右）正在接受媒体采访

以下是采访的记录：

主持人：贺老师能不能给我们介绍一下，毫末智行在今年的服贸会给我们带来了什么样的成果和展示？

贺翔表示，今年我们最重要的成果之一是毫末智行在4月份发布的业界首个自动驾驶生成式大模型DriveGPT

主持人：DriveGPT？听上去跟驾驶有关系？

贺翔：是的，这是一个用于解决自动驾驶领域相关问题的AI大模型，我们称之为自动驾驶生成式预训练大模型DriveGPT

主持人：生成式预训练？预训练我们怎么理解？

贺翔说：大模型的技术细节是，首先要利用海量的司机驾驶行为数据在云端进行预训练。预训练就是先将模型训练一遍，训练完后得到一个模型的原型，然后再引入司机的接管数据。所谓接管数据，指的是每次在开启自动驾驶过程中，如果自动驾驶决策不够好，司机就会发生一次接管，例如踩下刹车或扶一下方向盘。这些接管数据相当于对我们自动驾驶决策的纠正。拿到这些数据后，就可以不断对模型进行纠偏，使得模型的驾驶效果越来越好。这是一个不断纠错、不断迭代的过程，以达到更好的自动驾驶效果

主持人：可以说是对我们传统自动驾驶的一个升级。重写后的内容如下：主持人：可以说这是对我们传统的自动驾驶进行了一次升级

贺翔：对，可以说是一种技术的变革。我们可以简单的做个对比，传统自动驾驶的技术的开发模式是当自动驾驶发现一个问题的时候，一般都会去基于这个问题，从海量的数据里面找到跟这个问题相关的数据，成本是很高的。因为海量的数据里面想要找到你要的数据没那么容易。找到这个数据之后，接下来要做的就是要把这一堆数据给标注公司，由人工的方式在这里面把问题标注出来，标注完了之后，再用这个数据去训练一个小的模型，这个模型训练完之后，再放到车上。至此这辆汽车就具备了解决这个问题的能力，我们把这种模式叫做小数据、小模型，属于“问题驱动”。

在DriveGPT这种大模型的模式之下，整个开发模式就不一样了。DriveGPT加持之下，现在的开发模式是先用海量的数据、老司机的数据、驾驶行为来进行预训练，得到一个初步的模型，这个模型就具备了驾驶的能力。当我们在自动驾驶的过程中一旦发现问题，这个司机就会发生一次接管，这个接管就相当于对驾驶决策做了一次纠正，基于这种纠正的数据再传回来纠正原来的预训练大模型，这样的数据闭环建立起来之后，这个模型的效果就会每天都在不断的进化、不断的提升。我们把这种开发模式叫做大数据、大模型，属于“数据驱动”。这是一种变革性的提升。

主持人：我们可以观察到目前自动驾驶技术的水平大约是L2级别，而现在大多数车辆已经达到了L2.5级别

贺翔： L2+，我们叫高阶辅助驾驶。

主持人：基于大模型DriveGPT的加持之下，我们可以达到什么样的水平？

贺翔：应该还是在高阶辅助驾驶阶段。我们大模型，主要是产生了两个业务价值。

第一个业务价值是在整个云端。传统的自动驾驶开发模式需要将其迁移到云端，这会带来非常高的成本，需要进行大量的数据筛选，尤其是需要人工参与和大量的人工标注。然而，有了大模型之后，整个数据的筛选、标注以及数据的生成都可以实现全自动化，这对成本的降低非常有效

举例来说，在标注领域，自动驾驶公司以往每年用于做标注的成本肯定高达数亿元，有了DriveGPT之后，可以对图片或者视频做自动化的标注，如果做视频标注或者4D Clips标注，大概能降低98%成本。即使只对单张图片做标注，成本也可以降低90%。云端的成本能得到大幅度的降低。

第二个业务价值是在车端，效果能够得到大幅度的提升。模型是基于海量的数据训练出来的，海量的数据就相当于我们的模型看过了非常非常多的数据，各种各样的场景它都见过，见多识广它的能力就越强。这种能力叫做模型或者AI的泛化能力。有了泛化能力之后，自动驾驶的效果也会更好。

此外，整个模型是基于“老司机”的驾驶行为数据训练的，是质量非常高的数据，它的整个驾驶效果或者驾驶的体感会更接近“老司机”。用户在使用的过程中会觉得驾驶体感或者说体验会更好。

第三点，我们的大型模型具有一种特殊的能力，即能够输出驾驶决策的理由。例如，当采取“踩一下刹车”或者“打了一下方向盘”这样的驾驶决策时，我们的模型能够解释为什么要这样做。如果能够提供这样的解释，智能驾驶车辆与用户之间就能够建立起很好的信任关系，用户在使用自动驾驶产品时会更加放心

通过基于大型模型和数据闭环的不断迭代，目前的高级辅助驾驶仍然需要司机随时接管。未来希望通过持续的迭代升级，逐渐实现真正的无人驾驶

主持人：从这个角度来看，不仅降低了成本，还提高了效率

贺翔说：“不需要司机一次又一次地自己去试错，大数据可以帮忙解决这个问题。它可以收集所有司机的接管行为，从而一次性解决所有的问题。这样，驾驶效果的提升速度会非常快。”