搜索
首页科技周边人工智能毫末DriveGPT才是大模型'卷王”!主打一个'降本、增效、老司机”

2023年中国国际服务贸易交易会以“开放引领发展,合作共赢未来”为主题,在9月6日圆满落幕。在本届服贸会上,一批在人工智能、自动驾驶、卫星遥感等领域深耕多年的领军企业,展示了它们最新的科技成果,展示了它们迈向未来的步伐

国内自动驾驶独角兽企业毫末智行的数据智能科学家贺翔带来了《毫末DriveGPT雪湖·海若,驱动自动驾驶3.0时代加速到来》的主题演讲,并在会后接受了媒体的采访,针对大模型时代自动驾驶技术研究与应用探索为我们带来了全面解读

毫末DriveGPT才是大模型卷王”!主打一个降本、增效、老司机”

图片说明:毫末智行数据智能科学家贺翔(右)正在接受媒体采访

以下是采访的记录:

主持人:贺老师能不能给我们介绍一下,毫末智行在今年的服贸会给我们带来了什么样的成果和展示?

贺翔表示,今年我们最重要的成果之一是毫末智行在4月份发布的业界首个自动驾驶生成式大模型DriveGPT

主持人:DriveGPT?听上去跟驾驶有关系?

贺翔:是的,这是一个用于解决自动驾驶领域相关问题的AI大模型,我们称之为自动驾驶生成式预训练大模型DriveGPT

主持人:生成式预训练?预训练我们怎么理解?

贺翔说:大模型的技术细节是,首先要利用海量的司机驾驶行为数据在云端进行预训练。预训练就是先将模型训练一遍,训练完后得到一个模型的原型,然后再引入司机的接管数据。所谓接管数据,指的是每次在开启自动驾驶过程中,如果自动驾驶决策不够好,司机就会发生一次接管,例如踩下刹车或扶一下方向盘。这些接管数据相当于对我们自动驾驶决策的纠正。拿到这些数据后,就可以不断对模型进行纠偏,使得模型的驾驶效果越来越好。这是一个不断纠错、不断迭代的过程,以达到更好的自动驾驶效果

主持人:可以说是对我们传统自动驾驶的一个升级。重写后的内容如下: 主持人:可以说这是对我们传统的自动驾驶进行了一次升级

贺翔:对,可以说是一种技术的变革。我们可以简单的做个对比,传统自动驾驶的技术的开发模式是当自动驾驶发现一个问题的时候,一般都会去基于这个问题,从海量的数据里面找到跟这个问题相关的数据,成本是很高的。因为海量的数据里面想要找到你要的数据没那么容易。找到这个数据之后,接下来要做的就是要把这一堆数据给标注公司,由人工的方式在这里面把问题标注出来,标注完了之后,再用这个数据去训练一个小的模型,这个模型训练完之后,再放到车上。至此这辆汽车就具备了解决这个问题的能力,我们把这种模式叫做小数据、小模型,属于“问题驱动”。

在DriveGPT这种大模型的模式之下,整个开发模式就不一样了。DriveGPT加持之下,现在的开发模式是先用海量的数据、老司机的数据、驾驶行为来进行预训练,得到一个初步的模型,这个模型就具备了驾驶的能力。当我们在自动驾驶的过程中一旦发现问题,这个司机就会发生一次接管,这个接管就相当于对驾驶决策做了一次纠正,基于这种纠正的数据再传回来纠正原来的预训练大模型,这样的数据闭环建立起来之后,这个模型的效果就会每天都在不断的进化、不断的提升。我们把这种开发模式叫做大数据、大模型,属于“数据驱动”。这是一种变革性的提升。

主持人:我们可以观察到目前自动驾驶技术的水平大约是L2级别,而现在大多数车辆已经达到了L2.5级别

贺翔: L2+,我们叫高阶辅助驾驶。

主持人:基于大模型DriveGPT的加持之下,我们可以达到什么样的水平?

贺翔:应该还是在高阶辅助驾驶阶段。我们大模型,主要是产生了两个业务价值。

第一个业务价值是在整个云端。传统的自动驾驶开发模式需要将其迁移到云端,这会带来非常高的成本,需要进行大量的数据筛选,尤其是需要人工参与和大量的人工标注。然而,有了大模型之后,整个数据的筛选、标注以及数据的生成都可以实现全自动化,这对成本的降低非常有效

举例来说,在标注领域,自动驾驶公司以往每年用于做标注的成本肯定高达数亿元,有了DriveGPT之后,可以对图片或者视频做自动化的标注,如果做视频标注或者4D Clips标注,大概能降低98%成本。即使只对单张图片做标注,成本也可以降低90%。云端的成本能得到大幅度的降低。

第二个业务价值是在车端,效果能够得到大幅度的提升。模型是基于海量的数据训练出来的,海量的数据就相当于我们的模型看过了非常非常多的数据,各种各样的场景它都见过,见多识广它的能力就越强。这种能力叫做模型或者AI的泛化能力。有了泛化能力之后,自动驾驶的效果也会更好。

此外,整个模型是基于“老司机”的驾驶行为数据训练的,是质量非常高的数据,它的整个驾驶效果或者驾驶的体感会更接近“老司机”。用户在使用的过程中会觉得驾驶体感或者说体验会更好。

第三点,我们的大型模型具有一种特殊的能力,即能够输出驾驶决策的理由。例如,当采取“踩一下刹车”或者“打了一下方向盘”这样的驾驶决策时,我们的模型能够解释为什么要这样做。如果能够提供这样的解释,智能驾驶车辆与用户之间就能够建立起很好的信任关系,用户在使用自动驾驶产品时会更加放心

通过基于大型模型和数据闭环的不断迭代,目前的高级辅助驾驶仍然需要司机随时接管。未来希望通过持续的迭代升级,逐渐实现真正的无人驾驶

主持人:从这个角度来看,不仅降低了成本,还提高了效率

贺翔说:“不需要司机一次又一次地自己去试错,大数据可以帮忙解决这个问题。它可以收集所有司机的接管行为,从而一次性解决所有的问题。这样,驾驶效果的提升速度会非常快。”

以上是毫末DriveGPT才是大模型'卷王”!主打一个'降本、增效、老司机”的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:机器之心。如有侵权,请联系admin@php.cn删除
Simpson的悖论如何发现数据中隐藏的趋势? - 分析VidhyaSimpson的悖论如何发现数据中隐藏的趋势? - 分析VidhyaApr 23, 2025 am 09:20 AM

辛普森的悖论:揭示数据中的隐藏趋势 您是否曾经被统计数据误导?辛普森(Simpson)的悖论展示了汇总数据如何掩盖关键趋势,从而揭示了分析多个级别数据的重要性。这个简洁的gui

什么是名义数据? - 分析Vidhya什么是名义数据? - 分析VidhyaApr 23, 2025 am 09:13 AM

介绍 名义数据构成了数据分析的基石,在统计,计算机科学,心理学和营销等各个领域中起着至关重要的作用。 本文深入研究了Nomi的特征,应用和区分

什么是一声提示? - 分析Vidhya什么是一声提示? - 分析VidhyaApr 23, 2025 am 09:12 AM

介绍 在机器学习的动态世界中,使用最小数据有效生成精确的响应至关重要。 一声提示提供了一个强大的解决方案,使AI模型仅使用一个示例执行特定任务

特斯拉的Robovan是2024年的Robotaxi预告片中的隐藏宝石特斯拉的Robovan是2024年的Robotaxi预告片中的隐藏宝石Apr 22, 2025 am 11:48 AM

自2008年以来,我一直倡导这辆共享乘车面包车,即后来被称为“ Robotjitney”,后来是“ Vansit”,这是城市运输的未来。 我预见这些车辆是21世纪的下一代过境解决方案Surpas

Sam俱乐部在AI上押注以消除收据检查并增强零售Sam俱乐部在AI上押注以消除收据检查并增强零售Apr 22, 2025 am 11:29 AM

革新结帐体验 Sam's Club的创新性“ Just Go”系统建立在其现有的AI驱动“扫描和GO”技术的基础上,使会员可以在购物旅行期间通过Sam's Club应用程序进行扫描。

Nvidia的AI Omniverse在GTC 2025扩展Nvidia的AI Omniverse在GTC 2025扩展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增强可预测性和新产品阵容 NVIDIA是AI基础架构的关键参与者,正在专注于提高其客户的可预测性。 这涉及一致的产品交付,达到绩效期望以及

探索Google的功能探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2:强大,高效的语言模型 Google的Gemma语言模型家族以效率和性能而庆祝,随着Gemma 2的到来而扩展。此最新版本包括两种模型:270亿个参数VER

下一波《 Genai:与Kirk Borne博士的观点》 -Analytics Vidhya下一波《 Genai:与Kirk Borne博士的观点》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

这一领先的数据剧集以数据科学家,天体物理学家和TEDX演讲者Kirk Borne博士为特色。 Borne博士是大数据,AI和机器学习的著名专家,为当前状态和未来的Traje提供了宝贵的见解

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!