“这是什么情况?”艾米丽·琼斯(Emily Jones)不敢相信自己竟然落后了。
艾米丽·琼斯是一名多次夺冠的顶级 GT 游戏赛车手,她拍打着她的电子竞技专用方向盘,眼睛盯着面前的屏幕:“我尽力了,但还是追不上它——它是怎么做到的?”
在游戏 GT(Gran Turismo)中,琼斯以每小时 120 英里的速度驾驶着她的赛车。为了追上世界上最快的“玩家”,她几度把车速飙到了每小时 140、150 英里。
这位“玩家”实际上是名为 GT Sophy 的人工智能。它是由索尼人工智能研究实验室在 2020 年发布的,利用人工智能技术在 GT 游戏中学习如何操控赛车。在 2021 年举行的一系列闭门活动中,索尼安排了该人工智能与顶尖 GT 赛车手同台竞技。
2021 年 7 月,琼斯作为电竞战队 Trans Tasman Racing 的一员,参与了索尼组织的活动,但当时的她并不知道会发生什么。
“没人给我提供任何信息。只是跟我说不需要做任何练习,也不要在意圈速。”她回忆道。“我的态度也很单纯,保密就保密吧,这肯定不是什么坏事。”
最后,GT Sophy 以 1.5 秒的优势击败了琼斯的最佳成绩——人类赛车手刷新 GT 纪录基本都是以毫秒为单位的,1.5 秒意味着巨大的差距。
但索尼很快了解到,仅凭速度并不足以让 GT Sophy 成为赢家。它在单人赛道上超越了人类车手,以不可思议的成绩打破了三个不同赛道的纪录。
然而当索尼将其与多个人类车手放在一起比赛时,它却输掉了——多人竞赛不仅需要速度,还需要一定的智慧。GT Sophy 有时因过于激进和鲁莽而招来罚分,有时则过于怯懦,在不需要的时候让步。
索尼重新训练了人工智能,并在 2021 年 10 月进行了第二轮比赛。这一次,GT Sophy 轻松地赢下了人类玩家。它做出了什么改变?
首先是索尼打造了一个更大的神经网络,程序的性能更加强大,但本质上的不同之处在于 GT Sophy 学会了“赛道礼仪”。
美国负责人彼得·沃曼()表示,这种礼仪被人类车手广泛遵守,其实质是平衡攻击性和让步的能力,在时刻变化的赛场中动态选择最合适的行为。
这也是使 GT Sophy 超越赛车游戏人工智能的原因。他说,车手在赛道上的互动和礼节是一个特殊例子,其中展示的动态的、情境感知的行为,正是机器人在和人互动时应该具备的。
认识到何时冒险、何时安全行事,对于人工智能来说十分有用,无论是在制造车间、家庭机器人,还是无人驾驶汽车上。
说:“我认为我们还没有学会关于如何处理必须遵循的人类规范的一般原则。但这是一个好的开始,希望它能让我们深入了解这个问题。”
GT Sophy 只是许多击败过人类的人工智能系统中的其中一个,从国际象棋到星际争霸和 DOTA2,人工智能都击败了世界上最好的人类选手。不过 GT 这个游戏给索尼提供了一种新的挑战。
与其他的、特别是那些回合制的游戏不同,GT 要求顶尖玩家在逼近物理极限(超高车速)的情况下实时控制车辆。在竞赛中,所有其他玩家都在做相同的事情。
虚拟赛车以每小时 100 英里的速度疾驰而过,车身与弯道边缘的距离只有几英寸。在这样的速度下,微小的误差都会导致碰撞。
据悉,GT 游戏以详尽地捕捉、并复刻真实世界的物理学而闻名,它模拟了赛车的空气动力学和轮胎在赛道上的摩擦。这一游戏有时甚至被用来训练和招募真实世界的赛车手。
瑞士苏黎世大学机器人和感知小组的负责人(Davide Scaramuzza)说:“它在真实程度方面做得很好。”他并没有参与 GT Sophy 项目,但他的团队曾使用 GT 游戏来训练人工智能驾驶员,目前尚未进行过针对人类的测试。
GT Sophy 参与游戏的方法与人类玩家不同。它不读取屏幕上的像素,而是获取有关自身在赛道上的位置和周围汽车的位置的数据。它还会收到关于影响其车辆的虚拟物理力量的信息。
作为回应,GT Sophy 控制汽车转弯或刹车。这种 GT Sophy 与游戏之间的交互每一秒进行 10 次,及其同事声称,这与人类玩家的反应时间相似。
索尼使用了强化学习,通过试错的方法从零训练 GT Sophy。起初,人工智能只能努力让汽车保持在路上行驶。
但经过在 10 台 PS4 上的训练后(每台运行 20 个程序实例),GT Sophy 在大约 8 小时内提升到了 GT 的内置人工智能水平,相当于业余玩家。在 24 小时内,它就接近了包含 17700 名人类玩家最佳成绩排行榜的最顶端。
GT Sophy 花了 9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。
可以说,索尼的人工智能学会了如何在游戏允许的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是 GT Sophy 的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。
她说:“GT Sophy 以一种奇怪的方式对待走线,做了一些我什至从未想过的事情。”例如GT Sophy 经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。 ”
GT Sophy 很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT 比赛由人类裁判监督,他们有权对危险驾驶扣分。
累积惩罚是GT Sophy 在2021 年7 月的第一轮比赛中失利的一个关键原因,尽管它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。
在GT Sophy 上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是GT Sophy 正在超越Yamanaka,”他说。
他指的是顶尖GT 日本车手Tomoaki Yamanaka,他是2021 年与GT Sophy 比赛的四名日本职业模拟赛车手之一。
他不记得这幅画是哪一局比赛。如果是2021 年10 月的比赛,Yamanaka 很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是2022 年7 月份的活动,他很可能会咒骂电脑莫名其妙。
Yamanaka 的队友Takuma Miyazono 通过翻译软件向我们简单描述了2022 年7 月份的比赛。他说:“有几次我们被(GT Sophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。 ”
说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以做。
索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,希望能找到一种有效的组合。如果它偏离赛道或撞到围栏上,造成了车辆碰撞或可能被裁判判罚,那么它就会受到惩罚。
他们对每种惩罚的力度进行了实验、观察和调试,并且检查了GT Sophy 的驾驶方式会如何发生变化。
索尼还增加了GT Sophy 在训练中面临的竞争。在此之前,它主要针对自身的老版本进行训练。
在2021 年10 月份的重赛之前,索尼每隔一两周就会邀请顶级GT 车手帮助测试人工智能,再综合结果不断调整。
“这给了我们所需的反馈,以便在攻击性和让步之间找到合适的平衡,”说。
这起到了效果。三个月后,当Miyazono 与GT Sophy 比赛时,后者的激进表现消失了——但它并不是简单地退缩。“当两辆车并排进入一个弯道时,GT Sophy 会给人类车手留下足够通过的空间,”他表示,“这让你感觉是在和另一个真人比赛。 ”
他补充说:“面对这种反应,车手会得到一种不同的激情和乐趣。这真的给我留下了深刻的印象。 ”
对索尼的工作印象深刻。他说:“我们用人类的能力来衡量机器人技术的进步。 ”但是,他的同事埃莉亚·考夫曼(Elia Kaufman)指出,仍然是人类研究人员主导了GT Sophy 学习行为的训练。
“良好的赛道礼仪是由人类教给人工智能的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。 ”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。
的团队现在正在将其GT 赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2022 年6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。
他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。 ”
他认为,对机器人技术的真正进步必须要拓展到现实世界。“在模拟和现实世界之间,总是会有一种不匹配的情况,”他说,“当人们谈论人工智能取得了令人难以置信的进步时,这一点就被遗忘了。在战略方面,是的。但就部署到现实世界而言,我们还差得很远。”
目前,索尼仍坚持将技术仅用在游戏中。它计划将 GT Sophy 用于未来版本的 GT 游戏中。“我们希望这能成为产品的一部分,”美国的执行总监彼得·斯通()说。“索尼是一家娱乐公司,我们希望这能让游戏更加有趣。”
琼斯认为,一旦人们有机会观摩 GT Sophy 的驾驶过程,那么整个模拟赛车社区都可以从中学到很多东西。“在许多赛道上,我们会发现很多沿袭了多年的驾驶技巧都是有缺陷的,实际上存在更快的方法。”
Miyazono 已经在尝试复制人工智能在弯道的走线方式,因为它已经展示了这是可以实现的。琼斯说:“如果基准水平发生变化,那么每个人的技术都会提升。”
以上是索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类的详细内容。更多信息请关注PHP中文网其他相关文章!
![无法使用chatgpt!解释可以立即测试的原因和解决方案[最新2025]](https://img.php.cn/upload/article/001/242/473/174717025174979.jpg?x-oss-process=image/resize,p_40)
ChatGPT无法访问?本文提供多种实用解决方案!许多用户在日常使用ChatGPT时,可能会遇到无法访问或响应缓慢等问题。本文将根据不同情况,逐步指导您解决这些问题。 ChatGPT无法访问的原因及初步排查 首先,我们需要确定问题是出在OpenAI服务器端,还是用户自身网络或设备问题。 请按照以下步骤进行排查: 步骤1:检查OpenAI官方状态 访问OpenAI Status页面 (status.openai.com),查看ChatGPT服务是否正常运行。如果显示红色或黄色警报,则表示Open

2025年5月10日,麻省理工学院物理学家Max Tegmark告诉《卫报》,AI实验室应在释放人工超级智能之前模仿Oppenheimer的三位一体测试演算。 “我的评估是'康普顿常数',这是一场比赛的可能性

AI音乐创作技术日新月异,本文将以ChatGPT等AI模型为例,详细讲解如何利用AI辅助音乐创作,并辅以实际案例进行说明。我们将分别介绍如何通过SunoAI、Hugging Face上的AI jukebox以及Python的Music21库进行音乐创作。 通过这些技术,每个人都能轻松创作原创音乐。但需注意,AI生成内容的版权问题不容忽视,使用时务必谨慎。 让我们一起探索AI在音乐领域的无限可能! OpenAI最新AI代理“OpenAI Deep Research”介绍: [ChatGPT]Ope

ChatGPT-4的出现,极大地拓展了AI应用的可能性。相较于GPT-3.5,ChatGPT-4有了显着提升,它具备强大的语境理解能力,还能识别和生成图像,堪称万能的AI助手。在提高商业效率、辅助创作等诸多领域,它都展现出巨大的潜力。然而,与此同时,我们也必须注意其使用上的注意事项。 本文将详细解读ChatGPT-4的特性,并介绍针对不同场景的有效使用方法。文中包含充分利用最新AI技术的技巧,敬请参考。 OpenAI发布的最新AI代理,“OpenAI Deep Research”详情请点击下方链

CHATGPT应用程序:与AI助手释放您的创造力!初学者指南 ChatGpt应用程序是一位创新的AI助手,可处理各种任务,包括写作,翻译和答案。它是一种具有无限可能性的工具,可用于创意活动和信息收集。 在本文中,我们将以一种易于理解的方式解释初学者,从如何安装chatgpt智能手机应用程序到语音输入功能和插件等应用程序所独有的功能,以及在使用该应用时要牢记的要点。我们还将仔细研究插件限制和设备对设备配置同步

ChatGPT中文版:解锁中文AI对话新体验 ChatGPT风靡全球,您知道它也提供中文版本吗?这款强大的AI工具不仅支持日常对话,还能处理专业内容,并兼容简体中文和繁体中文。无论是中国地区的使用者,还是正在学习中文的朋友,都能从中受益。 本文将详细介绍ChatGPT中文版的使用方法,包括账户设置、中文提示词输入、过滤器的使用、以及不同套餐的选择,并分析潜在风险及应对策略。此外,我们还将对比ChatGPT中文版和其他中文AI工具,帮助您更好地了解其优势和应用场景。 OpenAI最新发布的AI智能

这些可以将其视为生成AI领域的下一个飞跃,这为我们提供了Chatgpt和其他大型语言模型聊天机器人。他们可以代表我们采取行动,而不是简单地回答问题或产生信息

使用chatgpt有效的多个帐户管理技术|关于如何使用商业和私人生活的详尽解释! Chatgpt在各种情况下都使用,但是有些人可能担心管理多个帐户。本文将详细解释如何为ChatGpt创建多个帐户,使用时该怎么做以及如何安全有效地操作它。我们还介绍了重要的一点,例如业务和私人使用差异,并遵守OpenAI的使用条款,并提供指南,以帮助您安全地利用多个帐户。 Openai


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

禅工作室 13.0.1
功能强大的PHP集成开发环境

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具