AI耗时7千小时通关《宝可梦》首个道馆
近日国外一位程序员Peter Whidden对AI模型进行了长达5万小时的训练,试图教AI如何玩《宝可梦 火红》。
Whidden让AI通过模拟器上的控制输入与游戏进行交互,并将学习会话设置为每次游玩两个小时,他还通过加速让AI在六分钟左右完成,甚至还同时运行40个会话,从而加快了AI的学习过程。
由于AI算法本质上并不在意如何通关游戏,因此Whidden设定了奖励目标,每当AI发现新东西时就能获得奖励点。这是利用屏幕中像素点变化来触发的,不过这也导致AI会长时间盯着有动画效果的水面发呆。
而与新事物有关的奖励机制,也令AI选择放弃战斗或抓捕宝可梦,Whidden为此添加了与宝可梦等级相关的奖励机制。但这一系统也导致了意外,AI在存放和替换宝可梦时会让奖励分数下降,因此在之后的行动中AI完全避开宝可梦中心,使得队伍得不到治疗,Whidden不得不再次调整奖励系统。
虽然AI不擅长人类行为,但也做出了更加深奥的行动,Whidden意识到AI走出具体且奇怪的路径,其实是为了保证只需扔出一个精灵球就能捕获野生宝可梦,并非是无意义的行动。
不过AI在花费7千个小时击败第一个道馆后,却在月见山迷路许久,耗时5万小时后还是没能找到第二个道馆。但AI也贡献了许多神奇操作,比如AI最喜欢购入鲤鱼王,累计购买超过1万次;在野外抓捕到小拉达时,将其命名为“AI”。
以上是AI耗时7千小时通关《宝可梦》首个道馆的详细内容。更多信息请关注PHP中文网其他相关文章!

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

禅工作室 13.0.1
功能强大的PHP集成开发环境

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

SublimeText3汉化版
中文版,非常好用

Atom编辑器mac版下载
最流行的的开源编辑器