首页 >科技周边 >人工智能 >Grok 3行动:游戏开发,推理等

Grok 3行动:游戏开发,推理等

Joseph Gordon-Levitt
Joseph Gordon-Levitt原创
2025-03-04 09:36:13266浏览

在Xai的Grok-3早期访问阶段,AI爱好者,开发人员和研究人员毫不犹豫地浪费了时间来推动其限制并探索其功能。从游戏开发到推理测试,第一印象表明,Grok-3是AI领域中的一个认真竞争者,与OpenAI的顶级模型DeepSeek-R1和Google的Gemini媲美。

Grok 3行动:游戏开发,推理等

但是,什么使Grok与其他AI模型不同?为什么会引起如此多的关注?

> 目录的

  • grok-3性能:飞行上的游戏开发
    • grok-3绩效:推理和解决问题:一个真实的“思考” ai?它如何堆叠?
    • 深度搜索:用于研究和现实世界查询的AI
  • 数学和逻辑推理
  • grok-3绩效:现实世界物理学物理学
  • 竞争者吗?
  • grok:Xai对开放,无限制的AI
  • 的愿景 Grok是由埃隆·马斯克(Elon Musk)创立的人工智能公司Xai开发的高级AI模型。与许多主流语言模型不同,与Chatgpt(OpenAI)或Claude(Anthropic)相比,Grok的响应量较小,其反应更为开放。它旨在提供无偏见的寻求真理的AI体验,使其成为当今可用的最强大和最独特的大语言模型(LLM)之一。
  • >随着
      grok-3
    • 的发布,这个愿景现在已成为现实。
    • Grok的起源:从Openai到Xai
    • 要了解为什么Grok存在,我们必须回顾Openai的早期。很少有人意识到Openai最初是由埃隆·马斯克(Elon Musk)塑造的,埃隆·马斯克(Elon Musk)与山姆·奥特曼(Sam Altman),格雷格·布罗克曼(Greg Brockman)和其他人共同创始人之一。
    马斯克是Openai早期研究的主要投资者,资助其发展并倡导开源,非营利性方法。
  • 但是,随着Openai转变为营利性的,封闭的公司,马斯克不同意这一转变,并与组织分道扬and。
  • >这在AI研究中留下了差距 - 穆斯克认为AI是将定义人类未来的五种关键技术之一。
麝香的复出:Xai&Grok

的诞生

见证了Chatgpt的爆炸性成功后,马斯克知道他必须采取行动。 2023年3月,他正式发射了Xai,将他的重新进入了AI开发。
  • > 2024年,Xai通过在短短19天内建立世界上最大的AI超级计算机来创造历史,这是一项壮观的壮举,以至于NVIDIA的首席执行官Jensen Huang称其为“超级人类”。
  • xai不停在那里;他们现在正在将计算能力扩展到200,000 GPU,以确保他们在AI基础架构中保持领先。
  • 有了这些令人难以置信的突破,现在Grok-3正在成为有史以来最强大的AI模型之一。
>

grok的核心承诺:没有偏见的AI

>许多现有的AI模型(例如Chatgpt和Claude)经常因“唤醒”或在政治上过于正确而受到批评。有人认为他们的内置偏见会导致危险或误导性结论。

埃隆·马斯克(Elon Musk)对Grok的愿景不同。

>他设想了一个“寻求真相”的AI,该AI提供了客观事实而无需过滤或软化信息以适合社会或政治叙事。

真理是不舒服还是有争议的,Grok旨在追求它,就像其竞争对手一样,反映了硅谷公司的价值。

    这种未经过滤的,基于现实的方法可以使Grok与AI伦理和信息传播中的游戏规则改变。
  • 让我们看看专家说的话:
  • grok-3性能:飞行游戏开发

Grok 3刚刚发布。您不会相信它,我已经创建了一个游戏。

(今天早上我得到了早期的访问)。

>

这个游戏是由Grok创建的100%,我只是告诉了我想要的东西,然后将代码放在正确的位置。

>我一直在要求调整,它一直在吐痰……pic.twitter.com/bmtie3u4kf

- penny2x(@impenny2x)2025年2月18日
>
“我只是告诉了我想要的东西,然后构建了游戏。
>最引人注目的早期用例之一来自Penny2X,他在访问后数小时仅使用Grok-3从头开始制造了整个游戏。
>

“这个游戏是由Grok创建的100%。我只是告诉了我想要的东西,然后将代码放在正确的位置。我一直在要求调整,并且它一直在我可以运行的一个文件中吐出游戏。

>对于开发人员来说,这是巨大的。 AI生成的游戏代码并不是什么新鲜事物,但是Grok-3在没有API集成的情况下如此无缝地执行此操作,并且与GPT-4O和SONET这样的模型的感觉非常出色。如果Grok-3可以更好地集成到开发人员工作流程中,它可能会改变独立开发人员和工作室创建游戏的方式。
我的

这是一个令人兴奋的里程碑。 Grok-3的实时调整和生成可运行的游戏代码的能力可能意味着开发人员的原型更快。如果XAI优化其用于生产使用的API,我们可能会看到AI辅助游戏开发的重大转变。

grok-3性能:推理和解决问题:一个真正的“思考” AI?

>

>我今天早些时候就可以尽早进入Grok 3,这让我我认为最初可以进行快速氛围检查的人之一。

思考
✅>首先,Grok 3显然具有艺术性思维模型的状态(Think Think'按钮)(“ Think Think”按钮)(“ Think”按钮),并且在我的定居者的catan of Catean of Catean of catan Imppoter and toppoter y。 (@karpathy)2025年2月18日

Andrej Karpathy的“ Vibe检查”:Grok-3可以思考吗? AI先驱Andrej Karpathy将Grok-3带入了复杂的推理和解决问题的任务。他最大的收获? Grok-3的“ Think”模式是一种改变游戏规则。

“ Grok 3显然具有一个最新的思维模型(“思考”按钮),并且在我定居者的Catan问题上开箱即用。很少有模型可靠地获得正确的选择。顶级的OpenAI型号(O1-Pro,每月200美元),但是DeepSeek-R1,Gemini 2.0 Flash Thinking和Claude却没有。

>他还测试了逻辑难题,TIC-TAC-TOE董事会的生成和数学估计(例如计算GPT-2的训练拖鞋)。在需要深层推理的任务中,Grok-3的表现优于GPT-4O和O1-PRO,即使没有自己的推理功能,这也使估计任务失败了。

>“我得到的印象是Grok-3在O1-Pro能力周围,并且在DeepSeek-R1之前。 但是,Grok-3并不完美。它在一些拼图生成任务上挣扎,表情符号编码挑战,并且在信息检索中仍然偶尔会产生幻觉。 我的

“思考”模式似乎是Grok-3最大的优势之一。在大多数聊天机器人与实时解决问题的时代中,Grok-3在逻辑上“通过”复杂的查询(而不仅仅是反流答案)的能力使它领先于许多竞争对手。但是,正如Karpathy所指出的那样,真正的基准和评估将讲述完整的故事。

>

也请阅读:Andrej Karpathy对Grok 3!> grok-3 vs.其他AI模型:如何堆叠?

>

不仅是推理,还针对有关知识检索,深入搜索,幽默和道德决策的领先模型的Grok-3进行了测试。

深度搜索:研究和现实世界查询

的AI

karpathy指出,Grok-3的“深度搜索”功能与Openai的深入研究和困惑的搜索模型相当,在实时查询中表现良好,例如:>
  • “即将到来的Apple启动是怎么回事?
  • “为什么Palantir股票飙升?
  • “白莲花第3季拍摄的地方在哪里? 但是,它显示出一些弱点,例如幻觉的URL,避免X(Twitter)作为来源,并且缺少某些主张的引用。
  • 数学和逻辑推理
  • grok-3成功解决了:✅估计
  • gpt-gpt-2的训练

(gpt-4o&o1-pro失败!)




✅试图解决
> riemann假设,而不是完全放弃(与Gemini&Claude!) 但是,它仍然在以下错误中犯错:棘手的棋盘游戏生成

(失败复杂的TIC-TAC-TOE设置!)



emoji emoji emoji编码神秘的谜题 > > >> >

(笑话感到通用,缺乏智慧!)

我的

在某些推理任务中,Grok-3似乎与OpenAI的最佳型号(O1-Pro,200美元/月)相提并论。但是,它仍然需要进行幽默,实时研究准确性和拼图产生的改进。

>

grok-3性能:现实世界物理模拟

> grok 3可能是现实世界物理学的最佳基础LLM!

>提示:“在旋转的tesseract中写下球弹跳的python脚本”。

没有“思考”或“大脑”模式启用,它就是基础模型。我对尝试他们的推理模型非常感兴趣。 pic.twitter.com/fv2rfebb4j

- yuchen jin(@yuchenj_uw)2025年2月18日
>

ai研究人员yuchen jin在基于物理的编码挑战上测试了Grok-3 ,并印象深刻。

“ Grok 3可能是现实世界中最佳的基础LLM!提示:‘在旋转的Tesseract中写下球弹跳的python脚本。’启用了“思考”模式,只有基本模型。我对尝试他们的推理模型非常感兴趣。

我的 如果Grok-3可以有效地处理物理模拟,那么对于研究人员,工程师和开发人员来说,这可能是模拟较重的领域的巨大胜利。

grok-3 Wake?

>

刚获得3 grok 3,我现在的准确性使我感到震惊? pic.twitter.com/poeigyfnml

- 2025年2月18日,⚡️DezmondOliver⚡️(@dezmondoliver) 这引起了关于视觉模型中AI偏见的有趣讨论。尽管Grok-3看起来很高级,但AI模型仍然在细微的身份表示方面挣扎。这并不是Grok独有的 - 许多AI系统,包括Midjourney,Dall·E和稳定的扩散,在无偏表示方面面临着类似的挑战。

>

最终判决:Grok-3是一个真正的AI竞争者吗?

强度

✅最新的推理(“思考”模式与OpenAI的最佳竞争)


✅在逻辑难题,深入搜索和实时研究
远程AI中脱颖而出,现在使用AI的游戏开发更加顺畅,基于物理学的速度更加顺畅,基于物理学的编码显示出令人鼓舞的结果
>

>

> >

弱点



仍然会幻觉信息并生成假的URL

❌在笑话生成中与幽默和创造力的斗争

❌难题和棋盘游戏生成需要工作>

> grok-3也是有史以来第一个超过1400分的模型,为大语言模型(LLMS)设定了新的基准。但是,目前,它没有在Chabot Arena中显示Grok-3 - Web版本!

> Grok 3行动:游戏开发,推理等

也请阅读:Grok-3(代号为“巧克力”)现在在聊天机器人竞技场

中排名第一

结论

Grok-3的表现无可否认令人印象深刻。在短短的一年内,Xai建立了一个模型,该模型与OpenAI最强大的LLM竞争,并且在推理方面胜过DeepSeek-R1和Gemini。 但是,这并不完美。虽然“思考”模式增强了推理,但事实检查,幽默和复杂的创造性任务仍然有改进的余地。

Grok-3有了深入搜索,开发人员集成和现实推理的改进,有可能成为开创性的AI,向OpenAI和Google提出挑战。 Grok-3正式参加比赛。现在,让我们看看它如何发展。

>在下面的评论部分中,让我知道您对Grok-3的想法! 用Xai Grok 3:地球上最聪明的AI解锁未来!深入研究游戏开发,高级推理和现实世界任务。现在注册并掌握AI创新!

以上是Grok 3行动:游戏开发,推理等的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn