ホームページ >テクノロジー周辺機器 >AI >GROK 3アクション:ゲーム開発、推論など

GROK 3アクション:ゲーム開発、推論など

Joseph Gordon-Levitt
Joseph Gordon-Levittオリジナル
2025-03-04 09:36:13266ブラウズ

XaiのGrok-3の早期アクセス段階では、AI愛好家、開発者、および研究者は、限界を押し上げて能力を調査する時間を無駄にしませんでした。ゲーム開発から推論テストまで、第一印象は、GROK-3がAIスペースの深刻な候補であり、OpenaiのトップティアモデルであるDeepSeek-R1とGoogleのGeminiに匹敵することを示唆しています。

GROK 3アクション:ゲーム開発、推論など

しかし、Grokが他のAIモデルと違うのはなぜですか?そして、なぜそれがそんなに注目を集めているのですか?

目次

  • grok-3パフォーマンス:ゲームの開発
      深い検索:研究と現実世界のクエリのためのAI
    • 数学と論理の推論
    • GROK-3パフォーマンス:現実世界の物理シミュレーション
    競争相手?
  • 強み
  • 弱さ
  • Grok:Xaiのオープンで無制限のai
  • に対するビジョン
      Grokは、Elon Muskによって設立された人工知能会社であるXaiが開発した高度なAIモデルです。多くの主流の言語モデルとは異なり、GROKは、ChatGpt(Openai)またはClaude(人類)と比較して、より制限が少なく、その応答がよりオープンになるように設計されています。それは、公平で真実を求めるAI体験を提供することを目指しており、今日利用可能な最も強力で独特の大手言語モデル(LLM)の1つになります。
    • grok-3
    • のリリースにより、このビジョンは現実になりつつあります。
    • Grokの起源:OpenaiからXai
    まで
  • Grokが存在する理由を理解するには、Openaiの初期の日を振り返らなければなりません。 Sam Altman、Greg Brockmanなどと並んで共同設立者の1人であったElon Muskによって最初に形作られたことに気付いている人はほとんどいません。
  • ムスクは、Openaiの初期の研究の主要な投資家であり、その開発に資金を提供し、オープンソースの非営利アプローチを提唱しました。
しかし、Openaiが営利団体の閉鎖型会社に移行したため、Muskはこのシフトに反対し、組織と別れました。

これはAIの研究にギャップを残しました。AIは人類の将来を定義する5つの重要な技術の1つであるという彼の信念を考えると、マスクがイライラすると感じました。

ムスクのカムバック:Xai&Grok

の誕生

chatgptの爆発的な成功を目撃した後、マスクは自分が行動しなければならないことを知っていました。 2023年3月、彼は正式にXaiを立ち上げ、再入国をAI開発にマークしました。

  • 2024年、Xaiはわずか19日で世界最大のAIスーパーコンピューターを構築することで歴史を作りました。これは、NvidiaのCEOであるJensen Huangが「超人」と呼ぶ非常に注目すべき偉業です。
  • xaiはそこで止まりませんでした。彼らは現在、コンピューティングパワーを200,000 GPUに拡大しており、AIインフラストラクチャで先を行くことを保証しています。
  • これらの信じられないほどのブレークスルーにより、今ではGrok-3がこれまでに作成された最も強力なAIモデルの1つとして浮上しています。
  • grokの中心的な約束:バイアスのないAI

ChatGptやClaudeなどの多くの既存のAIモデルは、「目が覚めた」または過度に政治的に正しいと批判されることがよくあります。組み込みのバイアスが危険または誤解を招く結論につながる可能性があると主張する人もいます。

Elon MuskのGrokのビジョンは異なります。

彼は、「真実を求める」aiを想定しています。これは、社会的または政治的な物語に合わせて情報をフィルタリングまたは柔らかくすることなく客観的な事実を伝えるものです。

真実が不快であるか議論の余地があるかにかかわらず、Grokはそれを追求するように設計されています。シリコンバレー企業の価値を反映している競合他社のように。

このフィルター処理されていない現実に基づいたアプローチは、AI倫理と情報の普及におけるゲームチェンジャーとしてGrokを際立たせる可能性があります。
    専門家が言うことを見てみましょう:
  • GROK-3パフォーマンス:ゲームの開発でのゲーム
Grok 3がリリースされました。あなたはそれを信じないでしょう、私はすでにゲームを作成しました。

(私は今朝早くアクセスしました)。

このゲームはGrokによって100%作成されていたので、私は自分が望むものを伝え、コードを適切な場所に置いただけです。

調整を求め続けるだけで、吐き出し続けます…pic.twitter.com/bmtie3u4kf
— penny2x(@infenny2x)2025年2月18日


「私はちょうど私が望んでいたことを言った、そしてそれはゲームを構築した。」

最も目を見張るような初期のユースケースの1つは、アクセスしてから数時間以内にGROK-3のみを使用してゲーム全体をゼロから構築したPenny2Xから来ています。

「このゲームはGrokによって100%作成されました。私はちょうど私が望んでいたものを言って、コードを適切な場所に置きました。私は調整を求め続け、それは私が実行できる単一のファイルでゲームを吐き出し続けます。
これは開発者にとって非常に大きなものです。 AIに生成されたゲームコードは新しいものではありませんが、GROK-3がAPI統合なしでこれをシームレスに行い、GPT-4OやSONETなどのモデルと同等に感じているという事実は注目に値します。 GROK-3が開発者のワークフローによりよく統合できる場合、Indie DevsとStudiosがゲームを作成する方法を変える可能性があります。

私のテイク

これはエキサイティングなマイルストーンです。 GROK-3のリアルタイムの調整と実行可能なゲームコードを生成する機能は、開発者にとってより速いプロトタイピングを意味する可能性があります。 Xaiが生産用にAPIを最適化した場合、AIアシストゲーム開発の大きな変化が見られる可能性があります。

GROK-3パフォーマンス:推論と問題解決:真の「思考」ai?

今日、Grok 3への早期アクセスが与えられたので、簡単な雰囲気のチェックを実行できる最初の数少ない人の1人になりました。

最初に、Grok 3には明らかにアート思考モデル(「思考」ボタン)があり、私の植民地の箱から出して箱から出してくれました。 (@karpathy)2025年2月18日

Andrej Karpathyの「Vibe Check」:Grok-3は考えられますか?

AIパイオニアAndrej Karpathyは、GROK-3を複雑な推論と問題解決タスクでテストしました。彼の最大のポイント? Grok-3の「Think」モードはゲームチェンジャーです

「Grok 3には明らかに、最先端の思考モデル(「Think」ボタン)があり、Catanの質問の入植者の質問で箱から出してくれました。これを確実に正しく取得するモデルはほとんどありません。トップオープンモデル(O1-Pro、$ 200/月)はそうですが、Deepseek-R1、Gemini 2.0 Flash Thinking、およびClaudeはそうしません。 また、彼はまた、ロジックパズル、TIC-TAC-TOEボードの生成、および数学的推定をテストしました(GPT-2のトレーニングフロップの計算など)。深い推論を必要とするタスクでは、GROK-3はGPT-4OとO1-PROを上回りましたが、これは独自の推論機能があっても推定タスクに失敗しました。

私が得た印象は、Grok-3がO1-Pro能力の周りのどこかで、DeepSeek-R1に先んじているということです。」 しかし、Grok-3は完璧ではありません。それはいくつかのパズル世代のタスク、課題をエンコードする絵文字に苦労しましたが、まだ情報の検索に時折幻覚があります。 私のテイク

「Think」モードは、Grok-3の最大の強みの1つであるように見えます。ほとんどのチャットボットがリアルタイムの問題解決に苦しんでいる時代に、GROK-3の複雑なクエリを論理的に「作業」する能力(単に答えを逆流させるのではなく)は、多くの競合他社よりも先に進みます。ただし、Karpathyが指摘しているように、実際のベンチマークと評価は完全なストーリーを伝えます。 また、読む:Andrej KarpathyのGrok 3!

の最初の見方

grok-3対他のAIモデル:どのように積み重ねますか? 単なる推論を超えて、Grok-3は、知識の検索、深い検索、ユーモア、倫理的意思決定に関する主要なモデルに対してテストされました。

深い検索:研究と現実世界のクエリのためのAI

Karpathyは、Grok-3の「ディープ検索」機能はOpenaiのDeep Research and Perplexityの検索モデルに匹敵し、次のようなリアルタイムクエリでうまく機能していることに注意してください。
  • 「今後のAppleの発売はどうですか?」
  • 「なぜPalantir Stockが急上昇するのですか?」
  • 「ホワイトロータスシーズン3はどこに撮影されましたか?」
  • しかし、それは幻覚のURLを幻想的に、X(Twitter)をソースとして回避するなど、いくつかの弱点を示し、特定のクレームの引用の欠落を示しました。
数学的および論理的推論

grok-3は正常にタックルされています:

gpt-2のトレーニングフロップを推定


(GPT-4o&o1-proが失敗した!)しかし、しかし、それはまだエラーを起こしました:❌> トリッキーなボードゲームの生成
(失敗した複雑なTIC-TAC-TOEセットアップ!)
ユーモアの理解
私のテイク GROK-3は、特定の推論タスクでGeminiとDeepSeek-R1を上回りながら、Openaiの最高のモデル(O1-Pro、200ドル/月)と同等のようです。ただし、ユーモア、リアルタイムの研究の正確性、パズル生成の洗練が必要です。 GROK-3パフォーマンス:実世界の物理シミュレーション

grok 3は、実際の物理学に最適なベースLLMかもしれません!
プロンプト:「スピニングテッセラクト内に跳ね返るボールのパイソンスクリプトを書く」。私は彼らの推論モデルを試すことに非常に興味があります。 pic.twitter.com/fv2rfebb4j— Yuchen Jin(@yuchenj_uw)2025年2月18日 ai研究者yuchen jin
物理ベースのコーディングの課題でgrok-3をテストし、感銘を受けました。
「Grok 3は、実際の物理学にとって最高のベースLLMかもしれません!プロンプト:「スピニングテッセラクト内で跳ね返るボールのPythonスクリプトを書きます。」「思考」モードが有効になっておらず、ベースモデルだけです。私は彼らの推論モデルを試すことに非常に興味があります 私のテイク GROK-3が物理シミュレーションを効果的に処理できる場合、これはシミュレーションが多い分野の研究者、エンジニア、開発者にとって大きな勝利になる可能性があります。 grok-3は目が覚めていますか?
Grok 3を手に入れましたが、今の正確さに吹き飛ばされていますか? pic.twitter.com/poeigyfnml - DezmondOliver⚡️(@dezmondoliver)2025年2月18日

これは、視覚モデルのAIバイアスに関する興味深い議論を提起します。 GROK-3は非常に高度に見えますが、AIモデルは依然として微妙なアイデンティティ表現に苦労しています。これはGrokに固有のものではありません。Midjourney、Dall・E、および安定した拡散を含む多くのAIシステムは、公平な表現において同様の課題に直面しています。

最終評決:grok-3は真のai候補ですか?

です

強度

✅最先端の推論(「Think」モードはOpenaiのベストと競合します)

✅ロジックパズル、ディープ検索、リアルタイムの研究
✅ゲーム開発は、より滑らかで速い

弱点

は、まだ情報を幻覚し、偽のURLを生成します

GROK-3は、1400のスコアを上回る史上初のモデルでもあり、大規模な言語モデル(LLMS)の新しいベンチマークを設定します。ただし、現在、Chabot ArenaにGrok-3を表示していません - Webバージョン!

また読む:grok-3(コードネーム「チョコレート」)はチャットボットアリーナで1位になりました

結論

GROK 3アクション:ゲーム開発、推論など Grok-3のパフォーマンスは間違いなく印象的です。わずか1年で、XaiはOpenaiの最も強力なLLMと競合し、推論でDeepseek-R1とGeminiを上回るモデルを構築しました。

しかし、それは完璧ではありません。 「思考」モードは推論を強化しますが、実際のチェック、ユーモア、複雑な創造的なタスクの改善の余地はまだあります。

深い検索、開発者の統合、実世界の推論の改良により、GROK-3は、OpenaiとGoogleに挑戦する画期的なAIになる可能性があります。 Grok-3は公式にゲームに参加しています。それでは、それがどのように進化するか見てみましょう。

以下のコメントセクションでGrok-3についてのあなたの考えを教えてください!

Xai Grok 3:地球上で最も賢いAIで未来のロックを解除してください!ゲーム開発、高度な推論、現実世界のタスクに飛び込みます。今すぐ登録して、AIのイノベーションをマスター!

以上がGROK 3アクション:ゲーム開発、推論などの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。