Rumah >Peranti teknologi >AI >Grok 3 dalam Tindakan: Pembangunan Permainan, Penalaran dan Lagi

Grok 3 dalam Tindakan: Pembangunan Permainan, Penalaran dan Lagi

Joseph Gordon-Levitt
Joseph Gordon-Levittasal
2025-03-04 09:36:13265semak imbas

Semasa fasa akses awal Xai's Grok-3, peminat AI, pemaju, dan penyelidik tidak membuang masa untuk menolak hadnya dan meneroka keupayaannya. Dari perkembangan permainan hingga ujian pemikiran, kesan pertama menunjukkan bahawa Grok-3 adalah pesaing yang serius di ruang AI, menandingi model teratas Openai, DeepSeek-R1, dan Gemini Google.

Grok 3 dalam Tindakan: Pembangunan Permainan, Penalaran dan Lagi

Tetapi apa yang membuat Grok berbeza dari model AI lain? Dan mengapa ia mendapat perhatian yang begitu banyak?

Jadual Kandungan

Prestasi Grok-3: Pembangunan Permainan di Fly
  • Prestasi Grok-3: Penalaran & Penyelesaian Masalah: "Berfikir" yang benar? Bagaimanakah ia disusun? CONTENDER?
  • Kekuatan
    • Kelemahan
  • Kesimpulan
    • Grok: Visi Xai untuk AI yang terbuka, tidak terbatas
    • Grok adalah model AI yang maju yang dibangunkan oleh Xai, syarikat kecerdasan buatan yang diasaskan oleh Elon Musk. Tidak seperti banyak model bahasa arus perdana, Grok direka untuk menjadi kurang terhad dan lebih terbuka dalam responsnya berbanding dengan chatgpt (openai) atau claude (antropik). Ia bertujuan untuk memberikan pengalaman AI yang tidak berat sebelah, mencari kebenaran, menjadikannya salah satu model bahasa besar yang paling kuat dan tersendiri (LLMS) yang tersedia hari ini.
  • Dengan pembebasan
  • grok-3
  • , visi ini kini menjadi realiti.
  • Asal -usul Grok: Dari Openai ke Xai
    • Untuk memahami mengapa Grok wujud, kita perlu melihat kembali pada hari -hari awal Openai. Beberapa orang menyedari bahawa Openai pada mulanya dibentuk oleh Elon Musk, yang merupakan salah seorang pengasasnya bersama Sam Altman, Greg Brockman, dan lain-lain.
    • Musk adalah pelabur utama dalam penyelidikan awal Openai, membiayai perkembangannya dan menganjurkan pendekatan sumber terbuka, bukan keuntungan.
    Walau bagaimanapun, sebagai OpenAI beralih ke syarikat yang tertutup, Sumber tertutup, Musk tidak bersetuju dengan peralihan ini dan berpisah dengan organisasi.
  • Ini meninggalkan jurang dalam penyelidikan AI -yang musk mendapati kekecewaan, memandangkan kepercayaannya bahawa AI adalah salah satu daripada lima teknologi utama yang akan menentukan masa depan manusia.

Comeback Musk: Kelahiran Xai & Grok

Selepas menyaksikan kejayaan letupan Chatgpt, Musk tahu dia terpaksa bertindak. Pada bulan Mac 2023, beliau secara rasmi melancarkan Xai, menandakan kemasukannya ke dalam pembangunan AI.

  • Pada tahun 2024, Xai membuat sejarah dengan membina superkomputer AI terbesar di dunia dalam hanya 19 hari -satu prestasi yang luar biasa yang CEO Nvidia, Jensen Huang, menyebutnya "superhuman."
  • Xai tidak berhenti di sana; Mereka kini memperluaskan kuasa pengkomputeran mereka kepada 200,000 GPU, memastikan mereka berada di hadapan dalam infrastruktur AI.
dengan kejayaan yang luar biasa ini, kini Grok-3 muncul sebagai salah satu model AI yang paling berkuasa yang pernah dibuat.

Janji teras Grok: AI tanpa bias

Ramai model AI yang sedia ada -seperti chatgpt dan Claude -sering dikritik kerana menjadi "bangun" atau terlalu tepat secara politik. Ada yang berpendapat bahawa kecenderungan terbina dalam mereka boleh membawa kepada kesimpulan yang berbahaya atau mengelirukan.

Visi Elon Musk untuk Grok adalah berbeza.

mari kita lihat apa yang dikatakan oleh pakar:

Prestasi Grok-3: Pembangunan Permainan di Fly

Grok 3 baru sahaja dibebaskan. Anda tidak akan mempercayainya, saya sudah membuat permainan.

(Saya mendapat akses awal pagi ini).


Permainan ini 100% dicipta oleh Grok, saya hanya memberitahu apa yang saya mahu, dan meletakkan kod di tempat yang betul.

Saya terus meminta pelarasan, dan ia terus meludah ... pic.twitter.com/bmti3u4kf
- Penny2x (@impenny2x) 18 Februari, 2025

"Saya hanya memberitahu apa yang saya mahu, dan ia membina permainan."

Salah satu kes penggunaan awal yang paling membuka mata berasal dari Penny2X, yang membina keseluruhan permainan dari awal dengan hanya menggunakan Grok-3 dalam beberapa jam mendapat akses.

"Permainan ini 100% dicipta oleh Grok. Saya hanya memberitahu apa yang saya mahu dan meletakkan kod di tempat yang betul. Saya terus meminta pelarasan, dan ia terus meludahkan permainan dalam satu fail yang boleh saya jalankan. "

Ini sangat besar untuk pemaju. Kod permainan AI-dihasilkan bukanlah sesuatu yang baru, tetapi hakikat bahawa Grok-3 melakukan ini dengan lancar, tanpa integrasi API, dan merasakan setanding dengan model seperti GPT-4O dan SONET adalah luar biasa. Jika Grok-3 dapat mengintegrasikan lebih baik ke dalam aliran kerja pemaju, ia boleh mengubah bagaimana indie devs dan studio membuat permainan.

saya mengambil

Ini adalah peristiwa penting. Pelarasan masa nyata Grok-3 dan keupayaan untuk menjana kod permainan yang boleh dilancarkan boleh bermakna prototaip lebih cepat untuk pemaju. Jika XAI mengoptimumkan APInya untuk kegunaan pengeluaran, kita dapat melihat peralihan utama dalam pembangunan permainan AI-dibantu.

Prestasi Grok-3: Penalaran & Penyelesaian Masalah: AI "Berfikir" yang benar?

Saya diberi akses awal ke Grok 3 awal hari ini, membuat saya saya fikir salah satu daripada beberapa yang pertama yang boleh menjalankan pemeriksaan getaran cepat. (@karpathy) 18 Februari 2025

"cek getaran" Andrej Karpathy: Bolehkah Grok-3 berfikir?

perintis AI Andrej Karpathy meletakkan Grok-3 ke ujian dengan tugas penalaran dan penyelesaian masalah yang kompleks. Takeaway terbesarnya? Mod "Think" Grok-3 adalah penukar permainan.

"Grok 3 jelas mempunyai model pemikiran yang canggih (" berfikir "), dan melakukan yang hebat dari kotak pada soalan saya Catan. Beberapa model mendapat hak ini dengan pasti. Model Terbuka Terbaik (O1-Pro, $ 200/Bulan) lakukan, tetapi DeepSeek-R1, Gemini 2.0 Flash Thinking, dan Claude tidak. "

Dia juga menguji teka-teki logik, penjanaan lembaga Tic-Tac-toe, dan anggaran matematik (seperti mengira flop latihan GPT-2). Dalam tugas yang memerlukan penalaran yang mendalam, Grok-3 mengatasi GPT-4O dan O1-Pro, yang gagal tugas anggaran walaupun dengan ciri-ciri penalaran mereka sendiri. "Kesan yang saya dapat ialah Grok-3 berada di sekitar keupayaan O1-Pro dan di hadapan DeepSeek-R1."

Walau bagaimanapun, Grok-3 tidak sempurna. Ia bergelut dengan beberapa tugas generasi teka-teki, cabaran pengekodan emoji, dan masih mempunyai halusinasi sekali-sekala dalam pengambilan maklumat.

saya mengambil

mod "berfikir" nampaknya merupakan salah satu kekuatan terbesar Grok-3. Dalam era di mana kebanyakan chatbots berjuang dengan penyelesaian masalah masa nyata, keupayaan Grok-3 untuk secara logik "bekerja melalui" pertanyaan kompleks (bukan sekadar regurgitate jawapan) meletakkannya di hadapan banyak pesaing. Walau bagaimanapun, sebagai nota Karpathy, penanda aras dan penilaian sebenar akan menceritakan kisah penuh.

Juga baca: pandangan pertama Andrej Karpathy di Grok 3!

Grok-3 vs Model AI Lain: Bagaimana ia disusun?

Beyond Just Just, Grok-3 diuji terhadap model terkemuka mengenai pengambilan pengetahuan, carian mendalam, humor, dan membuat keputusan etika.

Carian Deep: AI untuk Penyelidikan & Pertanyaan Dunia Nyata

Karpathy menyatakan bahawa ciri "Carian Deep" Grok-3 adalah setanding dengan model carian penyelidikan dan kebingungan Openai yang mendalam, melakukan dengan baik pada pertanyaan masa nyata seperti:

  • "Apa yang ada dengan pelancaran Apple yang akan datang?"
  • "Kenapa stok Palantir melonjak?"
  • "Di manakah White Lotus Season 3 difilemkan?"
Walau bagaimanapun, ia menunjukkan beberapa kelemahan, seperti URL halusinasi, mengelakkan X (Twitter) sebagai sumber, dan kutipan yang hilang untuk tuntutan tertentu.

Penalaran Matematik & Logik

Grok-3 berjaya ditangani: ✅ 🎜 🎜 🎜 ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ dengan!)


Walau bagaimanapun, ia masih membuat kesilapan dalam: lebih baik!) Memahami humor (lelucon merasa generik, kurang kecerdasan!)
saya mengambil Grok-3 nampaknya setanding dengan model terbaik OpenAI (O1-Pro, $ 200/bulan) semasa melampaui Gemini dan DeepSeek-R1 dalam tugas-tugas penalaran tertentu. Walau bagaimanapun, ia masih memerlukan perbaikan dalam humor, ketepatan penyelidikan masa nyata, dan penjanaan teka-teki. prestasi grok-3: simulasi fizik dunia sebenar GROK 3 mungkin menjadi asas yang terbaik untuk fizik dunia sebenar! Saya sangat berminat untuk mencuba model pemikiran mereka. pic.twitter.com/fv2rfebb4j
- yuchen jin (@yuchenj_uw) 18 Februari 2025
Penyelidik AI Yuchen Jin diuji Grok-3 pada cabaran pengekodan berasaskan fizik dan terkesan.


"Grok 3 mungkin menjadi asas terbaik untuk fizik dunia sebenar! Prompt: 'Tulis skrip python bola melantun di dalam tesseract berputar.' Tidak ada mod 'pemikiran' yang didayakan, hanya model asas. Saya sangat berminat untuk mencuba model penalaran mereka. " saya mengambil Jika Grok-3 dapat mengendalikan simulasi fizik dengan berkesan, ini boleh menjadi kemenangan besar bagi penyelidik, jurutera, dan pemaju dalam bidang simulasi-berat.
Adakah Grok-3 bangun? hanya mendapat grok 3 dan saya ditiup dengan ketepatan yang ada sekarang? pic.twitter.com/poeigyfnml - ⚡️Dezmond Oliver⚡️ (@dezmondoliver) 18 Februari 2025

Ini menimbulkan perbincangan yang menarik mengenai kecenderungan AI dalam model visual. Walaupun Grok-3 kelihatan sangat maju, model AI masih berjuang dengan perwakilan identiti yang bernuansa. Ini tidak unik untuk Grok -banyak sistem AI, termasuk Midjourney, Dall · E, dan penyebaran yang stabil, menghadapi cabaran yang sama dalam perwakilan yang tidak berat sebelah.

keputusan akhir: Adakah Grok-3 adalah pesaing AI yang benar?

Kekuatan

✅ Penalaran State-of-the-Art (mod "Think" bersaing dengan Terbaik Terbaik)
✅ unggul dalam teka-teki logik, carian dalam, dan penyelidikan masa nyata
✅ perkembangan permainan dengan AI kini lebih lancar dan lebih cepat

Kelemahan

❌ Masih Hallucinates Maklumat & Menjana URL Palsu

❌ Perjuangan dengan Humor & Kreativiti dalam Generasi Joke
❌ Teka -teki dan Generasi Permainan Generasi Perlu Kerja

Grok-3 juga merupakan model pertama untuk melepasi skor 1400, menetapkan penanda aras baru untuk model bahasa besar (LLMS). Walau bagaimanapun, pada masa ini, ia tidak menunjukkan Grok-3 di Chabot Arena-Versi Web!

Grok 3 dalam Tindakan: Pembangunan Permainan, Penalaran dan Lagi Juga Baca: Grok-3 (CodeName "Chocolate") kini #1 di Chatbot Arena

Kesimpulan

Prestasi Grok-3 tidak dapat dinafikan. Dalam masa satu tahun, Xai telah membina model yang bersaing dengan LLM Terbuka Terbuka dan mengatasi DeepSeek-R1 dan Gemini dalam penalaran.

Walau bagaimanapun, ia tidak sempurna. Walaupun mod "berfikir" meningkatkan pemikiran, masih ada ruang untuk penambahbaikan dalam pemeriksaan fakta, humor, dan tugas kreatif yang kompleks.

Dengan penambahbaikan dalam pencarian mendalam, integrasi pemaju, dan penalaran dunia nyata, Grok-3 berpotensi untuk menjadi AI yang mencabar Openai dan Google di bahagian atas. Grok-3 secara rasmi dalam permainan. Sekarang, mari kita lihat bagaimana ia berkembang.

beritahu saya pemikiran anda di Grok-3 di bahagian komen di bawah!

Buka masa depan dengan XAI Grok 3: AI yang paling bijak di Bumi! Menyelam ke dalam pembangunan permainan, penalaran maju, dan tugas dunia nyata. Mendaftar sekarang dan Master AI Inovasi! "

Atas ialah kandungan terperinci Grok 3 dalam Tindakan: Pembangunan Permainan, Penalaran dan Lagi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn