Rumah >Peranti teknologi >AI >O1 vs GPT-4O: Adakah model baru OpenAI ' lebih baik daripada GPT-4O?
Openai's O1: Hadiah 12 Hari Bermula dengan model mereka yang paling berkuasa
Ketibaan Disember membawa kelembapan global, kepingan salji di beberapa bahagian dunia, tetapi Openai baru sahaja bermula. Sam Altman dan pasukannya melancarkan extravaganza hadiah 12 hari, dan hadiah pertama adalah yang utama: Openai O1, model paling maju mereka sehingga kini. Selama berbulan-bulan, GPT-4 telah memerintah tertinggi, tetapi O1 berada di sini untuk mencabar dominasinya. Blog ini Pits O1 terhadap GPT-4O dalam beberapa tugas untuk menentukan model unggul.
Jadual Kandungan
Openai O1: Penambahbaikan Utama
Membina model September 2024 O1-Preview, Openai's O1 menawarkan ketepatan dan kelajuan yang dipertingkatkan untuk tugas-tugas yang kompleks. Berbanding dengan pendahulunya:
Mengakses O1
O1 boleh didapati melalui langganan ChatGPT Plus dan ChatGPT Pro (bukan pelan percuma). Chatgpt Pro menawarkan akses O1 tanpa had, sementara Plus menyediakan bilangan interaksi yang terhad. Untuk mengakses:
O1 vs GPT-4O: Perbandingan Head-to-Head
Walaupun O1-Preview terkesan, GPT-4O (dilancarkan Mei 2024) kekal sebagai pilihan utama untuk ketepatan, kelajuan, dan fleksibiliti dalam pengendalian teks, imej, dan audio. Skor penanda aras MMLU sebanyak 88.7% menetapkan bar tinggi untuk AI multimodal. O1 kini bertujuan untuk melepasi GPT-4O, terutamanya dalam matematik, pengekodan, dan penyelesaian masalah yang kompleks. Lima cabaran akan mendedahkan pemenang:
Cabaran 1: Reka bentuk carta aliran untuk analisis sentimen
Prompt: Reka bentuk carta aliran dan terangkan alat yang diperlukan untuk sistem analisis sentimen yang mengambil berita saham (API Berita), menganalisis sentimen, dan menyampaikan ringkasan dan sentimen 140 aksara kepada pelanggan.
Keputusan: O1 menghasilkan carta aliran yang jelas dan bebas dengan penjelasan terperinci dan cadangan untuk alat tambahan. GPT-4O memberikan gambaran konseptual dan gambarajah yang cacat.
Keputusan: O1 menang.
Cabaran 2: Analisis Imej Saintifik
Prompt: Kirakan output gambarajah litar ini. (Imej gambarajah litar disediakan)
Keputusan: O1 Komponen yang dikenal pasti dengan betul, baca nilai dari graf, operasi litar yang diterangkan, dan parameter yang dikira. GPT-4O mengenal pasti beberapa komponen tetapi memerlukan nilai input tambahan.
Keputusan: O1 menang.
Cabaran 3: Analisis Imej Matematik
Prompt: Tentukan kebarangkalian menang untuk setiap pasukan dalam permainan ini. (Imej papan skor kriket disediakan)
Keputusan: O1 dengan tepat menganalisis imej, mengenal pasti format permainan, dan kebarangkalian menang yang dikira dengan justifikasi. GPT-4O sebahagiannya difahami permainan tetapi gagal memberikan kebarangkalian.
Keputusan: O1 menang.
Cabaran 4: Penyelesaian Sudoku
Prompt: Selesaikan teka -teki Sudoku ini dan berikan penyelesaian sebagai imej. (Imej teka -teki Sudoku disediakan)
Keputusan: Kedua -dua model gagal memberikan penyelesaian yang betul.
Keputusan: Tie (kedua -duanya gagal).
Cabaran 5: Generasi Imej
Prompt: Buat imej anjing yang berjalan berhampiran pantai.
Keputusan: GPT-4O menjana imej yang diminta; O1 kini tidak mempunyai keupayaan penjanaan imej.
Keputusan: GPT-4O menang.
Ringkasan Keputusan: O1 vs GPT-4O
Cabaran | Hasil GPT-4O | hasil o1 | Keputusan |
---|---|---|---|
Reka bentuk carta aliran | Konsep, tidak jelas, kesilapan | Jelas, terperinci, bebas ralat | o1 |
Analisis imej saintifik | Pengenalan komponen separa, tidak lengkap | Analisis lengkap, pengiraan yang tepat | o1 |
Analisis imej matematik | Pemahaman separa, tidak ada kebarangkalian diberikan | Analisis yang tepat, kebarangkalian dikira | o1 |
Penyelesaian Sudoku | Tidak betul | Tidak betul | Mengikat |
Generasi imej | Imej yang betul dijana | Tidak dapat menghasilkan gambar | GPT-4O |
Kesimpulan
O1 secara signifikan mengatasi GPT-4O dalam banyak bidang, menunjukkan penalaran dan ketepatan yang unggul. Kelajuan dan ketabahannya juga perlu diperhatikan oleh O1-Preview. Walau bagaimanapun, ia tidak sempurna dan mungkin memerlukan penghalusan berulang. O1 adalah alat yang berkuasa untuk penyelidik, saintis, dan profesional yang memerlukan keupayaan menyelesaikan masalah lanjutan.
Soalan yang sering ditanya
Atas ialah kandungan terperinci O1 vs GPT-4O: Adakah model baru OpenAI ' lebih baik daripada GPT-4O?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!