Rumah  >  Artikel  >  Peranti teknologi  >  GPT-5: 4 Ciri Baharu Yang Kami Ingin Lihat

GPT-5: 4 Ciri Baharu Yang Kami Ingin Lihat

王林
王林asal
2024-06-14 16:02:14321semak imbas

Sekurang-kurangnya, itulah yang kami harapkan. Tiada tarikh pelancaran khusus untuk GPT-5, dan kebanyakan perkara yang kami fikir kami tahu datang daripada menggabungkan maklumat lain dan cuba menyambungkan titik-titik tersebut.

Namun, tidak kira tarikh tamat tempoh, terdapat beberapa ciri utama yang ingin kami lihat apabila GPT-5 dilancarkan.

Apakah GPT-5 OpenAI?

GPT-5 ialah pengganti yang dinanti-nantikan kepada model AI GPT-4 OpenAI, secara meluas dijangka menjadi model generatif paling berkuasa di pasaran. Walaupun pada masa ini tiada tarikh keluaran rasmi untuk GPT-5, terdapat tanda-tanda ia boleh dikeluarkan seawal musim panas 2024. Sangat sedikit perincian tentang model itu diketahui pada masa ini, tetapi beberapa perkara boleh dikatakan dengan beberapa jumlah kepastian:

OpenAI telah memfailkan tanda dagangan untuk nama tersebut dengan Pejabat Paten dan Tanda Dagangan Amerika Syarikat. Beberapa eksekutif OpenAI telah membincangkan atau membayangkan kemungkinan keupayaan model tersebut. Ketua Pegawai Eksekutif OpenAI Sam Altman berulang kali menyebut model itu semasa temu bual YouTube Mac 2024 dengan Lex Fridman.

Ini semua menunjukkan satu realiti menarik: GPT-5 akan datang! Yang berkata, agak banyak perkara adalah spekulasi pada ketika ini. Tetapi ada beberapa perkara yang kami harap dapat lihat dan cukup yakin untuk dilihat dalam model itu. Berikut ialah beberapa daripadanya:

1. Lebih Multimodaliti

GPT-5: 4 New Features We Want to See

Salah satu peningkatan yang paling menarik kepada keluarga GPT model AI ialah pelbagai mod. Untuk kejelasan, multimodaliti ialah keupayaan model AI untuk memproses lebih daripada teks tetapi juga jenis input lain seperti imej, audio dan video. Multimodaliti akan menjadi penanda aras kemajuan yang penting untuk keluarga model GPT pada masa hadapan.

Dengan GPT-4 yang sudah mahir dalam mengendalikan input dan output imej, penambahbaikan yang meliputi pemprosesan audio dan video merupakan pencapaian seterusnya untuk OpenAI, dan GPT-5 ialah tempat yang baik untuk bermula. Google sudah membuat kemajuan yang serius dengan pelbagai mod ini dengan model AI Gemininya. Ia bukan ciri OpenAI untuk tidak bertindak balas. Tetapi, sudah tentu, jangan ambil kata-kata kami untuk itu. Dalam podcast Unconfuse Me [transkrip PDF]nya, Bill Gates bertanya kepada Ketua Pegawai Eksekutif OpenAI Sam Altman apakah peristiwa penting yang dilihatnya untuk siri GPT dalam tempoh dua tahun akan datang. Jawapan pertama dia? Pemprosesan Video.

Jadi, untuk GPT-5, kami menjangkakan dapat bermain-main dengan video—muat naik video sebagai gesaan, mencipta video semasa dalam perjalanan, mengedit video dengan gesaan teks, mengekstrak segmen daripada video dan mencari pemandangan tertentu daripada fail video besar . Kami menjangkakan dapat melakukan perkara yang serupa dengan fail audio. Ini soalan besar, ya. Tetapi memandangkan betapa pantas pembangunan AI, ia adalah jangkaan yang sangat munasabah.

2. Tetingkap Konteks yang Lebih Besar dan Lebih Cekap

GPT-5: 4 New Features We Want to See

Walaupun merupakan salah satu model AI yang paling canggih dalam pasaran, keluarga GPT model AI mempunyai salah satu tetingkap konteks terkecil. Sebagai contoh, Claude 3 Anthropic menawarkan tetingkap konteks sebanyak 200,000 token, manakala Gemini Google boleh memproses 1 juta token yang mengejutkan (128,000 untuk penggunaan standard). Sebaliknya, GPT-4 mempunyai tetingkap konteks yang lebih kecil daripada 128,000 token, dengan kira-kira 32,000 token atau kurang tersedia secara realistik untuk digunakan pada antara muka seperti ChatGPT.

Dengan pelbagai mod termaju muncul dalam gambar, tetingkap konteks yang lebih baik hampir tidak dapat dielakkan. Mungkin peningkatan sebanyak dua atau empat faktor sudah memadai, tetapi kami berharap untuk melihat sesuatu seperti faktor sepuluh. Ini akan membolehkan GPT-5 memproses lebih banyak maklumat dengan cara yang lebih cekap. Sekarang, tetingkap konteks yang lebih besar tidak selalu bermakna lebih baik. Jadi, daripada hanya meningkatkan tetingkap konteks, kami ingin melihat peningkatan kecekapan pemprosesan konteks.

Anda lihat, model mungkin mempunyai satu juta tetingkap konteks token (kira-kira kapasiti 700,000 perkataan) tetapi gagal menghasilkan ringkasan yang komprehensif apabila diminta meringkaskan buku 500,000 perkataan kerana ia tidak dapat memproses keseluruhan konteks dengan secukupnya walaupun mempunyai keupayaan untuk melakukannya secara teori. Bahawa anda boleh membaca buku 500k perkataan tidak bermakna anda boleh mengingati segala-galanya di dalamnya atau memprosesnya dengan bijak.

3. Ejen GPT

GPT-5: 4 New Features We Want to See

Mungkin salah satu kemungkinan yang paling menarik bagi keluaran GPT-5 ialah penampilan pertama Ejen GPT. Walaupun istilah "penukar permainan" mungkin telah digunakan secara berlebihan dalam AI, ejen GPT benar-benar akan menjadi penukar permainan dalam setiap erti yang praktikal. Tetapi sejauh mana perubahan permainan ini?

Pada masa ini, model AI seperti GPT-4 boleh membantu anda menyelesaikan tugas. Mereka boleh menulis e-mel, membuat jenaka, menyelesaikan masalah matematik atau mendraf catatan blog untuk anda. Walau bagaimanapun, mereka hanya boleh melakukan tugas tertentu itu dan tidak dapat menyelesaikan satu set tugasan berkaitan yang diperlukan untuk menyelesaikan tugas anda.

Katakan anda seorang pembangun web. Sebagai sebahagian daripada tugas anda, anda dijangka melakukan banyak perkara: mereka bentuk, menulis kod, menyelesaikan masalah dan banyak lagi. Pada masa ini, anda hanya boleh mewakilkan sebahagian daripada tugas ini kepada model AI pada satu masa. Mungkin anda boleh meminta model GPT-4 menulis kod untuk halaman utama, kemudian memintanya berbuat demikian untuk halaman kenalan, dan kemudian untuk halaman Perihal, dsb. Anda perlu melengkapkan tugasan ini secara berulang. Dan terdapat tugas yang model tidak dapat diselesaikan.

Proses berulang ini menggesa model AI untuk subtugas tertentu memakan masa dan tidak cekap. Dalam senario ini, anda—pembangun web—adalah ejen manusia yang bertanggungjawab untuk menyelaras dan menggesa model AI satu tugas pada satu masa sehingga anda menyelesaikan keseluruhan set tugasan yang berkaitan.

Ejen GPT menjanjikan bot pakar khusus yang diselaraskan oleh, diharapkan, GPT-5 mampu mendorong kendiri dan menangani semua subset tugas yang kompleks secara autonomi. Penekanan pada "dorongan diri" dan "berautonomi."

Jadi, jika GPT-5 dihantar dengan Ejen GPT, anda boleh memintanya untuk "membina tapak web portfolio untuk Maxwell Timothy" dan bukannya "tuliskan saya kod untuk halaman utama." GPT-5 kemudiannya secara teorinya akan dapat menggesa sendiri dengan menggunakan ejen AI pakar untuk mengendalikan pelbagai subtugas yang diperlukan untuk membina tapak web. Ia mungkin meminta satu GPT untuk menghapuskan web untuk mendapatkan maklumat tentang Maxwell Timothy, ejen lain untuk menulis kod untuk halaman yang berbeza, ejen lain untuk menjana dan mengoptimumkan imej, dan juga ejen AI lain untuk menggunakan tapak, semuanya tanpa memerlukan manusia berulang. menggesa.

4. Kurang Halusinasi

Walaupun OpenAI telah melangkah jauh dalam menangani halusinasi dalam model AInya, ujian litmus sebenar untuk GPT-5 ialah keupayaannya untuk menangani isu halusinasi yang berterusan, yang telah menghalang penyebaran yang meluas. penggunaan AI dalam domain yang berisiko tinggi, kritikal keselamatan seperti penjagaan kesihatan, penerbangan dan keselamatan siber. Ini semua adalah bidang yang akan mendapat banyak manfaat daripada penglibatan AI yang berat tetapi pada masa ini mengelak sebarang penggunaan penting.

Untuk kejelasan, halusinasi dalam konteks ini merujuk kepada situasi di mana model AI menjana dan mempersembahkan maklumat yang munasabah tetapi direka sepenuhnya dengan tahap keyakinan yang tinggi.

Bayangkan senario di mana GPT-4 disepadukan ke dalam sistem diagnostik untuk menganalisis gejala pesakit dan laporan perubatan. Halusinasi boleh menyebabkan AI dengan yakin memberikan diagnosis yang salah atau mengesyorkan kursus rawatan yang berpotensi berbahaya berdasarkan fakta yang dibayangkan dan logik palsu. Akibat kesilapan sedemikian dalam bidang perubatan boleh menjadi malapetaka.

Tempahan serupa digunakan untuk bidang lain yang berakibat tinggi, seperti penerbangan, kuasa nuklear, operasi maritim dan keselamatan siber. Kami tidak menjangkakan GPT-5 dapat menyelesaikan masalah halusinasi sepenuhnya, tetapi kami menjangkakan ia dapat mengurangkan dengan ketara kemungkinan kejadian sedemikian.

Semasa kami tidak sabar menanti keluaran rasmi model AI yang dinanti-nantikan ini, satu perkara yang pasti: GPT-5 berpotensi untuk mentakrifkan semula sempadan apa yang mungkin dengan kecerdasan buatan, yang membawa kepada era baharu kerjasama manusia-mesin dan inovasi.

Atas ialah kandungan terperinci GPT-5: 4 Ciri Baharu Yang Kami Ingin Lihat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn