Rumah > Artikel > Peranti teknologi > Dua khabar angin dan ramalan terkini untuk GPT-4!
Pengarang |. Yun Zhao
Pada 9 Mac, CTO Microsoft Jerman Andreas Braun membawakan berita yang ditunggu-tunggu pada persidangan permulaan AI: "Kami akan GPT-4 minggu ini, kami akan melancarkan mod berbilang modal yang menawarkan kemungkinan berbeza sama sekali - seperti video."
Dalam perkataan, beliau menyamakan model bahasa besar (LLM) dengan "penukar permainan" kerana ia mengajar mesin untuk memahami bahasa semula jadi, dan kemudian mesin secara statistik memahami perkara yang sebelum ini hanya boleh dibaca dan difahami oleh manusia. Pada masa yang sama, teknologi telah berkembang menjadi "tersedia untuk semua bahasa": anda boleh bertanya soalan dalam bahasa Jerman dan menjawab dalam bahasa Itali. Dengan pelbagai mod, Microsoft (-OpenAI) akan "menjadikan model komprehensif."Nampaknya pada asasnya pasti GPT-4 akan menjadi model berbilang modal yang besar. Tetapi jika anda ingin mengetahui identiti sebenar GPT-4 terlebih dahulu, tidak mustahil untuk menemuinya.
1 Ramalan: GPT-4 adalah berdasarkan model bahasa besar pelbagai mod sebelumnya Kosmos-1
Malah, seawal 1 Mac, kami perhatikan yang diterbitkan oleh Microsoft Model bahasa besar berbilang modal Kosmos-1 dibangunkan. Jika GPT-4 adalah multi-modal, kita boleh meramalkan dengan munasabah kemampuan GPT-4.
KOSMOS-1 ialah model bahasa besar multimodal (MLLM) yang mampu melihat input multimodal, Ikut arahan dan melaksanakan kontekstual tugas pembelajaran, yang juga boleh menjadi tugas pelbagai modal. Dalam kerja ini, kami menyelaraskan penglihatan dengan model bahasa besar (LLM), memacu evolusi daripada LLM kepada MLLM. Jim Fan, doktor Stanford dan saintis AI Nvidia, membuat 5 ramalan khusus berdasarkan perkara ini: (1) Ujian IQ Visual: Ya, ujian untuk manusia! (2) Tiada pemahaman bacaan OCR: masukkan tangkapan skrin, dokumen yang diimbas, papan tanda jalan atau sebarang piksel yang mengandungi teks. Menaakul secara langsung tentang kandungan tanpa OCR yang jelas. Ini berguna untuk membuka kunci aplikasi dipacu AI pada halaman web multimedia atau "teks di alam liar" daripada kamera dunia sebenar. (3) Sembang berbilang modal: Berbual tentang gambar. Anda juga boleh memberikan gambar "susulan" separuh jalan. (4) Keupayaan pemahaman visual yang luas, seperti sari kata, soalan dan jawapan visual, pengesanan objek, susun atur pemandangan, penaakulan akal, dsb. (5) Pengecaman audio dan pertuturan: Tidak disebut dalam kertas Kosmos-1, tetapi Whisper sudah pun menjadi API OpenAI dan sepatutnya mudah untuk disepadukan. Jim percaya bahawa mungkin terdapat beberapa percanggahan dalam ramalan berdasarkan pengumuman Andreas baru-baru ini. Tetapi Kosmos-1 telah pun melakukan ini. Terdapat sebab untuk mempercayai ia menyediakan keupayaan untuk GPT-4 atau apa sahaja perkhidmatan AI yang akan ditawarkan oleh Microsoft seterusnya. "Sukar untuk mempercayai bahawa Kosmos-1 akan kekal di makmal dan tidak menjadi produk." Contoh aplikasi model besar berbilang modal: tangkapan imej, soal jawab imej, OCR, dialog visual
Jim menasihati pengamal, "Sila bersedia untuk API berbilang modal - ia akan muncul lambat laun!"
2 AGI ? Jauh dari cukup
Pertama sekali, isu ketepatan masih belum mencukupi. Apabila ditanya tentang kebolehpercayaan operasi dan kesetiaan fakta, Siebler, pakar kecerdasan buatan kanan di Microsoft Germany, berkata bahawa AI tidak akan sentiasa menjawab dengan betul, jadi pengesahan diperlukan. Microsoft sedang mencipta metrik keyakinan untuk menangani isu ini. Pelanggan biasanya hanya menggunakan sokongan AI pada set data mereka sendiri, terutamanya untuk pemahaman membaca dan menanyakan data inventori, di mana modelnya sudah agak tepat Walau bagaimanapun, teks yang dijana oleh model masih bersifat generatif dan oleh itu tidak mudah disahkan. "Kami membina gelung maklum balas di sekelilingnya, baik pro dan kontra," kata Siebler "Ia adalah proses berulang."
3. Dua khabar angin tentang GPT-4
1. palsu!
GPT-4 ialah model bahasa baharu yang dicipta oleh OpenAI yang boleh menjana teks yang serupa dengan pertuturan manusia. Ia akan memajukan teknologi yang digunakan oleh ChatGPT, yang berasaskan GPT-3.5.
Seawal Ogos 2021, pakar industri membuat spekulasi bahawa GPT-4 akan mempunyai 100 trilion parameter, tetapi sesetengah orang berkata pada masa itu: Membina AI dengan lebih banyak parameter mungkin tidak semestinya Menjamin prestasi yang lebih baik dan boleh menjejaskan tindak balas.
Tetapi Altman, bapa ChatGPT, segera menyangkal khabar angin: versi ChatGPT seterusnya tidak akan menjadi AGI, juga tidak akan Terdapat 100 trilion parameter. Khabar angin itu tidak betul.
Microsoft telah mengatakan bahawa Bing atau Bing Chat baharu lebih berkuasa daripada ChatGPT. Memandangkan sembang OpenAI menggunakan GPT-3.5, ada yang membuat spekulasi bahawa sembang Bing mungkin menggunakan GPT-4. Ini belum disahkan.
Jelas sekali, Bing Chat telah dinaik taraf untuk menyediakan akses kepada maklumat semasa melalui Internet, yang merupakan peningkatan besar berbanding ChatGPT, yang sehingga kini hanya boleh mendapat manfaat daripada data latihan yang diterima sebelum 2021.
Selain akses Internet, model AI yang digunakan untuk sembang Bing adalah lebih pantas, yang sangat penting apabila dibawa keluar dari makmal dan ditambah pada enjin carian.
Tetapi ini nampaknya tidak setara dengan model GPT-4 OpenAI. Jika GPT-4 sudah tersedia secara umum, tidak perlu merahsiakannya lagi.
Tidak syak lagi bahawa GPT-4 yang akan datang pasti akan meninggalkan kesan mendalam kepada orang ramai. tetapi Ketua Pegawai Eksekutif OpenAI Sam Altman berkata dalam temu bual dengan StrictlyVC, "Orang ramai 'memohon' untuk kecewa, dan mereka akan kecewa
Altman juga berkata di Twitter sebelum ini : AGI telah. potensi untuk menyebabkan gangguan besar kepada ekonomi dunia, mengatakan bahawa melancarkan beberapa perubahan kecil dengan cepat adalah lebih baik daripada kemajuan mengejutkan yang memberi dunia sedikit peluang untuk menyesuaikan diri.
Kebetulan, master kecerdasan buatan bertaraf dunia Ben Goertzel juga menuang banyak air sejuk pada GPT-3/GPT-4:
Sudah tentu, Sekarang kita harus ambil perhatian bahawa jumlah dolar dan tenaga kerja yang dilaburkan dalam sistem "penyusunan semula pengetahuan" ini (seperti ChatGPT) adalah jauh lebih besar daripada jumlah yang dilaburkan dalam pendekatan AI alternatif yang lebih menghormati akar kognisi pembetulan kendiri yang berasaskan. Kerumitan.
Skeptisisme keseluruhan rangkaian neural berbilang lapisan dan penggunaan sistem pakar pada akhir 1970-an-awal 1990-an kelihatan naif, kuno dan bodoh, sama seperti sekarang.
Begitu juga, keghairahan bermata bintang hari ini untuk LLM dan penyingkiran pendekatan AGI yang lebih halus akan kelihatan tidak masuk akal menjelang pertengahan/akhir 2020
Maksud saya dalam siaran ini bukanlah bahawa sistem berasaskan LLM ini tidak hebat atau tidak berguna - cuma ia adalah teknologi AI sempit baharu yang bergaya yang tidak berkait rapat dengan AGI seperti yang muncul di permukaan, atau sebagainya yang didakwa oleh sesetengah pengulas.
Ringkasnya, GPT-4 akan menjadi evolusi, bukan revolusi.
Jelas sekali, ChatGPT 4 tidak mungkin menjadi nama produk OpenAI yang seterusnya, tetapi ia akan membawa beberapa imaginasi kreatif, nama ChatGPT, kemungkinan besar digabungkan dengan model AI GPT-4 yang memacu peningkatannya. Pengamal dan pengurus AI perlu menumpukan pada kemajuan kerja semasa GPT-4 dan ChatGPT, dan apabila OpenAI mungkin mengeluarkan peningkatan besar seterusnya.
Akhir sekali, saya ingin mengatakan kepada semua orang bahawa tidak penting sama ada keluaran GPT-4 minggu depan adalah selaras dengan ramalan artikel ini, termasuk model domestik yang besar "Wen Xinyiyan" yang kami nantikan. Apa yang penting ialah sama ada pembangun atau syarikat mereka bersedia untuk menerima API model besar berbilang modal. Alangkah bertuahnya bahawa semua ini diharapkan akan datang sebelum 2024!
Pautan rujukan:
https://arxiv.org/abs/2302.14045
https://www.heise.de/news/ GPT-4-akan-akan-minggu-depan-dan-ia-akan-menjadi-multimodal-kata-Microsoft-Germany-7540972.html
https://t.co/JbtQvjoJ3W
Atas ialah kandungan terperinci Dua khabar angin dan ramalan terkini untuk GPT-4!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!