Rumah  >  Artikel  >  Peranti teknologi  >  Dua khabar angin dan ramalan terkini untuk GPT-4!

Dua khabar angin dan ramalan terkini untuk GPT-4!

王林
王林ke hadapan
2023-04-11 18:07:031048semak imbas

​Pengarang |. Yun Zhao

Pada 9 Mac, CTO Microsoft Jerman Andreas Braun membawakan berita yang ditunggu-tunggu pada persidangan permulaan AI: "Kami akan GPT-4 minggu ini, kami akan melancarkan mod berbilang modal yang menawarkan kemungkinan berbeza sama sekali - seperti video."

Dalam perkataan, beliau menyamakan model bahasa besar (LLM) dengan "penukar permainan" kerana ia mengajar mesin untuk memahami bahasa semula jadi, dan kemudian mesin secara statistik memahami perkara yang sebelum ini hanya boleh dibaca dan difahami oleh manusia. Pada masa yang sama, teknologi telah berkembang menjadi "tersedia untuk semua bahasa": anda boleh bertanya soalan dalam bahasa Jerman dan menjawab dalam bahasa Itali. Dengan pelbagai mod, Microsoft (-OpenAI) akan "menjadikan model komprehensif."

Dua khabar angin dan ramalan terkini untuk GPT-4!Nampaknya pada asasnya pasti GPT-4 akan menjadi model berbilang modal yang besar. Tetapi jika anda ingin mengetahui identiti sebenar GPT-4 terlebih dahulu, tidak mustahil untuk menemuinya.

1 Ramalan: GPT-4 adalah berdasarkan model bahasa besar pelbagai mod sebelumnya Kosmos-1

Malah, seawal 1 Mac, kami perhatikan yang diterbitkan oleh Microsoft Model bahasa besar berbilang modal Kosmos-1 dibangunkan. Jika GPT-4 adalah multi-modal, kita boleh meramalkan dengan munasabah kemampuan GPT-4.

KOSMOS-1 ialah model bahasa besar multimodal (MLLM) yang mampu melihat input multimodal, Ikut arahan dan melaksanakan kontekstual tugas pembelajaran, yang juga boleh menjadi tugas pelbagai modal. Dalam kerja ini, kami menyelaraskan penglihatan dengan model bahasa besar (LLM), memacu evolusi daripada LLM kepada MLLM.

Dua khabar angin dan ramalan terkini untuk GPT-4!

Jim Fan, doktor Stanford dan saintis AI Nvidia, membuat 5 ramalan khusus berdasarkan perkara ini:

(1) Ujian IQ Visual: Ya, ujian untuk manusia! (2) Tiada pemahaman bacaan OCR: masukkan tangkapan skrin, dokumen yang diimbas, papan tanda jalan atau sebarang piksel yang mengandungi teks. Menaakul secara langsung tentang kandungan tanpa OCR yang jelas. Ini berguna untuk membuka kunci aplikasi dipacu AI pada halaman web multimedia atau "teks di alam liar" daripada kamera dunia sebenar. (3) Sembang berbilang modal: Berbual tentang gambar. Anda juga boleh memberikan gambar "susulan" separuh jalan. (4) Keupayaan pemahaman visual yang luas, seperti sari kata, soalan dan jawapan visual, pengesanan objek, susun atur pemandangan, penaakulan akal, dsb. (5) Pengecaman audio dan pertuturan: Tidak disebut dalam kertas Kosmos-1, tetapi Whisper sudah pun menjadi API OpenAI dan sepatutnya mudah untuk disepadukan.

Dua khabar angin dan ramalan terkini untuk GPT-4!

Jim percaya bahawa mungkin terdapat beberapa percanggahan dalam ramalan berdasarkan pengumuman Andreas baru-baru ini. Tetapi Kosmos-1 telah pun melakukan ini. Terdapat sebab untuk mempercayai ia menyediakan keupayaan untuk GPT-4 atau apa sahaja perkhidmatan AI yang akan ditawarkan oleh Microsoft seterusnya. "Sukar untuk mempercayai bahawa Kosmos-1 akan kekal di makmal dan tidak menjadi produk."

Dua khabar angin dan ramalan terkini untuk GPT-4!

Contoh aplikasi model besar berbilang modal: tangkapan imej, soal jawab imej, OCR, dialog visual

Dua khabar angin dan ramalan terkini untuk GPT-4!Jim menasihati pengamal, "Sila bersedia untuk API berbilang modal - ia akan muncul lambat laun!"

2 AGI ? Jauh dari cukup

Pertama sekali, isu ketepatan masih belum mencukupi. Apabila ditanya tentang kebolehpercayaan operasi dan kesetiaan fakta, Siebler, pakar kecerdasan buatan kanan di Microsoft Germany, berkata bahawa AI tidak akan sentiasa menjawab dengan betul, jadi pengesahan diperlukan. Microsoft sedang mencipta metrik keyakinan untuk menangani isu ini. Pelanggan biasanya hanya menggunakan sokongan AI pada set data mereka sendiri, terutamanya untuk pemahaman membaca dan menanyakan data inventori, di mana modelnya sudah agak tepat Walau bagaimanapun, teks yang dijana oleh model masih bersifat generatif dan oleh itu tidak mudah disahkan. "Kami membina gelung maklum balas di sekelilingnya, baik pro dan kontra," kata Siebler "Ia adalah proses berulang."

Kedua, data tidak mencukupi. Walaupun GPT-4 berbilang modal akan menunjukkan keupayaan penglihatan, pendengaran, kefahaman membaca dan penaakulan yang kuat, ini hanyalah puncak gunung ais AGI Mengambil robot humanoid sebagai contoh, adalah sukar untuk menyatukan data kawalan robot, dan ,Data kawalan ini berkaitan dengan robot, perkakasan dan sangat berbeza. Oleh itu, data latihan daripada robot sebenar yang berbeza tidak boleh digabungkan dengan mudah, yang secara kualitatif berbeza daripada data seperti teks, video, imej, audio, dll.

3. Dua khabar angin tentang GPT-4

1. palsu!

GPT-4 ialah model bahasa baharu yang dicipta oleh OpenAI yang boleh menjana teks yang serupa dengan pertuturan manusia. Ia akan memajukan teknologi yang digunakan oleh ChatGPT, yang berasaskan GPT-3.5.

Seawal Ogos 2021, pakar industri membuat spekulasi bahawa GPT-4 akan mempunyai 100 trilion parameter, tetapi sesetengah orang berkata pada masa itu: Membina AI dengan lebih banyak parameter mungkin tidak semestinya Menjamin prestasi yang lebih baik dan boleh menjejaskan tindak balas.

Dua khabar angin dan ramalan terkini untuk GPT-4!

Tetapi Altman, bapa ChatGPT, segera menyangkal khabar angin: versi ChatGPT seterusnya tidak akan menjadi AGI, juga tidak akan Terdapat 100 trilion parameter. Khabar angin itu tidak betul.

2. Adakah sembang Bing menggunakan GPT-4?

Microsoft telah mengatakan bahawa Bing atau Bing Chat baharu lebih berkuasa daripada ChatGPT. Memandangkan sembang OpenAI menggunakan GPT-3.5, ada yang membuat spekulasi bahawa sembang Bing mungkin menggunakan GPT-4. Ini belum disahkan.

Jelas sekali, Bing Chat telah dinaik taraf untuk menyediakan akses kepada maklumat semasa melalui Internet, yang merupakan peningkatan besar berbanding ChatGPT, yang sehingga kini hanya boleh mendapat manfaat daripada data latihan yang diterima sebelum 2021.

Selain akses Internet, model AI yang digunakan untuk sembang Bing adalah lebih pantas, yang sangat penting apabila dibawa keluar dari makmal dan ditambah pada enjin carian.

Tetapi ini nampaknya tidak setara dengan model GPT-4 OpenAI. Jika GPT-4 sudah tersedia secara umum, tidak perlu merahsiakannya lagi.

4. GPT-4: Satu evolusi, bukan revolusi

Tidak syak lagi bahawa GPT-4 yang akan datang pasti akan meninggalkan kesan mendalam kepada orang ramai. tetapi Ketua Pegawai Eksekutif OpenAI Sam Altman berkata dalam temu bual dengan StrictlyVC, "Orang ramai 'memohon' untuk kecewa, dan mereka akan kecewa

Altman juga berkata di Twitter sebelum ini : AGI telah. potensi untuk menyebabkan gangguan besar kepada ekonomi dunia, mengatakan bahawa melancarkan beberapa perubahan kecil dengan cepat adalah lebih baik daripada kemajuan mengejutkan yang memberi dunia sedikit peluang untuk menyesuaikan diri.

Kebetulan, master kecerdasan buatan bertaraf dunia Ben Goertzel juga menuang banyak air sejuk pada GPT-3/GPT-4:

Sudah tentu, Sekarang kita harus ambil perhatian bahawa jumlah dolar dan tenaga kerja yang dilaburkan dalam sistem "penyusunan semula pengetahuan" ini (seperti ChatGPT) adalah jauh lebih besar daripada jumlah yang dilaburkan dalam pendekatan AI alternatif yang lebih menghormati akar kognisi pembetulan kendiri yang berasaskan. Kerumitan.

Skeptisisme keseluruhan rangkaian neural berbilang lapisan dan penggunaan sistem pakar pada akhir 1970-an-awal 1990-an kelihatan naif, kuno dan bodoh, sama seperti sekarang.

Begitu juga, keghairahan bermata bintang hari ini untuk LLM dan penyingkiran pendekatan AGI yang lebih halus akan kelihatan tidak masuk akal menjelang pertengahan/akhir 2020

Maksud saya dalam siaran ini bukanlah bahawa sistem berasaskan LLM ini tidak hebat atau tidak berguna - cuma ia adalah teknologi AI sempit baharu yang bergaya yang tidak berkait rapat dengan AGI seperti yang muncul di permukaan, atau sebagainya yang didakwa oleh sesetengah pengulas.

Ringkasnya, GPT-4 akan menjadi evolusi, bukan revolusi.

5. Ditulis pada penghujung

Jelas sekali, ChatGPT 4 tidak mungkin menjadi nama produk OpenAI yang seterusnya, tetapi ia akan membawa beberapa imaginasi kreatif, nama ChatGPT, kemungkinan besar digabungkan dengan model AI GPT-4 yang memacu peningkatannya. Pengamal dan pengurus AI perlu menumpukan pada kemajuan kerja semasa GPT-4 dan ChatGPT, dan apabila OpenAI mungkin mengeluarkan peningkatan besar seterusnya.

Akhir sekali, saya ingin mengatakan kepada semua orang bahawa tidak penting sama ada keluaran GPT-4 minggu depan adalah selaras dengan ramalan artikel ini, termasuk model domestik yang besar "Wen Xinyiyan" yang kami nantikan. Apa yang penting ialah sama ada pembangun atau syarikat mereka bersedia untuk menerima API model besar berbilang modal. Alangkah bertuahnya bahawa semua ini diharapkan akan datang sebelum 2024!

Pautan rujukan:

https://arxiv.org/abs/2302.14045

https://www.heise.de/news/ GPT-4-akan-akan-minggu-depan-dan-ia-akan-menjadi-multimodal-kata-Microsoft-Germany-7540972.html

https://t.co/JbtQvjoJ3W

Atas ialah kandungan terperinci Dua khabar angin dan ramalan terkini untuk GPT-4!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam