Rumah > Artikel > Peranti teknologi > Apakah maklumat yang anda perlu ketahui tentang aplikasi GPT-4?
Sejak OpenAI mengeluarkan model bahasa besar GPT-4, orang ramai telah cuba menggunakan aplikasi yang menarik ini. GPT-4 boleh menjana kod HTML daripada model tapak web lukisan tangan. Ramai pengguna telah membuktikan bahawa ia boleh mencari alamat fizikal daripada transaksi kad kredit, menjana draf tuntutan mahkamah, lulus ujian matematik SAT, membantu dalam pendidikan dan latihan, dan juga mencipta permainan penembak orang pertama.
Kuasa GPT-4 benar-benar menakjubkan, dan apabila semakin ramai pengguna mengakses versi berbilang modnya, seseorang boleh menjangkakan lebih banyak model bahasa berskala besar akan dilancarkan . Walau bagaimanapun, sementara orang ramai meraikan kemajuan yang telah dicapai oleh saintis dalam bidang model bahasa berskala besar, batasan mereka juga mesti diperhatikan.
Model bahasa yang besar seperti GPT-4 boleh melaksanakan banyak tugas, tetapi ia tidak semestinya alat terbaik untuk mereka. Jika mereka menyelesaikan tugas dengan jayanya, ini tidak bermakna mereka lebih dipercayai dalam bidang itu.
GPT-4 mencetuskan ramai pengguna untuk mengkritik OpenAI selepas dikeluarkan, kebanyakannya adalah wajar. Dengan setiap keluaran GPT, butiran teknikal mereka menjadi semakin legap. Laporan teknikal yang dikeluarkan oleh OpenAI apabila mengeluarkan GPT-4 mengandungi beberapa butiran tentang seni bina model, data latihan dan aspek penting lain. Terdapat pelbagai tanda bahawa OpenAI secara beransur-ansur berubah daripada makmal penyelidikan kecerdasan buatan kepada syarikat yang menjual produk kecerdasan buatan.
Walau bagaimanapun, ini tidak mengurangkan kejayaan teknologi yang menarik yang didayakan oleh model bahasa yang besar. Syarikat OpenAI telah memainkan peranan penting dalam pembangunan teknologi ini. Dalam beberapa tahun sahaja, kami telah beralih daripada model pembelajaran mendalam yang paling sederhana yang mengendalikan tugasan bahasa kepada model bahasa besar yang boleh menjana teks yang sangat mirip manusia, sekurang-kurangnya di permukaan.
Selain itu, memandangkan parameter yang mencukupi, kuasa pengkomputeran dan data latihan, Transformer (seni bina yang digunakan dalam model bahasa besar) boleh belajar melaksanakan berbilang tugas menggunakan satu model. Ini penting kerana sehingga baru-baru ini, model pembelajaran mendalam dianggap sesuai untuk melaksanakan satu tugas sahaja. Model bahasa yang besar kini boleh melaksanakan beberapa tugas dengan pembelajaran sifar tangkapan dan beberapa syot kilat, malah menunjukkan keupayaan yang muncul semasa menskalakan.
ChatGPT menunjukkan sepenuhnya keupayaan terkini model bahasa berskala besar. Ia boleh melakukan pengekodan, Soal Jawab, penjanaan teks dan banyak tugas lain dalam satu perbualan. Ia melakukan tugas yang lebih baik mengikut arahan terima kasih kepada teknik latihan yang dipanggil Pembelajaran Pengukuhan daripada Maklum Balas Manusia (RLHF).
GPT-4 dan model bahasa multimodal lain menunjukkan gelombang keupayaan baharu, seperti memasukkan imej dan mesej suara dalam perbualan.
Setelah anda melampaui pencapaian saintifik, anda boleh mula berfikir tentang aplikasi yang boleh disediakan oleh model bahasa besar seperti GPT-4. Bagi orang ramai, prinsip panduan dalam menentukan sama ada model bahasa besar sesuai untuk diaplikasikan ialah mekaniknya.
Seperti model pembelajaran mesin lain, model bahasa besar ialah mesin ramalan. Berdasarkan corak dalam data latihan, mereka meramalkan token seterusnya dalam urutan input yang mereka terima, dan mereka melakukan ini dengan sangat cekap.
Ramalan token seterusnya ialah penyelesaian yang bagus untuk tugasan tertentu seperti penjanaan teks. Apabila model bahasa besar dilatih dengan teknik mengikut arahan seperti RLHF, ia boleh melaksanakan tugas bahasa seperti menulis artikel, meringkaskan teks, menerangkan konsep dan menjawab soalan dengan hasil yang menakjubkan. Ini adalah salah satu penyelesaian yang paling tepat dan berguna pada masa ini untuk model bahasa yang besar.
Walau bagaimanapun, model bahasa besar masih terhad dalam keupayaannya untuk penjanaan teks. Model bahasa yang besar sering berhalusinasi, atau membuat perkara yang tidak betul. Oleh itu, seseorang tidak seharusnya mempercayai mereka sebagai sumber ilmu. Ini termasuk GPT-4. Sebagai contoh, dalam penerokaan ChatGPT oleh pakar industri, didapati bahawa ia kadangkala boleh menghasilkan penerangan yang sangat fasih tentang topik yang kompleks, seperti cara pembelajaran mendalam berfungsi. Ini membantu apabila dia cuba menerangkan konsep kepada seseorang yang mungkin tidak memahaminya, tetapi juga mendapati bahawa ChatGPT boleh membuat beberapa kesilapan fakta juga.
Untuk penjanaan teks, peraturan biasa daripada pakar industri ialah hanya mempercayai GPT-4 dalam domain yang anda biasa dan outputnya boleh disahkan. Terdapat cara untuk meningkatkan ketepatan output, termasuk memperhalusi model dengan pengetahuan khusus domain atau menyediakan konteks untuk gesaan dengan menambahkan maklumat yang berkaitan sebelum itu. Tetapi sekali lagi, kaedah ini memerlukan seseorang itu cukup mengetahui tentang bidang tersebut untuk dapat memberikan pengetahuan tambahan. Oleh itu, jangan percaya GPT-4 untuk menghasilkan teks tentang kesihatan, nasihat undang-undang atau sains melainkan anda sudah mengetahui topik ini.
Penjanaan kod ialah satu lagi aplikasi menarik GPT-4. Pakar industri telah menyemak GitHub Copilot, yang berdasarkan versi tweak GPT-3 dan menggunakan nama Codex. Penjanaan kod menjadi semakin cekap apabila ia disepadukan ke dalam IDEnya (seperti Copilot) dan boleh menggunakan kod sedia ada sebagai senario untuk meningkatkan output model bahasa yang besar. Walau bagaimanapun, peraturan yang sama masih digunakan. Hanya gunakan model bahasa yang besar untuk menjana kod yang boleh diaudit sepenuhnya. Mempercayai model bahasa besar secara membuta tuli boleh menyebabkan kod tidak berfungsi dan tidak selamat.
Untuk sesetengah tugas, model bahasa seperti GPT-4 bukanlah penyelesaian yang ideal, walaupun ia boleh menyelesaikan contoh. Sebagai contoh, salah satu topik yang sering dibincangkan ialah keupayaan model bahasa besar untuk melaksanakan matematik. Mereka telah diuji pada penanda aras matematik yang berbeza. GPT-4 dilaporkan berprestasi sangat baik pada ujian matematik yang kompleks.
Walau bagaimanapun, perlu diperhatikan bahawa model bahasa yang besar tidak mengira persamaan matematik langkah demi langkah seperti yang dilakukan oleh manusia. Apabila GPT-4 diberi gesaan "1+1=", orang akan diberi jawapan yang betul. Tetapi di sebalik tabir, ia tidak melakukan operasi "tambah" dan "pindah". Ia melakukan operasi matriks yang sama seperti semua input lain, meramalkan token seterusnya dalam jujukan. Ia memberikan jawapan kebarangkalian kepada soalan deterministik. Inilah sebabnya mengapa ketepatan GPT-4 dan model bahasa besar matematik lain banyak bergantung pada set data latihan dan berfungsi secara kebetulan. Seseorang mungkin melihat mereka mencapai keputusan yang menakjubkan dalam masalah matematik yang sangat kompleks tetapi gagal dalam masalah matematik asas yang mudah.
Ini tidak bermakna GPT-4 tidak berguna untuk matematik. Satu pendekatan ialah menggunakan teknik penambahan model, seperti menggabungkan model bahasa besar dengan penyelesai matematik. Model bahasa besar mengekstrak data persamaan daripada gesaan dan menyerahkannya kepada penyelesai, yang mengira dan mengembalikan hasilnya.
Satu lagi kes penggunaan yang menarik untuk GPT-4 ialah apa yang Khan Academy lakukan. Mereka menyepadukan kursus model bahasa berskala besar ke dalam platform pembelajaran dalam talian mereka untuk berkhidmat sebagai tutor untuk pelajar dan pembantu untuk guru. Memandangkan ini adalah salah satu rakan kongsi OpenAI yang diiklankan semasa GPT-4 dikeluarkan, mereka mungkin telah memperhalusi GPT-4 berdasarkan kandungan kursus mereka. Model ini juga disepadukan dengan baik dengan kandungan platform untuk menyediakan senario dan mengurangkan ralat. Tetapi perlu diingat bahawa GPT-4 tidak direka untuk menyelesaikan masalah matematik, tetapi untuk membimbing pelajar dan guru untuk belajar dan mengajar konsep matematik.
Setelah pengguna memutuskan sama ada GPT-4 sesuai untuk aplikasi mereka, ia mesti dilihat dari perspektif produk. Setiap token yang dijana oleh GPT-4 adalah hasil daripada ratusan bilion operasi. Soalan pertama yang mesti ditanya oleh pengguna kepada diri mereka sendiri ialah, "Adakah aplikasi saya memerlukan pengiraan sedemikian, sebenarnya, dalam banyak kes, walaupun GPT-4 memberikan jawapan yang sempurna, mungkin terdapat penyelesaian yang lebih mudah, lebih cepat dan lebih rendah. Sebagai contoh, dalam kebanyakan kes penyelesaian mudah seperti ungkapan biasa adalah lebih berkesan untuk mengekstrak maklumat.
Malah, pakar industri mengadakan perbualan yang menarik dengan ChatGPT, di mana mereka bertanya kepada ChatGPT apakah maksud "GPT-ify". ChatGPT menerangkannya sebagai "teknologi dan keupayaan model bahasa berdasarkan seni bina GPT (Generate Pretrained Transformer), seperti GPT-3 atau GPT-Neo, digunakan untuk tugas atau masalah tertentu." jika GPT-ify boleh digunakan untuk mengejek orang yang menggunakan GPT untuk melakukan perkara yang tidak memerlukannya. ChatGPT bertindak balas dengan cara ini: "Ya, GPT-ify sudah tentu boleh digunakan secara sindiran atau sindiran untuk mencadangkan bahawa seseorang terlebih menggunakan atau menyalahgunakan GPT untuk tugas atau masalah yang tidak memerlukan model bahasa yang begitu kompleks. Contohnya, jika seseorang menggunakan pra- model GPT terlatih untuk menjana senarai beli-belah yang mudah, seseorang mungkin bergurau bahawa mereka telah 'GPTified senarai beli-belah mereka'"
Jadi, jangan GPTify produk tanpa meneroka pilihan lain. . Seperti semua teknologi lain, GPT-4 harus dianggap sebagai salah satu daripada banyak alat dalam kotak alat produk. Seperti yang dinasihatkan oleh ChatGPT, "Kuncinya ialah memilih alat yang sesuai untuk tugas itu, berdasarkan keperluan khusus dan kekangan tugas semasa."
Atas ialah kandungan terperinci Apakah maklumat yang anda perlu ketahui tentang aplikasi GPT-4?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!