Rumah  >  Artikel  >  Peranti teknologi  >  Kelemahan ChatGPT untuk sistem AI perbualan gred pengeluaran

Kelemahan ChatGPT untuk sistem AI perbualan gred pengeluaran

PHPz
PHPzke hadapan
2023-04-12 19:16:011612semak imbas

​Penterjemah |. Bugatti

Pengulas |. tentang cara orang harus berinteraksi dengan kecerdasan buatan (AI) ini. Dalam banyak cara, ChatGPT ialah versi yang dinaik taraf daripada pendahulunya, GPT-3.5, tetapi ia masih cenderung untuk menipu. Pakar mengatakan bahawa untuk aplikasi peringkat pengeluaran, pembangun AI boleh mempertimbangkan untuk menggabungkan ChatGPT dengan alat lain untuk penyelesaian yang lengkap.

ChatGPT dan GPT-3.5 dibangunkan oleh OpenAI dan dilatih pada Microsoft Azure Kedua-duanya adalah sistem AI perbualan berdasarkan model bahasa yang besar, tetapi terdapat perbezaan yang ketara.

Kelemahan ChatGPT untuk sistem AI perbualan gred pengeluaranPertama sekali, Generative Pre-training Transformer (GPT) 3.5 keluar lebih awal daripada ChatGPT, dan rangkaian neuralnya mempunyai lebih banyak lapisan daripada ChatGPT. GPT-3.5 telah dibangunkan sebagai model bahasa tujuan umum yang boleh mengendalikan banyak tugas, termasuk menterjemah bahasa, meringkaskan teks dan menjawab soalan. OpenAI menyediakan satu set antara muka API untuk GPT-3.5, yang menyediakan pembangun dengan cara yang lebih cekap untuk mengakses fungsinya.

ChatGPT adalah berdasarkan GPT-3.5 dan dibangunkan secara khusus sebagai chatbot ("ejen perbualan" ialah istilah yang diutamakan oleh industri). Satu faktor yang mengehadkan ialah ChatGPT hanya mempunyai antara muka teks dan tiada API. ChatGPT dilatih pada set teks perbualan yang besar, membolehkannya menjalankan perbualan dengan lebih baik daripada GPT-3.5 dan model generatif lain. Respons dijana lebih pantas daripada GPT-3.5, dan responsnya lebih tepat.

Walau bagaimanapun, kedua-dua model sering dibuat-buat, atau seperti yang dipanggil oleh industri, "halusinasi." Kadar halusinasi ChatGPT adalah antara 15% dan 21%. Pada masa yang sama, kadar halusinasi GPT-3.5 meningkat daripada sekitar 20% kepada 41%, jadi ChatGPT telah bertambah baik dalam hal ini.

Syarikat Silicon Valley Moveworks menggunakan model bahasa dan teknik pembelajaran mesin lain pada platform perbualan AInya, yang digunakan oleh syarikat dalam banyak industri. Jiang Chen, pengasas dan naib presiden pembelajaran mesin syarikat, berkata walaupun ia sering dibuat (masalah biasa dengan semua model bahasa), ChatGPT ialah peningkatan besar berbanding model AI sebelumnya.

Chen berkata: "ChatGPT benar-benar mengagumkan dan mengejutkan orang ramai Chen ialah bekas jurutera Google yang pakar dalam membangunkan enjin carian gergasi teknologi dengan nama yang sama." "Keupayaan penaakulannya mungkin mengejutkan ramai pengamal pembelajaran mesin."

Moveworks menggunakan pelbagai model bahasa dan teknik lain untuk membina sistem AI tersuai untuk pelanggan. Ia telah menjadi pengguna besar BERT, model bahasa sumber terbuka oleh Google beberapa tahun lalu. Syarikat itu menggunakan GPT-3.5 dan telah mula menggunakan ChatGPT.

Walau bagaimanapun, menurut Chen, ChatGPT mempunyai hadnya apabila membina sistem AI perbualan gred pengeluaran. Terdapat pelbagai faktor yang perlu ditimbang apabila membina sistem AI perbualan tersuai menggunakan jenis teknologi ini adalah penting untuk mengetahui di mana garisan dilukis untuk membina satu yang tidak memberikan jawapan yang salah, tidak terlalu berat sebelah, dan tidak terlalu berat sebelah; 't membuat orang menunggu sistem terlalu lama.

Chen berkata bahawa ChatGPT lebih baik daripada BERT dalam menjana respons yang bermakna untuk menjawab soalan. Khususnya, ChatGPT mempunyai keupayaan "penaakulan" yang lebih berkuasa daripada BERT, yang direka untuk meramalkan perkataan seterusnya dalam ayat.

Walaupun ChatGPT dan GPT-3.5 boleh memberikan jawapan yang meyakinkan untuk menjawab soalan, sifat tertutup mereka dari hujung ke hujung menghalang jurutera seperti Chen daripada melatih mereka. Ini juga mewujudkan halangan untuk menyesuaikan korpora untuk respons khusus industri (peruncit dan pengilang menggunakan perkataan yang berbeza daripada firma guaman dan kerajaan). Sifat tertutup ini juga menyukarkan untuk mengurangkan berat sebelah, katanya.

BERT cukup kecil untuk dihoskan oleh syarikat seperti Moveworks. Syarikat itu membina saluran paip data yang mengumpul data khusus untuk syarikat dan memasukkan data ke dalam model BERT untuk latihan. Kerja ini membolehkan Moveworks menggunakan tahap kawalan yang lebih tinggi ke atas produk AI perbualan akhir yang tidak boleh dilakukan dalam sistem tertutup seperti GPT-3.5 dan ChatGPT.

Chen berkata: “Timbunan pembelajaran mesin kami berlapis Kami menggunakan BERT, tetapi kami juga menggunakan algoritma pembelajaran mesin lain, yang membolehkan kami memasukkan logik khusus pelanggan dan data khusus pelanggan ke dalamnya >

Chen berkata walaupun model OpenAI jauh lebih besar dan terlatih pada korpora yang lebih besar, tidak ada cara untuk mengetahui sama ada ia sesuai untuk pelanggan tertentu.

Beliau berkata: "Model (ChatGPT) telah dilatih terlebih dahulu untuk mengekod semua pengetahuan yang dimasukkan ke dalamnya. Ia tidak direka untuk melaksanakan apa-apa tugas tertentu itu sendiri. Sebab mengapa ia boleh mempercepatkan dan mencapai pertumbuhan pesat adalah disebabkan oleh fakta bahawa seni bina itu sendiri sebenarnya sangat mudah Ia adalah lapisan demi lapisan perkara yang sama, jadi anda boleh mengatakan bahawa kerana seni bina ini, anda tahu bahawa ia mempunyai keupayaan untuk belajar, tetapi anda tidak tahu. di mana ia berada. Maklumat yang dikodkan Anda tidak tahu lapisan neuron mana yang mengekod maklumat khusus yang ingin anda simpulkan, jadi ia lebih kepada kotak hitam."

Chen percaya bahawa ChatGPT mungkin semakin meningkat, tetapi kegunaannya sebagai alat gred pengeluaran untuk AI perbualan mungkin agak dibesar-besarkan. Pendekatan yang lebih baik ialah memanfaatkan kekuatan berbilang model, dan bukannya memberi komitmen sepenuhnya kepada satu model tertentu, untuk lebih menyelaraskan dengan prestasi pelanggan, ketepatan, jangkaan berat sebelah dan keupayaan asas teknologi.

Dia berkata: "Strategi kami ialah menggunakan satu siri model berbeza di tempat yang berbeza. Anda boleh menggunakan model besar untuk mengajar model kecil, dan kemudian model kecil akan menjadi lebih banyak. lebih cepat. Contohnya, jika anda ingin melakukan carian bersegmen, anda harus menggunakan... beberapa jenis model BERT dan menjalankannya kerana beberapa jenis enjin carian vektor ChatGPT terlalu besar untuk ini sekarang aplikasi dunia sebenar, tetapi itu tidak bermakna ia tidak penting. Chen berkata bahawa salah satu impak berkekalan ChatGPT mungkin adalah untuk menarik perhatian pengamal dan memberi inspirasi kepada orang ramai untuk menolak sampul surat dari segi keberkesanan teknologi AI perbualan pada masa hadapan.

Dia berkata: "Saya rasa ia membuka bidang. Melihat ke hadapan, semasa kami membuka kotak hitam, saya fikir akan ada lebih banyak cara dan aplikasi yang menarik. Inilah yang kami teruja, dan kami komited untuk penyelidikan dan pembangunan dalam bidang ini ”

Tajuk asal:

Kelemahan ChatGPT untuk Sistem AI Perbualan Pengeluaran. , oleh Alex Woodie​

Atas ialah kandungan terperinci Kelemahan ChatGPT untuk sistem AI perbualan gred pengeluaran. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam