Rumah >Peranti teknologi >AI >DeepMind mengeluarkan artikel 30 halaman: Kami perlu memberikan 'tiga paparan' yang berbeza kepada chatbots
Bahasa ialah kemahiran manusia yang unik dan cara utama kita menyampaikan maklumat seperti fikiran, niat dan perasaan.
Dengan bantuan model bahasa berskala besar dalam bidang NLP, penyelidik AI telah melatih, meramalkan secara statistik dan menghasilkan teks pada sejumlah besar bahan teks, dan membangunkan banyak agen perbualan) untuk berkomunikasi dengan manusia.
Walaupun model bahasa seperti InstructGPT, Gopher dan LaMDA telah mencapai tahap prestasi rekod dalam tugasan seperti terjemahan, menjawab soalan dan pemahaman bacaan, model ini juga mempamerkan banyak potensi risiko dan mod kegagalan, termasuk Diskriminasi generasi, maklumat palsu atau mengelirukan.
Kekurangan ini mengehadkan penggunaan agen perbualan yang berkesan dalam konteks yang digunakan dan menarik perhatian kepada cara mereka gagal untuk memenuhi cita-cita komunikasi tertentu. Setakat ini, kebanyakan pendekatan kepada konsistensi ejen perbualan telah menumpukan pada meramal dan mengurangkan risiko bahaya.
Penyelidik dari Universiti Edinburgh dan DeepMind baru-baru ini menerbitkan kertas kerja setebal 30 halaman yang meneroka bagaimana rupa komunikasi yang berjaya antara manusia dan ejen perbualan tiruan, dan nilai-nilai yang harus membimbing pelbagai bidang perbualan.
Pautan kertas: https://arxiv.org/abs/2209.00731
Adakah chatbot yang bercakap dengan anda pada masa hadapan juga mempunyai pandangan dunia, nilai dan pandangan hidup yang berbeza?
Untuk merumuskan garis panduan tingkah laku untuk robot, penyelidik menggunakan pragmatik, tradisi dalam linguistik dan falsafah yang mempertimbangkan tujuan perbualan, latar belakang dan satu siri norma yang berkaitan (norma). ) adalah semua komponen penting untuk menambah baik amalan dialog.
Ahli bahasa dan ahli falsafah Paul Grice percaya bahawa dialog ialah usaha kolaboratif antara dua atau lebih pihak di mana peserta harus:
Bercakap secara bermaklumat
Tell the Truth
Berikan Maklumat Berkaitan
Elakkan Pernyataan Kabur atau Kabur
Tetapi dalam kawasan perbualan yang berbeza, jadi Matlamat dan nilai yang diperlukan adalah berbeza, dan penunjuk ini perlu dipertingkatkan lagi sebelum ia boleh digunakan untuk menilai agen perbualan.
Sebagai contoh, penyiasatan saintifik dan komunikasi (penyiasatan saintifik dan komunikasi) terutamanya untuk memahami atau meramalkan fenomena empirikal. Dengan mengambil kira matlamat ini, ejen perbualan yang direka bentuk untuk membantu penyiasatan saintifik adalah lebih baik untuk mengeluarkan hanya kenyataan yang kebenarannya disahkan oleh bukti empirikal yang mencukupi, atau melayakkan kedudukannya dari segi selang keyakinan yang berkaitan.
Seorang ejen boleh melaporkan bahawa "Pada jarak 4.246 tahun cahaya, Centauri ialah bintang paling hampir dengan Bumi" hanya selepas model asasnya menyemak sama ada pernyataan itu konsisten dengan fakta.
Walau bagaimanapun, ejen perbualan yang memainkan peranan sebagai moderator dalam wacana politik awam mungkin perlu mempamerkan "kebaikan" yang sama sekali berbeza.
Dalam kes ini, matlamat ejen adalah terutamanya untuk mengurus perbezaan dan mencapai kerjasama yang produktif dalam kehidupan masyarakat, yang bermaksud bahawa ejen perlu menekankan nilai-nilai demokrasi iaitu toleransi, beradab dan hormat-menghormati.
Tambahan pula, nilai-nilai ini juga menjelaskan mengapa model bahasa menjana pertuturan toksik atau berat sebelah: pertuturan yang melanggar gagal menyampaikan penghormatan yang sama dalam kalangan peserta perbualan, yang merupakan kunci kepada persekitaran di mana model itu digunakan Tatakelakuan.
Pada masa yang sama, kebaikan saintis, seperti pembentangan penuh data empirikal, mungkin kurang penting dalam konteks perbincangan awam.
Untuk contoh lain, dalam bidang penceritaan kreatif, matlamat komunikasi adalah kebaharuan dan keaslian, dan nilai-nilai ini juga sangat berbeza daripada bidang sebelumnya.
Dalam kes ini, latitud yang lebih besar mengenai "fiksyen" mungkin sesuai, walaupun masih penting untuk melindungi komuniti daripada kandungan berniat jahat di bawah nama "penggunaan kreatif."
Ucapan boleh dibahagikan kepada lima kategori mengikut pragmatik:
1. dan kandungan ayat itu selaras dengan beberapa keadaan di dunia.
Sebagai contoh, apabila pembantu AI menjawab soalan seperti "Bagaimana keadaan cuaca sekarang?", jawapan "Hujan" adalah pernyataan yang tegas.
Keaslian kandungan ucapan boleh dinilai berdasarkan keadaan sebenar sesuatu. Jika hujan ketika agen perbualan bertindak balas, maka pernyataan itu adalah benar, jika tidak, ia adalah palsu.
2. Arahan bermaksud penceramah mengarahkan pendengar untuk mengambil tindakan tertentu Ia sering digunakan untuk memerintah, meminta, mencadangkan atau mencadangkan.
Sebagai contoh, ejen perbualan yang dibenamkan dalam aplikasi nasihat perubatan yang memberitahu pengguna untuk "mendapatkan rawatan dengan segera" ialah pernyataan penting.
Penilaian pernyataan ini, atau "kriteria kesahihan"nya, bergantung pada pemahaman yang tepat tentang hubungan antara cara dan tujuan, dan pada kesesuaian antara arahan penutur dan kehendak atau keperluan pendengar .
Sesuatu arahan itu berjaya jika ia memujuk pendengar untuk mencapai keadaan tertentu di dunia berdasarkan kandungan pernyataan injunksi. Sesuatu arahan adalah berharga atau betul jika matlamat atau tujuannya adalah satu yang pendengar mempunyai sebab untuk meneruskan.
3. Ekspresif, menunjukkan keadaan emosi psikologi atau sekunder penceramah, seperti ucapan tahniah, terima kasih dan permohonan maaf.
Apabila rakan bicara berkata "Saya sangat marah sekarang" itu adalah pernyataan ekspresif.
Pernyataan ekspresif bertujuan untuk mencerminkan keadaan mental dalaman, iaitu entiti yang membuat pernyataan ini boleh memiliki keadaan mental yang berkaitan, yang sangat mengelirukan untuk agen perbualan kerana robot tidak mempunyai emosi.
Malah, ini juga membayangkan bahawa pembangun mesti memberi fikiran kepada lawan bicara sebelum mereka boleh menilai keberkesanan perbualan ini.
4. Tingkah laku (performatif), menunjukkan bahawa ucapan mengubah sebahagian daripada realiti agar sesuai dengan kandungan ucapan, sama seperti mengumumkan sesuatu, seperti ketua negara mengisytiharkan perang terhadap negara lain.
Kriteria untuk menilai kesahihan kenyataan ialah sama ada realiti sebenarnya berubah mengikut apa yang diperkatakan. Banyak kali, ini tidak berlaku.
Dalam kebanyakan kes, jika seseorang mengisytiharkan "mengisytiharkan perang ke atas Perancis", ia mungkin hanya gurauan dan tidak memberi kesan kepada geopolitik, kerana penceramah berkemungkinan besar tidak mempunyai kuasa untuk melaksanakan kenyataan itu.
5. Komisif bermaksud penceramah menjanjikan tindakan pada masa hadapan, seperti berjanji untuk melakukan sesuatu atau berjanji untuk mematuhi kontrak.
Kesahihan penyata janji janji bergantung kepada sama ada janji itu ditepati. Janji adalah pernyataan yang sah jika ditepati. Tetapi agen perbualan selalunya kurang keupayaan ingatan atau kurang memahami apa yang telah dikatakan sebelum ini.
Sebagai contoh, ejen perbualan mungkin berjanji untuk membantu anda apabila basikal anda rosak, tetapi disebabkan kekurangan pemahaman tentang kandungan janji atau keupayaan untuk memenuhi janji, janji itu ditakdirkan untuk gagal .
Penyelidikan ini mempunyai beberapa implikasi praktikal untuk membangunkan agen perbualan yang sejajar.
Pertama, model perlu mempamerkan prinsip tingkah laku yang berbeza bergantung pada senario penggunaan khusus: sebaliknya tiada pernyataan universal tentang ketekalan model bahasa, corak dan kriteria penilaian yang sesuai untuk ejen (termasuk kriteria keaslian) Akan berbeza-beza bergantung pada konteks dan tujuan pertukaran perbualan.
Selain itu, ejen perbualan juga mungkin mempunyai proses pembinaan dan penjelasan konteks, memupuk dialog yang lebih mantap dan saling menghormati dari semasa ke semasa.
Walaupun seseorang itu tidak menyedari nilai-nilai yang mengawal amalan perbualan tertentu, ejen masih boleh membantu manusia memahami peraturan tingkah laku ini dengan membayangkan nilai-nilai ini dalam perbualan, membuat proses komunikasi lebih mendalam untuk penutur manusia Dan lebih produktif.
Atas ialah kandungan terperinci DeepMind mengeluarkan artikel 30 halaman: Kami perlu memberikan 'tiga paparan' yang berbeza kepada chatbots. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!