Rumah >Peranti teknologi >AI >Sepuluh pemikiran tentang reka bentuk aplikasi model besar
Teknologi bukan maha kuasa, tetapi tanpa teknologi ia mungkin mustahil sekali, dan perkara yang sama berlaku untuk model besar. Reka bentuk aplikasi berdasarkan model besar perlu memberi tumpuan kepada masalah yang sedang diselesaikan Dalam bidang pemprosesan bahasa semula jadi, model besar itu sendiri hanya menyatukan pelbagai tugasan NLP ke dalam model urutan-ke-jujukan pada tahap tertentu. Menggunakan model besar, kami sedang menyelesaikan masalah pengeluaran dan kehidupan tertentu, dan reka bentuk produk dan teknikal masih diperlukan.
Jadi, jika model besar membayangkan semula masa depan kejuruteraan perisian, adakah terdapat beberapa prinsip asas yang perlu kita ikuti?
Jika model dapat menyelesaikan tugas, tidak perlu menulis kod; model menjadi lebih dan lebih menonjol. Berbeza dengan kaedah pengaturcaraan tradisional, idea pembangunan semasa lebih cenderung kepada "model dahulu". Ini bermakna apabila kita berhadapan dengan masalah atau tugas, kita mula-mula mempertimbangkan sama ada ia boleh diselesaikan menggunakan model sedia ada, dan bukannya mula menulis kod dengan serta-merta. Oleh kerana kod itu telah ditetapkan, model ini mempunyai ruang yang besar untuk pembangunan. Dari masa ke masa, model mempunyai keupayaan pembelajaran dan kebolehsuaian yang kukuh, serta boleh mengoptimumkan diri dan menambah baik melalui lelaran berterusan. Oleh itu, tugas pertama kami adalah untuk memanfaatkan potensi model dan menjadikannya sebagai alat untuk kami menyelesaikan masalah
Matlamat keseluruhan sistem adalah untuk memanfaatkan keupayaan LLM untuk merancang dan memahami niat untuk membina projek yang cekap. Sepanjang perjalanan, kami mungkin terdorong untuk kembali ke dalam pemikiran yang penting itu dan menulis kod untuk setiap butiran program kami. Walau bagaimanapun, kita mesti menahan godaan ini, setakat yang kita boleh mendapatkan model untuk melakukan sesuatu yang boleh dipercayai sekarang, ia akan menjadi lebih baik dan lebih mantap apabila model itu berkembang
2 Ketepatan tukar ganti, gunakan interaksi Nyahkekaburan
Dalam usaha mengekalkan ketepatan yang tinggi, kita perlu menimbang hubungannya dengan faktor lain. Untuk mencapai keseimbangan ini, kita boleh menggunakan pendekatan interaktif untuk menghapuskan kemungkinan kekaburan dan salah faham. Strategi ini bukan sahaja meningkatkan ketepatan, tetapi juga meningkatkan fleksibiliti dan kecekapan operasi
Dalam proses pengekodan dengan LLM, minda utama haruslah memikirkan cara untuk mendapatkan leverage yang paling banyak daripada sistem, dan bukannya "cuba dan cuba "Apa yang boleh dibuat?" Ini bermakna kita tidak seharusnya berpuas hati dengan pelaksanaan fungsi yang mudah, tetapi harus meneroka potensi sistem secara mendalam dan biarkan ia mencipta nilai yang lebih besar untuk kita
Dalam aplikasi sebenar, kita boleh membina beberapa corak biasa. Sebagai contoh, mod seperti "Jana laporan daripada pangkalan data" sangat boleh disesuaikan dan boleh melaraskan parameter melalui gesaan teks mudah untuk menampung pelbagai keperluan. Contoh lain ialah model "mengajar kursus pembelajaran mendalam satu tahun", yang mengintegrasikan banyak sumber pendidikan dan juga boleh diselaraskan dengan mudah melalui kaedah interaktif untuk memenuhi keperluan pengajaran yang diperibadikan.
Melalui penerapan corak biasa ini, kecekapan kerja bukan sahaja dipertingkatkan, malah hasil yang bernilai dan tersendiri dapat dihasilkan dengan mudah. Strategi menimbang ketepatan dan nyahkekaburan interaksi ini sudah pasti merupakan cara pemikiran yang penting dalam reka bentuk aplikasi model besar.
3 Kod adalah untuk sintaks dan prosedur, model adalah untuk semantik dan niat
Secara asasnya, model hebat dalam membuat penaakulan tentang makna dan tujuan bahasa, tetapi selalunya kod berprestasi rendah apabila mereka diminta untuk melakukan pengiraan dan proses tertentu. Sebagai contoh, model peringkat tinggi mungkin mudah dikodkan untuk menyelesaikan Sudoku, tetapi mungkin agak sukar untuknya menyelesaikan Sudoku itu sendiri.
Setiap kod mempunyai kelebihan uniknya, kuncinya ialah memilih alat yang paling sesuai dengan masalah tertentu. Sempadan antara sintaks dan semantik merupakan cabaran utama dalam reka bentuk aplikasi model berskala besar. Dalam konteks ini, kita perlu mempunyai pemahaman yang lebih mendalam tentang kekuatan dan kelemahan kod dan model masing-masing untuk menggunakannya dengan lebih berkesan untuk menyelesaikan masalah
semasa membina mana-mana sistem , fakta yang tidak boleh diabaikan ialah kekuatan keseluruhan sistem selalunya ditentukan oleh bahagiannya yang paling terdedah. Pandangan ini digunakan bukan sahaja untuk sistem perisian tradisional, tetapi juga untuk aplikasi berdasarkan model besar Apabila mengejar fleksibiliti dan kecekapan sistem, pengekodan keras harus dielakkan sebanyak mungkin. Pengekodan keras merujuk kepada menulis nilai atau logik tertentu terus ke dalam kod tanpa mengambil kira kemungkinan perubahan atau sambungan pada masa hadapan. Walaupun pendekatan ini mungkin membawa kemudahan dalam jangka pendek, dalam jangka panjang ia boleh membawa kepada kod yang tegar dan sukar untuk dikekalkan. Oleh itu, kita harus memberi perhatian kepada penambahan penaakulan dan fleksibiliti semasa menulis kod dan algoritma
Apabila mereka bentuk gesaan dan interaksi, kita harus cuba memasukkan maklumat dan logik yang mencukupi supaya sistem boleh membuat keputusan dan penaakulan secara autonomi, dan bukannya hanya melaksanakan. arahan yang telah ditetapkan. Dengan cara ini, bukan sahaja penggunaan pengekodan keras dapat dikurangkan, tetapi keupayaan LLM juga boleh digunakan dengan lebih baik, menjadikan sistem lebih pintar dan lebih fleksibel.
5 Kualiti data diutamakan, dan aplikasi LLM berkait rapat dengan data berkualiti tinggi
Ringkasnya, jika anda bertanya model ini soalan mudah atau terbuka, mereka akan memberi anda jawapan yang mudah atau umum. Jawapan sedemikian mungkin kurang mendalam atau terperinci dan mungkin tidak memenuhi semua keperluan. Jika anda ingin mendapatkan jawapan yang lebih terperinci dan mendalam, maka cara dan strategi bertanyakan soalan perlulah lebih bijak.
Ini sebenarnya adalah manifestasi prinsip "Sampah masuk, Sampah keluar" dalam era kecerdasan buatan. Tidak kira betapa majunya teknologi itu, kualiti data yang masuk tetap kritikal. Jika data input adalah samar-samar, tidak tepat atau tidak lengkap, jawapan yang dikeluarkan oleh model mungkin juga begitu.
Untuk memastikan model LLM dapat memberikan jawapan yang berkualiti tinggi dan mendalam, adalah perlu untuk memastikan bahawa data input adalah tepat, terperinci dan kaya dalam konteks. Ini juga bermakna kualiti data kekal diutamakan. Hanya dengan memberi perhatian dan memastikan kualiti data kita boleh mengharapkan untuk mendapatkan maklumat yang benar-benar berharga dan mendalam daripada model termaju ini
6 Anggap ketidakpastian sebagai anomali
Dalam pengaturcaraan, apabila terdapat ketidakpastian dalam satu set gesaan bersarang - contohnya, hasil gesaan mungkin mempunyai pelbagai tafsiran, kita harus menggunakan strategi yang serupa dengan "lontaran pengecualian". Ini bermakna ketidakpastian ini harus diteruskan ke tahap yang lebih tinggi dalam timbunan sehingga anda mencapai tahap di mana anda boleh berinteraksi dengan pengguna atau menjelaskan ketidakpastian.
Melalui strategi reka bentuk sedemikian, program boleh bertindak balas dengan sewajarnya apabila berhadapan dengan ketidakpastian, dengan itu memberikan hasil yang lebih tepat dan boleh dipercayai
7 Teks sebagai protokol universal
Walaupun bahasa semula jadi mungkin sedikit tidak tepat dalam sesetengah senario aplikasi, berbanding dengan bahasa berstruktur lain seperti XML ), yang mempunyai kelebihan ringkas, intuitif dan mudah difahami oleh manusia. Sudah tentu, untuk tugasan yang memerlukan tahap ketepatan dan struktur yang tinggi, bahasa berstruktur masih boleh digunakan untuk membantu dalam jumlah yang kecil. Tetapi dalam kebanyakan senario, bahasa semula jadi berfungsi dengan baik dalam menyampaikan arahan dan niat.
Perlu dinyatakan bahawa dengan mempopularkan dan memajukan teknologi berasaskan LLM ini, teks, sebagai kaedah interaksi semula jadi "bukti masa depan", akan terus menggalakkan kesalingoperasian dan pemahaman antara sistem yang berbeza dan gesaan yang berbeza. Jika dua perkhidmatan LLM yang berbeza sama sekali boleh memahami dan membalas arahan teks yang sama, maka kerjasama dan interaksi antara mereka akan menjadi semula jadi dan lancar seperti komunikasi antara manusia
Tujuan menulis semula kandungan bukanlah untuk menukar makna asal, tetapi untuk menulis semula bahasa ke dalam bahasa Cina
Apabila berhadapan dengan masalah yang kompleks, ia bukan sahaja cabaran untuk orang , perkara yang sama berlaku untuk model besar. Dalam aplikasi praktikal, jika kita secara langsung menggunakan gesaan masalah kompleks sebagai sebahagian daripada program, kita mungkin menghadapi masalah, kerana apa yang kita perlukan adalah hasil inferens
Untuk menyelesaikan masalah ini, kaedah yang berkesan adalah menggunakan "elemen" "petunjuk. Gesaan ini bukan sahaja menimbulkan soalan, tetapi juga menyediakan jawapan terperinci, dan kemudian meminta model untuk mengekstrak maklumat utama daripadanya. Pendekatan ini berfungsi dengan baik kerana ia sebenarnya mengubah tugasan kognitif yang kompleks menjadi tugasan yang agak mudah. Bayangkan jika anda memberi seseorang tugas "baca artikel ini dan ketahui jawapannya", walaupun pengguna tidak mempunyai kepakaran dalam bidang yang berkaitan, dia berkemungkinan besar untuk menyelesaikan tugas ini, kerana kuasa bahasa semula jadi sangat besar.
Terdapat beberapa perkara yang perlu diberi perhatian semasa mereka bentuk aplikasi berdasarkan model besar. Perkara yang sukar oleh orang biasa mungkin sama sukar dalam model. Menghadapi situasi ini, strategi terbaik adalah memecahkan masalah atau tugas yang kompleks kepada langkah yang lebih mudah. Ini dapat mengurangkan kesukaran memproses dan meningkatkan kestabilan dan ketepatan jawapan
Model bukan sahaja alat, ia juga boleh menjadi senjata untuk kita. melawan kesilapan kita sendiri. Banyak kali, kita cenderung untuk membayangkan operasi LLM (Model Bahasa Besar) sebagai proses dalaman "otak". Walau bagaimanapun, adalah penting untuk menyedari bahawa walaupun terdapat beberapa persamaan antara model dan pemikiran manusia, terdapat banyak perbezaan bermakna antara kedua-duanya.
Satu ciri amat penting: model selalunya kekurangan ingatan yang berterusan semasa interaksi jangka pendek. Ini bermakna model tidak mungkin mengingati semua butiran dari satu minit interaksi ke yang seterusnya. Ciri ini memberi kami kemungkinan beberapa kawalan.
Kawalan ini tidak terhad kepada semakan kod. Malah, model itu juga boleh bertindak sebagai pemantau keselamatan untuk kod untuk memastikan operasi selamat kod itu juga boleh digunakan sebagai komponen strategi ujian untuk membantu kami merumuskan rancangan ujian yang lebih berkesan; penapis kandungan untuk membantu kami menjana kandungan Kualiti berkualiti tinggi
Oleh itu, selagi kita mengawal dan membimbing model dengan sewajarnya, ia boleh menjadi "pembantu" yang berkuasa dalam kerja kita. Asas kawalan ini adalah pemahaman mendalam dan penguasaan kami terhadap mekanisme dalaman dan ciri-ciri model.
Keupayaan model bahasa besar benar-benar menakjubkan prestasi manusia dalam tugas-tugas ini. Walau bagaimanapun, itu tidak bermakna kita harus menyembah model besar ini secara membabi buta dan berfikir bahawa mereka boleh melakukan apa sahaja.
Model besar sebenarnya masih mempunyai banyak batasan dan batasan. Walaupun mereka boleh memproses sejumlah besar data teks, mereka tidak benar-benar memahami nuansa bahasa dan konteks seperti yang dilakukan manusia. Di samping itu, prestasi mereka juga dihadkan oleh pemilihan data latihan dan algoritma, dan beberapa bias dan ralat mungkin berlaku
Oleh itu, apabila menggunakan model besar, kita harus mengekalkan sikap yang rasional dan berhati-hati, sambil menghargai kemudahan yang mereka bawa dan maju. , tetapi juga berhati-hati dengan had dan potensi risikonya. Dengan cara ini, model ini boleh digunakan dengan lebih baik untuk menggalakkan pembangunan sihat aplikasi berasaskan model yang besar.
Atas ialah kandungan terperinci Sepuluh pemikiran tentang reka bentuk aplikasi model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!