Rumah >Peranti teknologi >AI >'Grass Mud Horse' Stanford popular: $100 boleh menyamai GPT-3.5! Jenis yang boleh berjalan pada telefon bimbit
Semalam, satu lagi berita besar tercetus dalam dunia model besar!
Stanford mengeluarkan Alpaca (alpaca, "kuda lumpur rumput" di mulut netizen):
Hanya $100, semua orang boleh memperhalusi 7 bilion parameter model besar LLaMA Meta, dan kesannya menakjubkan Setanding dengan GPT-3.5 (text-davinci-003) dengan 175 bilion parameter.
Dan ia boleh dijalankan dengan satu kad, malah Raspberry Pi dan telefon bimbit boleh memegangnya!
Terdapat juga "operasi saucy" yang lebih menakjubkan.
Set data yang terlibat dalam kajian itu dijana oleh pasukan Stanford menggunakan API OpenAI dengan harga kurang daripada $500.
Jadi keseluruhan proses adalah bersamaan dengan GPT-3.5 mengajar AI lawan yang setanding.
Kemudian pasukan itu juga berkata bahawa kos menggunakan kebanyakan platform pengkomputeran awan untuk memperhalusi model terlatih adalah kurang daripada $100:
Menyalin AI dengan kesan GPT-3.5 adalah sangat murah dan sangat Mudah dan masih kecil.
Selain itu, pasukan juga telah membuka set data (menjimatkan $500 sesaat) dan kod Kini semua orang boleh memperhalusi AI perbualan dengan kesan letupan:
Baru setengah hari projek itu dikeluarkan di GitHub, dan projek itu telah pun menerima 1,800+ bintang, yang menunjukkan betapa popularnya projek itu. Pembangun bersama Django malah menyifatkan penyelidikan baharu Stanford sebagai "peristiwa yang mengejutkan": Bukan itu sahaja, pasukan Stanford juga membuat demo, The jenis yang boleh dimainkan dalam talian. Tanpa berlengah lagi, mari kita lihat kesan "Kuda Lumpur Rumput" ini. Aplaca, kuda lumpur rumput yang setanding dengan davinci-003Dalam demonstrasi rasmi Stanford, mereka mula-mula bertanya soalan: Apakah alpaca? Apakah perbezaan antara ia dan llama? Jawapan yang diberikan oleh kuda lumpur rumput Aplaca adalah lebih ringkas:
Alpaca ialah haiwan unta kecil, berasal dari Peru, Bolivia , Ecuador dan Chile lebih kecil daripada llama, mempunyai bulu yang lebih halus, dan tidak mempunyai bonggol.Kemudian dia memperkenalkan secara ringkas perbezaan antara dua yang hidup dalam kumpulan. Jika soalan yang sama diajukan kepada ChatGPT (GPT3.5-turbo), jawapannya tidak akan ringkas seperti Aplaca: Dalam hal ini , penjelasan yang diberikan oleh pasukan ialah: Jawapan Alpaca biasanya lebih pendek daripada ChatGPT, mencerminkan output teks-davinci-003 yang lebih pendek. Kemudian pasukan menunjukkan demonstrasi membiarkan kuda lumpur rumput Alpaca menulis e-mel: Tulis e-mel untuk mengucapkan tahniah kepada pelajar baru yang telah diterima masuk ke Universiti Stanford, dan sebutkan bahawa anda gembira untuk bertemu mereka secara peribadi. Kuda lumpur rumput Alpaca juga sangat selesa dengan tugas ini, dan secara langsung memberikan templat e-mel yang baik: Tahap kesukaran meningkat semula, dan cadangan pasukan kali ini Sebagai tindak balas kepada keperluan untuk Alpaca menulis abstrak kertas: Tulis abstrak yang difikirkan dengan baik bagi kertas pembelajaran mesin, membuktikan bahawa 42 ialah benih optimum untuk melatih rangkaian saraf. Dari sudut kandungan, jawapan yang diberikan oleh Alpaca sangat konsisten dengan bentuk abstrak kebanyakan kertas: soalan apakah yang cuba dijawab, kaedah apa yang digunakan, apakah hasilnya, dan prospek masa depan .
Sudah tentu, terdapat juga netizen yang tidak sabar untuk mengujinya sendiri dan mendapati bahawa menulis kod adalah mudah dengan Alpaca.
Tetapi walaupun Alpaca boleh menahan kebanyakan masalah, itu tidak bermakna ianya tanpa cacat.
Sebagai contoh, pasukan menunjukkan contoh Apabila menjawab soalan "Apakah ibu negara Tanzania?", jawapan yang diberikan oleh Alpaca ialah "Dar es Salaam".
Tetapi ia sebenarnya telah digantikan dengan "Dodoma" seawal tahun 1975.
Selain itu, jika anda mengalami Alpaca secara peribadi, anda akan mendapati bahawa ia adalah... sangat perlahan:
Sehubungan itu, sesetengah netizen percaya ia mungkin disebabkan terlalu ramai yang menggunakannya.
Model LLaMA sumber terbuka besar Meta telah diatur dan difahami oleh semua orang hanya dalam beberapa minggu selepas dikeluarkan. Kad akan dijalankan.
Jadi secara teori, Alpaca berdasarkan penalaan halus LLaMA juga boleh digunakan secara tempatan dengan mudah.
Tidak kira jika anda tidak mempunyai kad grafik Anda boleh memainkannya pada komputer riba Apple, malah Raspberry Pi atau telefon mudah alih.
Kaedah menggunakan LLaMA pada komputer riba Apple datang daripada projek GitHub llama.cpp, yang menggunakan C/C++ tulen untuk penaakulan dan dioptimumkan khas untuk cip ARM.
Pengarang sebenarnya telah mengukur bahawa ia boleh dijalankan pada MacBook Pro dengan cip M1, dan ia juga menyokong sistem Windows dan Linux.
Masih dengan versi port C++ ini, seseorang berjaya menjalankan versi 7 bilion parameter LLaMA pada Raspberry Pi 4 dengan memori 4GB.
Walaupun kelajuannya sangat perlahan, ia mengambil masa kira-kira 10 saat untuk menjana token (iaitu, 4.5 perkataan muncul dalam satu minit).
Apa yang lebih keterlaluan ialah hanya 2 hari kemudian, seseorang mengukur dan memampatkan model LLaMA (menukar pemberat kepada format data ketepatan lebih rendah) dan berjaya menjalankannya telefon Android Pixel 6 (Satu token dalam 26 saat).
Pixel 6 menggunakan pemproses Google Tensor yang dibangunkan sendiri oleh Google, dan markah lariannya berjulat daripada Snapdragon 865+ hingga 888, yang bermaksud telefon mudah alih yang lebih baharu boleh melakukan kerja secara teori.
Kaedah penalaan halus LLaMA oleh pasukan Stanford berasal dari Self-Instruct yang dicadangkan oleh Yizhong Wang dan lain-lain di Universiti Washington pada akhir tahun lalu.
Gunakan 175 soalan sebagai tugasan benih, biarkan AI menggabungkan soalan baharu dan menjana contoh jawapan yang sepadan, menapis secara manual yang berkualiti rendah, dan kemudian menambah soalan baharu tugas Pergi ke kumpulan tugas.
Untuk semua tugasan ini, kaedah InstructGPT boleh digunakan kemudian untuk membolehkan AI mempelajari cara mengikuti arahan manusia.
Selepas beberapa pusingan anak patung matryoshka, ia sama dengan membiarkan AI memandu sendiri.
Alpaca versi Stanford telah dicipta menggunakan API OpenAI untuk menjana 52,000 contoh sedemikian dengan harga kurang daripada $500.
Data ini juga merupakan sumber terbuka dan lebih pelbagai daripada data dalam kertas asal.
Pada masa yang sama, kod untuk menjana data ini juga diberikan, yang bermaksud jika seseorang masih tidak berpuas hati, mereka boleh mengembangkan dan memperhalusi data itu sendiri untuk terus meningkatkan prestasi model.
Kod penalaan halus juga akan dikeluarkan selepas HuggingFace menyokong LLaMA secara rasmi.
Walau bagaimanapun, berat model terakhir Alpaca memerlukan lesen Meta dikeluarkan, dan ia mewarisi perjanjian sumber terbuka bukan komersial LLaMA, yang melarang sebarang penggunaan komersial.
Dan kerana data penalaan halus menggunakan API OpenAI, ia juga dilarang menggunakannya untuk membangunkan model yang bersaing dengan OpenAI mengikut syarat penggunaan.
Adakah anda masih ingat sejarah perkembangan lukisan AI?
Pada separuh pertama tahun 2022, topik itu masih hangat Sumber terbuka Stable Diffusion pada bulan Ogos menurunkan kos ke tahap yang boleh digunakan, dan ini menghasilkan inovasi alat letupan, membolehkan lukisan AI benar-benar memasuki pelbagai. aliran kerja.
Kos model bahasa kini telah menurun ke tahap di mana ia tersedia pada peranti elektronik peribadi.
Akhirnya, Simon Willison, pengasas rangka kerja Django, menjerit:
Masa untuk Stable Diffusion model bahasa besar telah tiba.
Atas ialah kandungan terperinci 'Grass Mud Horse' Stanford popular: $100 boleh menyamai GPT-3.5! Jenis yang boleh berjalan pada telefon bimbit. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!