Rumah >Peranti teknologi >AI >Alibaba GPT melatih pengganti mulut 'Niaoniao' dalam masa 15 hari, yang jauh lebih menarik daripada ChatGPT+Siri!
Anda mungkin tidak percaya, tetapi kami telah bersama pelakon program bual bicara "Niao Niao" sejak dua hari lalu.
Mari kita tanya dia tentang salah satu meme paling popular dalam Xiaoguo Culture tahun lepas: “Adakah anda tahu tentang teman lelaki udang? . untuk dibuang. Kepala boleh dimakan istilah ini menjadi popular baru-baru ini kerana pelakon rancangan bual bicara Li Dan mendedahkan seluruh kehidupan netizen di rancangan itu. dengan benang udang. Mencari awak
Dengar baik-baik suara ini, adakah anda rasa itu burung? "Niaoniao" datang ke Kebijaksanaan Baru?
1. Sangat individu
Setelah beberapa ketika, nada unik Niaoniao perlahan-lahan berbunyi: "Ya, saya seorang gadis introvert dengan kebimbangan sosial. Saya sering berasa tidak kelihatan, walaupun di atas pentas. Saya tidak berani untuk menyatakan saya sendiri, tetapi saya tidak berasa rendah diri kerana ini sebaliknya, saya berharap dapat membantu lebih ramai orang seperti saya melalui persembahan saya dan memberitahu mereka bahawa jauh di lubuk hati kita, kita juga mempunyai kewujudan dan nilai yang unik 》
Kebetulan Niaoniao pergi ke Milan suatu ketika dahulu, jadi apa kata kita biarkan dia berkongsi pengalamannya.
"Saya baru-baru ini pergi ke Milan, Itali untuk menyertai Minggu Fesyen dan menyertai acara yang sangat menarik. Walaupun saya gugup dan kaki saya sakit, saya belajar banyak. Saya juga pergi untuk melihat Katedral Milan, sangat mengejutkan saya rasa Itali sangat mirip dengan kampung halaman saya, Mongolia Dalam, sangat mesra." Saya pergi ke Milan untuk menyertai acara tersebut. minggu fesyenAudio
2 Nampak menarik, bolehkah anda menulis esei mengenai topik ini?
ta berasa tenang dan tenteram: "Apabila saya berjalan di jalanan Milan, saya seolah-olah berada dalam dunia Renaissance, di mana terdapat banyak bangunan kuno dan moden yang melambangkan Milan mempunyai sejarah budaya dan seni yang panjang. Saya melihat ramai pelukis mencipta di sini, dan mereka menggunakan sapuan berus mereka sendiri untuk menggambarkan pemandangan indah Milan, yang membuatkan orang ramai berasa mabuk yang tidak dapat digambarkan."
Milan, mabuk yang tidak terkataAudio
Jika anda diminta memberi tajuk pada esei ini, dia fikir untuk seketika dan berkata-kata -
"Bagaimana untuk menjadikan perjalanan ke Milan sebagai kenangan terbaik dalam hidup anda". Sungguh cemerlang bakat sastera!Hei, editor tiba-tiba ada idea...
Tahun lepas, Niaoniao naik Naib juara dalam pertandingan rancangan bual bicara menarik perhatian penonton dengan teksnya yang sangat indah. Kemudian mari kita bertanya kepadanya: "Bagaimana untuk menilai tahap pelakon rancangan bual bicara?" ta menjawab: "Pertama sekali, ia bergantung kepada sama ada pelakon mempunyai rasa humor yang kuat dan boleh mencipta ketawa dan keseronokan. Kedua, ia bergantung kepada sama ada pelakon itu boleh memahami irama dan suasana keseluruhan persembahan supaya penonton boleh mengikuti idea pelakon, dan akhirnya bergantung kepada sama ada pelakon itu boleh menguasai emosi dan ekspresinya sendiri, dan dapat menyampaikan pendapat dan emosinya dengan tepat " Mengenai cara menilai pelakon rancangan bual bicara Audio Baiklah, Zhisheng mahu menyukainya selepas membacanya. Sebagai pelakon rancangan bual bicara, kenapa anda tidak diuji dengan meme homofonik? Kami membacakan jenaka kepadanya: "Udang dan kerang mendapat 100 mata dalam peperiksaan pada masa yang sama. Guru bertanya kepada udang salinan siapa yang anda salin, dan udang berkata: "Saya menyalin kerang." Homofon tidak mengganggu saya, saya sangat keren 3. Pakar Popularisasi Sains Kadangkala, beberapa soalan pelik tiba-tiba muncul di fikiran kita. Sebagai contoh, berapakah jarak bumi dari matahari? Sebaik sahaja saya selesai bercakap, jawapan datang: "Jarak terdekat ialah 1.471 kali 10 hingga meter kuasa ke-11, dan jarak paling jauh ialah 1.521 kali 10 hingga meter kuasa ke-11. . Purata jaraknya ialah 1.496 kali 10 hingga kuasa 8 kilometer " Ya, jawapannya sangat tepat. Berapa jauhkah jarak bumi dari matahari? Tanya satu lagi: "Mengapa organisma berkembang menjadi dioesi?" "Dioecy adalah untuk mengelakkan pewarisan kecacatan genetik, kerana dioecy mempunyai lebih banyak kelebihan dalam evolusi. Mutasi yang baik akan mendapat kelebihan dalam kelangsungan hidup atau pembiakan, dan mutasi yang buruk akan dihapuskan." 🎜>Mengenai keperluan dioesi
Menarik Ya, jawapan ini sangat serupa dengan jawapan pada Zhihu Nampaknya dia akan mencarinya sendiri. Daripada penjawab Zhihu "Jangan berputus asa" Ada satu lagi soalan yang sering membingungkan editor: Mengapa persamaan fizik selalunya sangat pendek? ta memberitahu kami: “Ini kerana persamaan fizik selalunya menangkap peraturan dan undang-undang fizikal yang paling asas dan asas, dan menerangkannya dengan cara yang paling mudah dan jelas 》
4 Apabila anda Emo Mac Madness Selepas itu, editor telah penat sangat sampai nak tergolek, baru nak baring. Tanya saya, bagaimana untuk memilih antara berbohong atau berguling? ta menjawab: "Berbohong dan bergolek bukanlah soalan aneka pilihan, tetapi perbincangan tentang kerja dan rehat. (Untuk) melancarkan kertas secara munasabah di landasan yang betul, dengan positif sikap, dan miliki Roll dengan nilai 》 Guling dengan munasabah, gulung dengan positif, gulung dengan nilai
Eh? Baunya seperti Alain de Botton, dan editor tidak boleh tidak terfikir dengan mendalam... Tambahan pula, jika anda berlagak comel dengannya dan mengatakan bahawa anda sama sedihnya. sebagai kucing oren seberat 200 paun baru-baru ini ”, dia juga akan menghiburkannya: “Oh, nampaknya anda tidak berpuas hati . Saya tidak tahu mengapa anda sedih? Adakah anda menghadapi sebarang kesulitan? >Bukaisen , meminta keselesaan 5 > walaupun Sekali, para editor berbincang di pejabat, "Introversi adalah jenaka yang sering digunakan dalam rancangan bual bicara NiaoNiao sebenarnya dia menjawab perbualan itu atas inisiatifnya sendiri - Mengejutkan seluruh jabatan editorial serta-merta. Bukan itu sahaja, jika anda memujinya kerana kehebatannya selepas dia memberikan jawapan yang menarik, dia akan dengan bangganya berkata: "Baiklah, terima kasih atas pujian itu. Saya cuma ingin menjawab beberapa soalan pelik." Soalan pelik. " Melatih "Burung dari Burung ke Burung" dalam masa 15 hari Setelah berkata begitu banyak, semua orang sudah meneka bahawa ini adalah AI. Proses latihan
Langkah pertama ialah menggunakan pra-latihan bahasa berskala besar untuk melakukan pembelajaran asas Ini adalah kaedah latihan hierarki. Dalam proses ini, model berskala besar telah digunakan untuk membaca teks dan bercakap dengan lancar Pada masa yang sama, ia juga mempelajari beberapa pengetahuan am.
2 Belajar menggunakan beberapa alatan dan memperoleh pengetahuan terkini Namun, selepas langkah pertama, para penyelidik juga menemui beberapa masalah: Sebilangan besar pengetahuan baharu dihasilkan setiap hari, dan apa yang dipelajari hari ini mungkin akan ketinggalan zaman esok. Apa yang perlu dilakukan? Kini, Niaoniaofenniao telah belajar memanggil enjin carian, dan ia boleh menjawab soalan baharu dengan bebas walaupun selepas latihan model selesai.
3 Peningkatan perbualan diperibadikan: berbilang pusingan, heuristik Dengan peningkatan pengetahuan dan alatan Atas dasar peningkatan. , langkah ketiga ialah melakukan peningkatan dialog yang diperibadikan. Dalam proses ini, ia perlu mempelajari apa itu dialog pelbagai pusingan dan apakah itu dialog heuristik. Kesukarannya ialah perbualan berbilang pusingan sering memerlukan maklumat sejarah sejak dahulu lagi. Sebaliknya, ia adalah perkataan label yang membentuk keperibadiannya. Pada masa yang sama, para penyelidik juga menjelaskan sejumlah kecil korpus Niaoniao sebagai peningkatan dan pengoptimuman yang diperibadikan. Selepas langkah ketiga, model ini sudah kelihatan seperti burung.
4. Peningkatan berdasarkan maklum balas manusia (RLHF) Cara menjadikannya lebih seperti bulu burung kain? Ia adalah pembelajaran pengukuhan melalui maklum balas manusia (RLHF). Untuk soalan yang sama, biarkan model memberikan berbilang jawapan berbeza, kakitangan akan memberikan maklum balas dan anotasi, dan kemudian biarkan model memperbetulkan sisihan. Selepas beberapa pusingan lelaran, jawapan model semakin dapat mewakili beberapa ciri teks Niaoniao dan juga pendirian khususnya. Selepas melatih model, saya mahu mengubahnya menjadi produk yang lengkap " Tmall Elf" masih perlu melengkapkan beberapa aspek algoritma + kerja kejuruteraan: 1>Dengar Untuk. model untuk diubah menjadi produk dengan lancar, ia mesti dapat mendengar dan memahami apa yang diperkatakan oleh pengguna - pertuturan ke teks. Proses ini menggunakan algoritma telinga kucing Tmall Elf. Ciri telinga kucing ialah ralat diskriminasi adalah sangat sensitif, dan apabila bunyi dikeluarkan dari tempat yang berbeza, telinga akan berputar secara bebas untuk mengesan bunyi berbeza dengan tepat. Terdapat dua masalah yang tertumpu pada penyelesaian dalam algoritma Mao Er. Yang pertama ialah pembatalan gema. Apabila peranti dimainkan di dalam bilik, ia akan menghasilkan banyak gema, dan gema ini akan menyebabkan gangguan. Penyelidik akan menggunakan pembelajaran mendalam dan satu siri teknologi untuk menghapuskan gema bagi memastikan setiap ayat yang didengari oleh mesin berasal daripada suara manusia. Yang kedua ialah pickup arah. Terdapat susunan mikrofon pada mesin apabila kita bangun, ia akan mengenali di mana pembesar suara itu dan berpusing serta-merta seperti telinga kucing untuk menangkap suara manusia dengan tepat. Pada masa yang sama, ia juga menggunakan pengurangan hingar untuk menghapuskan bunyi bukan manusia, seperti bunyi TV di rumah atau orang bercakap dari jauh. 2 Nada Tmall Elf Academy" Selepas. mendengarnya, langkah seterusnya ialah menjadikan bunyi itu lebih seperti burung. Ini disebabkan oleh model akustik yang dibangunkan oleh DAMO Academy. Pada masa lalu, proses menyesuaikan suara seseorang adalah sangat rumit Ia mungkin mengambil masa lebih daripada 20 jam rakaman dalam studio rakaman, banyak anotasi manual, dan kemudian model. pengoptimuman dan penggunaan. Boleh dikatakan bahawa pada masa lalu, bunyi yang disesuaikan dihasilkan setiap tahun. Tambahan pula, selepas menghabiskan begitu banyak tenaga manusia dan sumber material, bunyi yang keluar masih mempunyai rasa mekanikal yang berbeza, dan jelas sekali ia adalah robot. Kini, menggunakan penyelesaian tersuai DAMO Academy KANN-TTS, hanya kira-kira sejam rakaman burung yang berkesan dikumpulkan, dan ia boleh dirakam dengan telefon bimbit pada bila-bila masa dan di mana-mana sahaja. Ia hanya mengambil masa kira-kira seminggu dari merakam bunyi hingga menamatkan latihan. Lebih-lebih lagi, keaslian dan antropomorfisme bunyi akhir adalah mengejutkan, sangat dekat dengan nada Niao Niao sendiri. Dan seterusnya, akan ada algoritma timbre emosi Jika burung itu bersedia, mesin akan mengeluarkan suara yang ghairah. 3. Gaya penulisan Setelah nada dipelajari, langkah seterusnya ialah gaya penulisan. Terdapat teori dalam psikologi yang dipanggil kesan pelabelan. Sebagai contoh, apabila seseorang dilabel sebagai introvert, dia mungkin beransur-ansur menjadi kurang bercakap dan menjadikan tingkah lakunya konsisten dengan label tersebut. Dalam model besar, pendekatan yang serupa boleh digunakan untuk menggambarkan seseorang menggunakan perbendaharaan kata label personaliti. Semasa percubaan, beberapa fenomena yang sangat menarik berlaku. Apabila watak model ditetapkan sebagai watak yang ceria dan jenaka, bukan sahaja dia akan sering ketawa semasa perbualan, malah jika ditanya filem apa yang dia suka, dia juga akan menjawab bahawa ia adalah sebuah komedi. Selepas dilabel sebagai tertekan dan berduka, model itu hilang minat dalam banyak perkara. Apabila model itu dilabel sebagai seorang yang lemah lembut, bertimbang rasa dan bertimbang rasa, ia akan lebih menyebut ahli keluarga dalam perbualan Contohnya, apabila menjawab apa yang ingin dilakukan pada hujung minggu, ia akan berkata saya mahu menghabiskan masa dengan keluarga saya. Secara teknikal, terdapat dua pendekatan. Yang pertama dipanggil Plug&Play. Dalam kes ini, model besar itu sendiri masih merupakan model umum, tetapi modul akan digunakan untuk mengenal pasti gaya, menjadikannya lebih bercakap seperti burung. Kaedah kedua ialah melakukan gesaan berdasarkan model besar, membolehkannya mempelajari gaya label personaliti yang berbeza. Apabila melatih burung untuk membezakan burung, label seperti pelakon rancangan bual bicara, pasca 90-an, Mongolia Dalam, mendalam, jenaka dan introvert digunakan. 4. Cat Elf yang hebat sedikit berbeza daripada versi terdahulu, yang melibatkan perbezaan dalam dialog dupleks. Dulu, suara manusia dan mesin tidak boleh bertindih Apabila manusia bertanya soalan, mesin akan menunggu manusia itu selesai bercakap sebelum menjawab. Apabila mesin membalas, orang itu mesti menunggu sehingga ia selesai bercakap sebelum menuturkan ayat seterusnya. Dengan sokongan dupleks penuh, mesin boleh berinteraksi dengan orang di kedua-dua arah. Contohnya, apabila anda bercakap dengan mesin, ia akan menyebut "um", "biar saya fikirkan" dan ayat berterusan yang lain. Selain itu, jika mesin terlalu bercakap semasa menjawab, anda boleh menyampuk sesuka hati Sebaik sahaja kita bercakap, ia akan berhenti dan mendengar. Oleh kerana kependaman sangat rendah, sangat hampir dengan kependaman perbualan orang sebenar, ia adalah interaksi yang lebih dua hala. Berikan pembantu pintar itu "otak" baharu
Sejak ChatGPT keluar, netizen dari semua lapisan masyarakat telah menggunakan helah yang tidak pernah berlaku sebelum ini saya mahu menyepadukan ChatGPT ke dalam Siri. Sebagai contoh, lelaki ini menggunakan model ini untuk menganalisis arahan yang dihantar oleh manusia, dan kemudian menyuruh Siri melaksanakannya bagi pihaknya, membina sistem rumah pintar yang tidak dapat dikalahkan. "Isteri saya memandu pulang dan sepatutnya pulang dalam masa 15 minit, baiklah, lampu di luar akan dinyalakan untuknya." Lagipun, berbanding ChatGPT, pembantu suara tradisional seperti Siri Apple dan Alexa Amazon sememangnya lemah. Dalam hal ini, Ketua Pegawai Eksekutif Microsoft Nadella mempunyai metafora yang sangat jelas - "Stupid as a rock." Tidak seperti Google, yang hampir terdesak untuk mengejar ChatGPT, Amazon tidak merasakan ia ketinggalan. Lebih sedekad yang lalu, Bezos dengan teruja menggariskan jangkaannya untuk Alexa pada papan putih di ibu pejabat Amazon. Pada masa itu, pengasas Amazon juga mempunyai visi besar untuk platform pengkomputeran terkawal suara baharu—membina komputer Star Trek yang boleh bercakap, mengawal kapal angkasa dan menyelesaikan teka-teki matematik. Tetapi kini, jelas bahawa visi itu telah gagal. Walaupun menjual ratusan juta peranti digital dengan pembantu terbina dalam, Alexa telah gagal mencapai matlamat Amazon untuk mencipta platform teknologi besar seterusnya. Bezos sanggup membangunkan Alexa dalam semua kos, malah kehilangan wang. ChatGPT sayang, yang keluar pada November tahun lalu, menunjukkan bahawa inovasi Alexa telah terbantut. Walau bagaimanapun, Amazon menggunakan cara yang sangat baharu untuk menyambut era baharu. Keupayaan bahasa Alexa tidak sebaik chatbot, dan chatbot tidak dapat mengawal peranti rumah pintar Jadi, bagaimana jika kedua-duanya digabungkan? Sertai jika anda tidak dapat mengatasinya Dalam beberapa bulan kebelakangan ini, Amazon telah berhubung dengan pemula AI dan sedang bersedia untuk menyepadukan teknologi seperti ChatGPT ke dalam Alexa. Jadi, bukankah lebih kuat jika kita terus menambah model besar seperti ChatGPT pada peranti IoT "asli"? Melihat dengan cara ini, jika Tmall Genie boleh melaksanakan sistem interaktif OTA baharu secara besar-besaran, ia sememangnya akan menjadi sangat maju. Baru-baru ini, orang besar dari semua lapisan masyarakat bertelagah sama ada mahu berhenti membangunkan AI yang lebih kuat daripada GPT-4 pergaduhan. Fokus perbahasan ialah keselamatan AI - surat terbuka percaya bahawa tiada siapa yang boleh memahami, meramal dan mengawal AI ini, walaupun penciptanya. Bukan perkara biasa bagi Musk dan LeCun untuk berhadapan satu sama lain secara langsung (taktikal mundur) Malah, punca fenomena ini ialah: 1. Ciri teknikal AI memberikan nilai tersendiri, walaupun berbeza daripada orang yang sama, tetapi ia telah lama keluar dari kategori berkecuali teknologi; infrastruktur yang kurang pengawasan akan membawa kepada ketidakadilan. Persoalannya, jika AI adalah kotak hitam, maka bagaimana kita menilai sama ada ia adalah baik?
Dalam hal ini, Yu Yang, seorang penyelidik dari Sekolah Maklumat Antara Disiplin di Universiti Tsinghua, berkata bahawa jawapannya terletak pada audit dan tadbir urus AI. Pada masa ini, pasukannya juga bekerjasama dengan pasukan Tmall Genie dalam penyelidikan dalam bidang AI-ESG. Pada masa ini, penyelidikan dalam bidang berkaitan tertumpu kepada manusia, dan tujuannya adalah untuk memastikan orang ramai dapat menerima layanan yang sama rata dan adil dalam era maklumat, terutamanya era kecerdasan buatan. Untuk mencapai matlamat ini, pasukan Profesor Yu Yang mencadangkan kaedah audit tadbir urus kitaran hayat penuh AI berdasarkan inferens sebab musabab. Secara khusus, melalui kaedah analisis inferens sebab musabab, pasukan mendapati model AI sebenarnya telah memasukkan jantina, tag Race dikaitkan dengan pekerjaan. Sesetengah literatur percaya bahawa jika lapisan pengekodan tidak melakukan ini, prestasi model AI akan berkurangan. Sebab fenomena ini ialah kaedah semasa membetulkan berat sebelah adalah untuk menambah beberapa keperluan pada fungsi ganjaran semasa latihan, dan "menamparnya" apabila model itu berat sebelah. Sebaliknya, jika kita memberitahunya dari awal bahawa ia tidak boleh melabel orang, maka model akhir bukan sahaja akan mengurangkan risiko berat sebelah, tetapi juga berkesan dalam beberapa tugas. Prestasi juga telah bertambah baik. Dalam analisis akhir, ia adalah soal bagaimana untuk mendidik AI - memukul dan memarahi sahaja tidak mencukupi, anda juga perlu membuat alasan dengan AI. Daripada ini, kita dapat melihat dengan mudah bahawa pengauditan bukan sahaja dapat membantu mengenal pasti masalah, tetapi juga meningkatkan ketelusan dan kebolehjelasan AI. dan meningkatkan prestasi AI. Jadi untuk terminal pintar yang dilengkapi dengan model besar, kepentingan audit teknikal adalah jelas. Lagipun, dilihat dari demonstrasi teknologi ini, jika suatu hari nanti kita mempunyai model besar yang unik seperti Bird, ia tidak semestinya fantasi. 1 Gunakan versi model besar Alibaba yang serba baharu untuk pembelajaran asas
Menjadi produk
Tadbir urus AI berpusatkan manusia
Atas ialah kandungan terperinci Alibaba GPT melatih pengganti mulut 'Niaoniao' dalam masa 15 hari, yang jauh lebih menarik daripada ChatGPT+Siri!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!