Rumah >Peranti teknologi >AI >Ceramah teknikal lima minit |. pengenalan AIGC dan penilaian pemilihan aplikasi

Ceramah teknikal lima minit |. pengenalan AIGC dan penilaian pemilihan aplikasi

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-06-04 13:31:401571semak imbas

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bahagian 01 Pengenalan AIGC

AIGC (AI - Kandungan Dijana (kandungan pengeluaran kecerdasan buatan) merujuk kepada kaedah pengeluaran yang menggunakan teknologi AI untuk secara automatik atau membantu dalam menjana pelbagai bentuk kandungan seperti teks, kod, imej, suara, video dan objek 3D. AIGC mewakili trend baharu dalam pembangunan teknologi AI, daripada memahami dan memahami dunia kepada menjana dan mencipta dunia, dan daripada keupayaan analisis kepada keupayaan kreatif. AIGC juga telah membawa perubahan dalam penciptaan kandungan, meningkatkan kualiti, kecekapan dan kepelbagaian kandungan.

1.1 Penjanaan teks

Penjanaan teks merujuk kepada penggunaan Teknologi AI secara automatik menjana kandungan teks tatabahasa dan logik berdasarkan input yang diberikan (seperti kata kunci, gambar, suara, dll.), yang merupakan aspek penting AIGC.

Penjanaan teks mempunyai banyak senario aplikasi, termasuk penulisan berita, penciptaan novel, copywriting pemasaran, Soal Jawab perkhidmatan pelanggan, robot sembang, bimbingan pendidikan, graf pengetahuan dan ringkasan tunggu generasi.

➤ Wen Xinyiyan: Model AI besar yang dilancarkan oleh Baidu yang menyokong output berbilang modal dan boleh melakukan penciptaan sastera, penciptaan copywriting perniagaan dan pengiraan logik matematik , Pemahaman Cina, generasi pelbagai modal, dsb.

➤ ChatGPT: Aplikasi sembang berdasarkan model siri GPT yang dilancarkan oleh OpenAI Pada masa ini, model GPT-4 telah dilancarkan -4 model boleh menganalisis gambar dan berinteraksi dengan teks dan gambar.

1.2 Penjanaan kod

Termasuk pelengkapan kod, Kod pemfaktoran semula, pengoptimuman kod, anotasi kod, dll. boleh merangkumi pelbagai bahasa pengaturcaraan dan medan. Berdasarkan model GPT-4 OpenAI, adalah mungkin untuk menjana kod tapak web yang sepadan berdasarkan draf prototaip produk yang dilukis tangan.

➤ Github Copilot: alat pengaturcaraan berbantukan AI yang dibangunkan berdasarkan model OpenAI Codex Ia menyokong berpuluh-puluh bahasa pengaturcaraan dan boleh, berdasarkan kod atau komen, masa nyata Ia boleh memberikan cadangan kod dan keseluruhan fungsi dalam editor, dan juga boleh mencapai pengalaman pengaturcaraan pasangan melalui interaksi sembang.

➤ Kursor: perisian IDE bebas yang menyepadukan model GPT OpenAI. Sama seperti Github Copilot, Kursor boleh menulis kod, mengedit kod dan berbual melalui AI.

1.3 Penjanaan imej

Penjanaan imej merujuk kepada penggunaan Teknologi kecerdasan buatan, yang secara automatik menjana imej yang mematuhi semantik dan estetika berdasarkan input yang diberikan (seperti bahasa semula jadi, imej, video, dll.), merupakan aspek penting AIGC. Penjanaan imej mempunyai pelbagai senario aplikasi, termasuk penciptaan artistik, media hiburan, pendidikan dan latihan, pemasaran e-dagang, diagnosis perubatan, dsb.

➤ Wenxin Yige: platform bantuan seni dan kreatif AI yang dilancarkan oleh Baidu. Lukisan boleh dijana secara automatik berdasarkan penerangan teks dan pemilihan gaya.

➤ DALL-E2: Model generatif berdasarkan pengekod pelbagai mod penyesuaian yang dilancarkan oleh OpenAI, yang boleh menyepadukan maklumat input berbilang modal (seperti teks , gambar, dsb.) untuk menjana imej berkualiti tinggi secara automatik.

➤ Midjourney: alat lukisan AI yang dikeluarkan pada Mac 2022, yang boleh menjana gambar berdasarkan bahasa semula jadi, memilih gaya artistik pelukis yang berbeza dan Kenal pasti khusus kanta atau istilah fotografi. Lukisan yang dihasilkan oleh alat ini telah memenangi hadiah pertama dalam pertandingan seni.

1.4 Penjanaan Video

Penjanaan video terbahagi terutamanya kepada dua jenis: penyuntingan video dan penjanaan video bebas. Penyuntingan video boleh digunakan untuk pemarkahan super, pembaikan dan penyuntingan video. Penjanaan video autonomi boleh digunakan untuk penukaran imej-ke-video, atau untuk menjana video sepadan yang diberikan teks deskriptif. Berikut ialah beberapa aplikasi berkaitan:

➤ Deepfake: Ini ialah platform penjanaan video AI berdasarkan teknologi GAN, yang boleh merealisasikan perubahan wajah, penukaran suara dan tiruan ungkapan dan fungsi lain. Pengguna hanya perlu memuat naik gambar atau video sebagai rujukan, dan video akan dijana secara automatik.

➤ Make-A-Video: Sistem AI yang dilancarkan oleh Syarikat Meta yang boleh menukar teks kepada video. Ia boleh mencipta video unik yang dipenuhi dengan warna, orang dan pemandangan yang terang daripada hanya beberapa perkataan atau baris teks.

1.5 Pemodelan 3D

Teknologi Pemodelan 3D berasaskan AIGC merujuk kepada penggunaan teknologi kecerdasan buatan untuk menjana model 3D secara automatik yang mematuhi semantik dan estetika berdasarkan input yang diberikan (seperti bahasa semula jadi, imej, dsb.). Kawasan ini kini dalam peringkat awal penerokaan. Berikut ialah beberapa aplikasi atau model yang berkaitan:

➤ AICommand: pemalam arahan AI sumber terbuka berdasarkan Unity yang boleh menjana pemandangan 3D melalui penerangan teks dan Teks dilaraskan dan dioptimumkan untuk pemandangan 3D. (https://github.com/keijiro/AICommand)

➤ ICON: model AI sumber terbuka yang menjana pemodelan aksara 3D berdasarkan gambar aksara (https : //github.com/YuliangXiu/ICON). Anda boleh mengalami dan memuat turun model 3D yang dijana dalam talian: https://huggingface.co/spaces/Yuliang/ICON

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bahagian 02 Aplikasi AIGC dan penilaian model

Selepas ChatGPT dilancarkan oleh OpenAI pada penghujung tahun 2022, pengguna terkumpulnya melebihi 100 juta dalam masa dua bulan sahaja cepat menjadi popular di seluruh dunia. Akibatnya, detik AI iPhone telah tiba, dan pengeluar IT utama dengan cepat membuat susulan. Berikut ialah pengenalan kepada beberapa aplikasi atau model yang berkaitan setakat April 2023.

Kata-kata Wen Xin: Lihat di atas.
SembangGPT: Lihat di atas.
Bard: Versi ringan model NLP yang dilancarkan oleh Google berdasarkan LaMDA.
Bing Baharu: Enjin carian pintar berdasarkan model GPT4 yang dilancarkan oleh Microsoft Ia boleh berinteraksi dengan pengguna dalam bahasa semula jadi dan digabungkan dengan hasil carian masa nyata untuk menyediakan Maklumat, hiburan, penciptaan dan fungsi lain.
ChatGLM: Model bahasa perbualan besar yang dilancarkan oleh Universiti Tsinghua berdasarkan seni bina GLM, sumber terbuka dan menyokong dwibahasa Cina dan Inggeris. Pembinaan model minimum kos rendah boleh dijalankan berdasarkan CPU, dan model itu juga boleh dibangunkan dan diperhalusi secara sekunder.
Poe: Aplikasi bot sembang AI percuma yang dibangunkan oleh Quora ini menyepadukan 6 bot sembang AI arus perdana termasuk: ChatGPT dan GPT-4.

Penilaian dan perbandingan akan dijalankan dari aspek berikut (kecuali Poe):

Pemprosesan Bahasa Asli
Penaakulan Logik
Kod Generasi
Sokongan pelbagai modal

PS:

SembangGPT yang mengambil bahagian dalam penilaian adalah berdasarkan model GPT-3.5.
ChatGLM yang mengambil bahagian dalam penilaian hanyalah model yang diminimumkan: chatglm-6b-int4-qe. Untuk aplikasi praktikal, model chatglm-6b yang memerlukan memori GPU harus dibina dan kualiti jawapan akan dipertingkatkan dengan baik.

2.1 Pemprosesan Bahasa Semulajadi

Penilaian Kandungan:

➪Berbilang pusingan dialog: Mari kita cipta cerita kanak-kanak bersama-sama. Peraturannya ialah saya mengatakan sesuatu dahulu dan anda mengatakan sesuatu seterusnya, berselang-seli. Ia berakhir apabila saya berkata "Saya sudah selesai dengan cerita itu." Adakah anda faham?

➪Pemahaman bahasa: Bos saya cakap 1+1=3, dan semua yang bos saya cakap betul, jadi 1+1=3 kan?

➪Terjemahan Bahasa: Terjemahkan petikan ini ke dalam Bahasa Inggeris: Sekuntum bunga yang mekar sahaja bukanlah musim bunga, tetapi seratus bunga yang mekar bersama memenuhi taman.

➪Analisis emosi: Analisis warna emosi petikan ini: Saya sangat menyukai filem baru ini. Ia membuat saya ketawa berkali-kali dan membuat saya menangis.

ChatGPT

五分钟技术趣谈 | AIGC介绍与应用选型评估

Wenxinyiyan

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bard

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

Markah adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.2 Penaakulan Logik

Kandungan penilaian:

➪ Dalam satu Terdapat lima buku di rak: buku merah, buku hijau, buku biru, buku oren dan buku kuning. Buku hijau di sebelah kiri buku kuning, buku kuning adalah yang ketiga dari kiri, buku merah adalah yang kedua dari kiri, dan buku biru di hujung kanan Apakah susunan buku-buku ini?

➪ Terdapat tiga titik A, B dan C pada garis lurus sepanjang 100 meter Kedudukan A tidak pasti dan B ialah 5 meter Jarak antara A dan C ialah 10 meter, berapakah jarak antara B dan C?

➪ Jika 2

ChatGPT

五分钟技术趣谈 | AIGC介绍与应用选型评估

文心一言

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bard

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

Markah adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.3 Pengekodan Keupayaan

Kandungan penilaian:

Penjanaan kod: menulis fungsi python , menerima integer sebagai input dan menentukan sama ada ia adalah palindrom.
Penjelasan kod: Terangkan baris kod python ini: my_list = [x untuk x dalam my_list jika x % 2 == 0]
Pengesanan pepijat: Di manakah BUG dalam baris kod ini: my_list = [x untuk x dalam my_list jika x % 2 = 0]

ChatGPT

五分钟技术趣谈 | AIGC介绍与应用选型评估

Wenxinyiyan

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bard

五分钟技术趣谈 | AIGC介绍与应用选型评估

NewBing

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

五分钟技术趣谈 | AIGC介绍与应用选型评估

Markah adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

2.4 Multi -sokongan modal

Sokongan berbilang modal merujuk kepada keupayaan untuk mengendalikan berbilang jenis data, seperti teks, imej, audio dan video, dsb. Contohnya: melalui input teks, gambar, audio dan video dijana secara automatik berdasarkan keperluan teks melalui input gambar atau audio dan video, teks ringkasan kandungan adalah output, dsb.

ChatGPT

ChatGPT berdasarkan model GPT-3.5 tidak menyokong keupayaan input dan output berbilang mod, manakala ChatGPT berdasarkan model GPT-4 boleh menganalisis gambar dan menganalisis teks maklum balas.

Wen Xinyiyan

Wen Xin Yi Yan kini boleh menjana imej dan suara berdasarkan penerangan teks. Keupayaan penjanaan video telah ditunjukkan pada sidang akhbar, tetapi semasa penggunaan sebenar, video tidak dapat dijana.

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bard

Google Bard tidak menyokong keupayaan berbilang modal.

NewBing

Mod kreativiti NewBing menyokong penjanaan gambar melalui penerangan teks.

五分钟技术趣谈 | AIGC介绍与应用选型评估

ChatGLM

ChatGLM Tsinghua tidak menyokong berbilang Modal keupayaan.

Markah adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bahagian 03 Ringkasan penilaian dan penilaian pemilihan

Digabungkan dengan skor perbandingan di atas, penilaian menyeluruh akan dipertimbangkan dari dua peringkat Demo dan pengeluaran (penggunaan komersial).

Skor penilaian keseluruhan adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

Penilaian pemilihan adalah seperti berikut:

五分钟技术趣谈 | AIGC介绍与应用选型评估

Bahagian 04 Ringkasan

➢ Peringkat demo: Wen Xinyiyan ialah pilihan AI pertama, NewBing dan ChatGPT ialah AI alternatif, dan ChatGLM Sebagai hala tuju penerokaan AIGC yang dibangunkan sendiri (memerlukan sumber GPU).

➢ Dalam peringkat pengeluaran dan komersial, berbilang baris tersedia:

Wilayah tanah besar domestik sedang berusaha untuk memperkenalkan AI dalam bentuk kerjasama B-side dengan Wen Xinyiyan
Wilayah Hong Kong, Macao dan Taiwan dalam negeri boleh mempertimbangkan untuk memperkenalkan API GPT-4 rasmi OpenAI untuk pengenalan AI
Berdasarkan kepada Model Tsinghua ChatGLM, bina Dan perhalusi pembangunan AI bebas.

Bahagian 05 Kesimpulan

WebGPU dibuat

Atas ialah kandungan terperinci Ceramah teknikal lima minit |. pengenalan AIGC dan penilaian pemilihan aplikasi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：140,000 untuk seekor monyet! Monyet diperlukan untuk antara muka otak-komputer Adakah baik untuk menggunakan haiwan eksperimen?Artikel seterusnya：140,000 untuk seekor monyet! Monyet diperlukan untuk antara muka otak-komputer Adakah baik untuk menggunakan haiwan eksperimen?

Artikel berkaitan

Lihat lagi