Rumah >Peranti teknologi >AI >Cara bermain lukisan AI, yang sangat popular tahun ini

Cara bermain lukisan AI, yang sangat popular tahun ini

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-04-17 11:25:021267semak imbas

1. Kata Pengantar

2022 pasti boleh dikatakan sebagai tahun pertama AIGC Berdasarkan arah aliran carian Google, jumlah carian untuk lukisan AI dan seni yang dihasilkan oleh AI akan meningkat pada tahun 2022.

Sebab yang sangat penting bagi letupan lukisan AI tahun ini ialah sumber terbuka Stable Diffusion, yang juga tidak dapat dipisahkan daripada Model Difusi dalam tahun kebelakangan ini, perkembangan pesat model resapan dalam beberapa tahun kebelakangan ini, digabungkan dengan model bahasa teks OPENAI yang telah dibangunkan GPT-3, menjadikan proses penjanaan daripada teks kepada imej lebih mudah.

2. Kesesakan GAN (Generative Adversarial Network)

Sejak kelahirannya pada 2014 hingga StyleGAN pada 2018, GAN telah mencapai kemajuan besar dalam bidang penjanaan imej. Sama seperti pemangsa dan mangsa dalam alam semula jadi bersaing dan berkembang bersama, prinsip GAN hanyalah menggunakan dua rangkaian saraf: satu sebagai penjana dan satu sebagai diskriminator Penjana menjana imej yang berbeza untuk menilai sama ada hasilnya atau tidak, kedua-duanya bersaing antara satu sama lain untuk melatih model.

Cara bermain lukisan AI, yang sangat popular tahun ini

GAN (Generative Adversarial Network) telah mencapai keputusan yang baik melalui pembangunan berterusan, tetapi terdapat beberapa masalah yang sentiasa sukar diatasi: kekurangan kepelbagaian dalam hasil yang dijana , Mod runtuh (penjana berhenti membuat kemajuan selepas mencari mod terbaik), dan kesukaran latihan yang tinggi. Kesukaran ini telah menyukarkan seni yang dijana AI untuk menghasilkan produk praktikal.

3. Terobosan Model Resapan

Selepas bertahun-tahun tempoh kesesakan GAN, saintis menghasilkan kaedah Model Resapan yang sangat ajaib untuk melatih model: Imej asal menggunakan rantai Markov secara berterusan tambah titik hingar padanya, dan akhirnya menjadi imej hingar rawak Kemudian rangkaian saraf latihan dibenarkan untuk membalikkan proses ini dan secara beransur-ansur memulihkan imej hingar rawak kepada imej asal Dengan cara ini, rangkaian saraf boleh Ia dikatakan keupayaan untuk menghasilkan imej dari awal. Untuk menjana imej daripada teks, teks penerangan diproses dan ditambah sebagai bunyi pada imej asal Ini membolehkan rangkaian saraf menjana imej daripada teks.

Cara bermain lukisan AI, yang sangat popular tahun ini

Model Penyebaran menjadikan latihan model lebih mudah Ia hanya memerlukan sejumlah besar gambar, dan kualiti imej yang dijana juga boleh dipertingkatkan. Mencapai tahap yang sangat tinggi, dan menjana kepelbagaian hasil yang hebat, inilah sebabnya generasi baharu AI boleh mempunyai "imaginasi" yang sukar dipercayai.

Sudah tentu, teknologi telah membuat penemuan baru Versi StyleGAN-T yang dipertingkatkan yang dilancarkan oleh NVIDIA pada penghujung Januari telah mencapai kemajuan yang menakjubkan kuasa. 3 saat, StyleGAN-T hanya mengambil masa 0.1 saat. Dan StyleGAN-T adalah lebih baik daripada Model Resapan dalam imej resolusi rendah, tetapi dalam penjanaan imej resolusi tinggi, Model Resapan masih mendominasi. Memandangkan StyleGAN-T tidak digunakan secara meluas seperti Stable Diffusion, artikel ini terutamanya memperkenalkan Stable Diffusion.

4. Stable Diffusion

Awal tahun ini, AI painting circle mengalami era Disco Diffusion, DALL-E2, dan Midjouney sehingga Stable Diffusion adalah sumber terbuka ia memasuki satu tempoh masa. Debu telah diselesaikan Sebagai model lukisan AI yang paling berkuasa, Stable Diffusion telah menyebabkan karnival dalam komuniti AI Pada asasnya, model baharu dan perpustakaan sumber terbuka baru dilahirkan. Terutama selepas pelancaran versi WebUI Auto1111, menggunakan Stable Diffusion telah menjadi perkara yang sangat mudah sama ada digunakan dalam awan atau tempatan Dengan pembangunan berterusan komuniti, banyak projek yang sangat baik, seperti Dreambooth dan deforum, telah menjadi Stabil. Pemalam untuk versi Diffusion WEBUI telah ditambah, membolehkan fungsi seperti model penalaan halus dan penjanaan animasi diselesaikan dalam sehenti.

Cara bermain lukisan AI, yang sangat popular tahun ini

5 Pengenalan kepada permainan dan keupayaan lukisan AI

Berikut ialah pengenalan kepada permainan dan keupayaan yang tersedia pada masa ini menggunakan Stable. Resapan

Lionel MessiLeonardo DiCaprio

Pengenalan kepada keupayaan Resapan Stabil (gambar berikut dikeluarkan menggunakan Model SD1.5)
	Pengenalan	Input	Output
text2img	Jana imej melalui penerangan teks dan anda boleh menentukan gaya artis dan jenis seni melalui penerangan teks. Berikut adalah contoh dalam gaya artis Greg Rutkowski.	seorang gadis cantik dengan kemeja berbunga bergambar untuk gambar dengan dagu diletakkan di tangan kanannya, oleh Greg Rutkowski
img2img	Jana gambar daripada gambar dan huraian teks	seorang gadis cantik dengan baju bunga bergambar untuk gambar dengan dagu diletakkan di tangan kanannya, oleh Greg Rutkowski
melukis	Berdasarkan img2img, Dengan menetapkan topeng, hanya kawasan dalam topeng dilukis, yang biasanya digunakan untuk mengubah suai kata kunci untuk memperhalusi skrin.	seorang gadis cantik berbaju bunga tersenyum lembut sambil bergambar dengan dagu disandarkan di tangan kanannya, oleh Greg Rutkowski
Menggunakan DreamBooth berasaskan Model SD melatih model besar yang diperhalusi Selepas latihan, model boleh menggunakan text2img img2img yang disebutkan di atas dan keupayaan lain
NovelAI text2img	Model gaya animasi dua dimensi berprestasi terbaik pada masa ini dilatih oleh NAI berdasarkan imej awam daripada tapak web danbooru sebagai set data, disebabkan isu hak cipta pada danbooru sendiri, NovelAI sentiasa menjadi kontroversi, dan Model ini dibocorkan daripada perkhidmatan komersial dan harus digunakan dengan berhati-hati.	seorang gadis cantik berbaju bunga bergambar untuk gambar sambil dagu diletakkan di tangan kanannya
NovelAI img2img	Gunakan model NovelAI untuk img2img. Lukisan AI Yijian, yang kini sangat popular dalam pelbagai komuniti, juga menggunakan keupayaan ini. Tetapi Yiyi menyebut dalam penafian bahawa model animasi mereka telah dilatih pada set data yang mereka kumpulkan. *Penerangan teks contoh di sebelah kanan adalah berdasarkan kandungan imej dan inferens AI Gaya artis adalah rawak	seorang gadis cantik dengan baju bunga. bergambar dengan dagu diletakkan di tangan kanannya AI Painting
Model subjek dilatih berdasarkan foto pengguna	Latih model khusus subjek berdasarkan beberapa foto yang disediakan oleh pengguna Model ini boleh digunakan untuk menjana sebarang gambar yang mengandungi subjek berdasarkan penerangan.	Set gambar ini menggunakan 20 foto rakan sekerja untuk melatih model 2000 langkah berdasarkan model Stable Diffusion 1.5, dengan beberapa output segera yang digayakan. contoh segera (Rajah 1): potret alicepoizon, potret vfx yang sangat terperinci, enjin tidak sebenar, greg rutkowski, loish, rhads, caspar david friedrich, makoto shinkai dan lois van baarle, ilya kuvshinov, rossdraws, elegent, tom bagshaw, alphonse mucha, pencahayaan global, persekitaran yang terperinci dan rumit *alicepoizon ialah nama yang diberikan kepada watak ini semasa melatih model ini
Model gaya yang dilatih berdasarkan jenis gaya yang sama	Menggunakan set gambar gaya yang sama untuk melatih model besar yang ditala halus, yang boleh digunakan untuk menjana gambar dengan gaya bersatu .	Set gambar ini dijana menggunakan model gaya yang diperhalusi melalui latihan dengan Dewu Digital Collection ME.X. seorang gadis cantik berbaju bunga

			>
		Scarlett Johansson

6. Pengenalan kepada aplikasi utama semasa

	Pengenalan	Sampel
Meitu, Douyin, 6pen, Italian The AI perkhidmatan mengecat yang disediakan oleh syarikat seperti	menyediakan pengalaman melukis AI yang lebih mudah, dan anda boleh menggunakan banyak model besar tersuai dengan gaya berbeza.
midjouney dan DallE 2	Dua perkhidmatan mengecat AI komersial. midjouney mempunyai model uniknya sendiri dengan tahap pengeluaran yang tinggi; DallE 2 menyediakan perkhidmatan API berbayar dan mempunyai kesan penjanaan berkualiti tinggi.
Lensa, Manjing, dll. menyediakan perkhidmatan latihan model peribadi	menyediakan perkhidmatan Dreambooth + Stable Diffusion sebelumnya, kira-kira 18-25 yuan setiap kali, muat naik 15-20 gambar Foto pengguna, menjana kira-kira 20 foto artistik tersuai.
AI Open Source Community Huggingface	https://www.php.cn/link/81d7118d88d5570189ace943bd14f142 Komuniti sumber terbuka AI arus perdana, serupa dengan github sumber terbuka mempunyai sebilangan besar model berasaskan Resapan Stabil yang diperhalusi (ditala halus) Pengguna sendiri boleh dimuat turun dan digunakan ke pelayan atau komputer tempatan mereka sendiri. Sebagai contoh, model pix2pix di sebelah kanan ialah model Stable Diffusion yang digabungkan dengan GPT3, yang boleh melengkapkan fungsi inpainting yang dinyatakan di atas melalui penerangan bahasa semula jadi.

7 Bina perkhidmatan WEBUI Resapan Stabil sendiri

Versi Cloud 7.1

Di sini dibina menggunakan kuasa pengkomputeran awan yang disediakan oleh AutoDL, anda boleh juga menggunakan Platform lain seperti Google Colab atau Baidu Feipiao, dsb.

Mula-mula daftar akaun pada AutoDL dan sewa hos awan dengan kad grafik A5000/RTX3090. https://www.autodl.com/market/list
Buat imej pada hos ini Untuk imej, anda boleh memilih imej algoritma berpakej di www.codewithgpu.com. Di sini kami mengambil imej https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/Stable-Diffusion-for-NovelAI sebagai contoh.

Cara bermain lukisan AI, yang sangat popular tahun ini

Selepas penciptaan, hidupkan dan mulakan JupterLab

Cara bermain lukisan AI, yang sangat popular tahun ini

Jalankan. arahan berikut untuk memulakan Hanya berkhidmat. Jika anda menghadapi ruang cakera sistem yang tidak mencukupi, anda juga boleh mengalihkan folder stable-diffusion-webui/ ke cakera data dan mulakan semula autodl-tmp. Jika anda menghadapi kegagalan permulaan, anda boleh mengkonfigurasi pecutan sumber akademik mengikut lokasi mesin anda.

cd stable-diffusion-webui/
rm -rf outputs && ln -s /root/autodl-tmp outputs
python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru

6.2 本地版本

Jika anda mempunyai komputer dengan kad grafik yang bagus, anda boleh menggunakan ia secara setempat Berikut ialah pengenalan untuk membina versi Windows:

Mula-mula anda perlu memasang Python 3.10.6 dan menambah pembolehubah persekitaran pada Path
Pasang git
Kod projek WEBUI Clone Stable Diffusion ke setempat
Letakkan model fail dalam Di bawah direktori model/Stable-Diffusion, model berkaitan boleh dimuat turun dari https://www.php.cn/link/81d7118d88d5570189ace943bd14f142
Jalankan webui-user.bat dan akses perkhidmatan melalui komputer tempatan IP dan port 7860.

8 Ringkasan

Artikel ini memperkenalkan beberapa maklumat yang berkaitan tentang lukisan AI juga boleh menggunakan perkhidmatan itu sendiri dan cuba belajar menggunakan DreamBooth atau lagu terbaru Lora. model besar. Saya percaya bahawa pada tahun 2023, apabila populariti AIGC terus meningkat, kerja dan kehidupan kita akan banyak diubah oleh AI. Pelancaran ChatGPT suatu ketika dahulu memberikan kami kejutan yang besar Sama seperti keupayaan untuk mencari maklumat apabila kami mula-mula memasuki Internet, belajar menggunakan AI untuk membantu kerja kami juga akan menjadi keupayaan yang sangat penting pada masa hadapan.

9. Rujukan

Dari punca kepada kontroversi, mari kita bercakap tentang AI pada tahun pertama seni generatif AI

https://sspai. com/ post/76277

Nota Kajian Neural Network 6 - Pemahaman awal tentang GAN dan Difusi di sebalik lukisan AI generatif

https://blog.csdn.net/ qq_45848817/article/details/127808815

Cara model resapan berfungsi: matematik dari awal

https://theaisummer.com/diffusion-models/

Gambaran keseluruhan struktur GAN pengenalan ajaib kepada seni AI

https://www.entrogames.com/2022/08/absolical-introduction-guiney -to-ai-art/

Apl avatar AI viral Lensa membuka pakaian saya—tanpa persetujuan saya

https://www.technologyreview.com/2022/12 /12/1064751/the-viral -ai-avatar-app- Lensa-telanjangkan-saya-tanpa-perkenan-saya/

arahkan-pix2pix

https: //www.php.cn/ link/81d7118d88d5570189ace943bd14f142timbrooks/instruct-pix2pix

Atas ialah kandungan terperinci Cara bermain lukisan AI, yang sangat popular tahun ini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python php for math .net github windows 算法 gpt-3 stable diffusion chatgpt https AIGC AI作画 gpt midjourney prompt

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Nilai kecerdasan buatan dalam analisis IoTArtikel seterusnya：Nilai kecerdasan buatan dalam analisis IoT

Artikel berkaitan

Lihat lagi

Cara bermain lukisan AI, yang sangat popular tahun ini

1. Kata Pengantar

2. Kesesakan GAN (Generative Adversarial Network)

3. Terobosan Model Resapan

4. Stable Diffusion

5 Pengenalan kepada permainan dan keupayaan lukisan AI

AI Painting

6. Pengenalan kepada aplikasi utama semasa

7 Bina perkhidmatan WEBUI Resapan Stabil sendiri

Versi Cloud 7.1

8 Ringkasan

9. Rujukan

Artikel berkaitan