Rumah > Artikel > Peranti teknologi > Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!
Baru-baru ini, seorang penyelidik AI dan artis digital bernama Xander Steenbrugge telah memuat naik video yang sangat mengejutkan "Journey Across Time".
Evolusi besar kehidupan di bumi, bermula dari lautan primitif, kepada cicak purba, dinosaur, mamalia, kepada monyet, orang utan, beruk, homo sapiens... dan akhirnya fiksyen sains muncul di dunia masa depan.
Dan Steenbrugge juga mengulas dengan teruja: Kami melintasi ambang di mana AI generatif bukan lagi hanya mengenai estetika novel, tetapi telah berkembang menjadi alat yang menakjubkan yang boleh dibina Perkasa, berpusatkan manusia naratif. Steenbrugge berkata video itu menggunakan 36 frasa berturut-turut. Untuk mencari susunan yang terbaik, dia mencuba lebih daripada seribu petunjuk dan benih yang berbeza, dan menggunakan banyak teknik "kejuruteraan pembayang" pada kod untuk mengetahui apa yang berkesan dan apa yang tidak.
Bekas Pengarah Kanan Tesla AI Andrej Karpathy sangat terkejut selepas membacanya sehingga dia tidak dapat menahan diri untuk mencubanya.
"Mesin rangkaian neural steampunk surreal, dalam bentuk otak, diletakkan di atas tapak yang ditutup dengan neuron yang diperbuat daripada gear", masukkan teks ini Kemudian, karya agungnya dihasilkan.
Video 2 minit (~1 jam dipaparkan pada A100), dijana oleh interpolasi lancar antara model dengan input hingar rawak.
Model yang dipanggil Stable Diffusion ini menggunakan kaedah "interpolasi" antara makna dua ayat. Sisipan ialah jurang semantik dan bukannya visual, jadi ia secara dramatik mengubah cara cerita itu disampaikan.
Dan ini hanyalah permulaan revolusi penciptaan kandungan digital yang dipacu oleh kecerdasan buatan generatif.
Sejak awal tahun 2021, kecerdasan buatan yang boleh menjana imej daripada huraian teks telah berkembang pesat. Pada masa itu, OpenAI menunjukkan hasil yang mengagumkan dengan DALL-E 1 dan CLIP.
Pada tahun 2022, OpenAI mengeluarkan DALL-E 2 yang mengagumkan, Google mempamerkan Imagen dan Parti, Midjourney melancarkan beta awam, dan Craiyon mencipta imej AI di mana-mana jenis media sosial.
Dan kini baru-baru ini, Stability AI telah mengeluarkan model baharu - Stable Diffusion.
Walau bagaimanapun, tidak seperti DALL-E 2, Stable Diffusion boleh melahirkan pelbagai orang terkenal yang diharamkan oleh OpenAI.
Walaupun sistem seperti Midjourney, Pixelz.ai, dsb. juga boleh melakukannya, kualiti yang dihasilkannya adalah jauh daripada setanding dengan Stable Diffusion , dan tiada satu pun daripadanya sumber terbuka.
Kini kami menjemput rakan lama kami Musk untuk melakukan transformasi saat kedua menjadi "Black Widow" (Scarlett Johansson).
Jelas sekali, Stability AI, sebagai peneraju pembangun, berharap lebih daripada satu syarikat atau pasukan akan dapat melatih varian Stable Diffusion.
Sebagai contoh, anda seorang penyelidik yang tidak mempunyai kuasa pengkomputeran GPU yang besar. Jangan risau, Stable Diffusion tidak lama lagi akan dapat dijalankan pada kad grafik dengan hanya 5.1GB VRAM.
Sebagai contoh lain, jika anda peminat MacBook yang dilengkapi dengan cip Apple M1, Stable Diffusion juga boleh dijalankan. Walau bagaimanapun, masa untuk penjanaan imej akan berubah daripada beberapa saat kepada beberapa minit.
Nampaknya model multimodal sedang menuju ke laluan yang telah diambil oleh model bahasa besar sebelum ini: beralih daripada vendor tunggal dan menjadikan banyak alternatif tersedia secara meluas melalui sumber terbuka.
Selain itu, Runway sudah pun mengkaji cara melaksanakan penyuntingan teks-ke-video berdasarkan Stable Diffusion.
Dalam satu perkataan, biarlah gelanggang tenis menjadi pantai
Tidak kira kilat dan guruh, atau angin dan cahaya matahari;
Sama ada di bulan atau di Marikh; tenis...
Menggunakan pengiraan untuk mempercepatkan sumber terbuka AI asas
Selepas fasa ujian, Stable Diffusion akan menjadi percuma dan kod serta model terlatih akan dikeluarkan sebagai sumber terbuka. Terdapat juga versi yang dihoskan dengan antara muka web untuk pengguna menguji sistem.
Organisasi bukan untung LAION (Large Scale Artificial Intelligence Open Network) menyediakan set data LAION 5B sumber terbuka untuk data latihan, yang ditapis oleh pasukan berdasarkan maklum balas manusia semasa fasa ujian awal untuk Mencipta set data latihan LAION-Aesthetics akhir.
Patrick Esser dari Runway dan Robin Rombach dari LMU Munich mengetuai projek itu, yang penyelidikannya dalam kumpulan CompVis di Universiti Heidelberg meletakkan asas bagi projek itu. Di Universiti Heidelberg mereka mencipta VQGAN dan Latent Diffusion yang digunakan secara meluas. Kedua-dua model ini, ditambah dengan hasil OpenAI dan Google Brain, mendayakan Stable Diffusion.
Stability AI diasaskan pada 2020, dan pelabur di belakangnya ialah ahli matematik dan saintis komputer Emad Mostaque. Beliau telah bekerja sebagai penganalisis di pelbagai dana lindung nilai.
Dengan Stability AI dan kekayaan peribadinya, Mostaque berharap dapat memupuk komuniti penyelidikan AI sumber terbuka. Permulaannya sebelum ini telah menyokong penciptaan set data "LAION 5B". Untuk melatih model Stable Diffusion, Stability AI menyediakan pelayan dengan 4,000 GPU Nvidia A100.
"Tiada orang lain yang mempunyai kuasa membuat keputusan kecuali 75 pekerja kami - bukan bilionair, dana besar atau kerajaan. Kami bebas sepenuhnya." "Kami merancang untuk menggunakan pengkomputeran kami untuk mempercepatkan sumber terbuka kecerdasan buatan asas."
Netizen menjadi gila
Selain dua video pada mulanya, sesetengah netizen juga menggunakan Stable Diffusion menjana animasi penuaan.
Selain itu, terdapat pelbagai gambar pegun termenung.
「Kekasih」
「Singa」
"Dark Soul" yang ditulis oleh Leyendecker dan Maxence"Cyber Peking Opera"
Easter Egg
Alami perjalanan mental yang terseksa oleh bekas pengarah kecerdasan buatan dan penglihatan pemanduan autonomi Tesla Andrej Karpathy.
Selepas menonton video yang dibuat oleh tuannya, Karpathy sangat teruja.
Keputusan yang dicapai melalui beberapa siri operasi tidak akan terasa terkeluar walaupun dalam kelas tadika kecil. Karpathy yang terdesak berkata bahawa dia ingin mengupah "jurutera segera" untuk menciptanya untuknya. Akhirnya Karpathy akhirnya sedar dan mencipta karya baru yang sangat dia berpuas hati - mesin rangkaian saraf tiruan steampunk dan pasta blueberry.
Atas ialah kandungan terperinci Model ini meminati bekas Pengarah AI Tesla Andrej Karpathy selama tiga hari!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!