


AI menulis novel, lukisan dan memotong video AI Generatif adalah lebih popular!
Baru-baru ini, AI generatif telah menjadi popular semula! Applet WeChat yang dipanggil "Dream Stealer" menjadi popular serta-merta, mencapai rekod menambah 50,000 pengguna baharu setiap hari.
Dream Stealer ialah platform AI yang boleh menjana imej berdasarkan teks input Ia merupakan cabang AIGC (Kandungan Dijana AI).
Selepas pengguna menggunakan imaginasi mereka dan memasukkan penerangan teks, Dream Stealer boleh menjana gambar dalam tiga nisbah: 1:1, 9:16 dan 16:9, dan terdapat 24 gaya lukisan untuk dipilih - kecuali Lukisan asas jenis seperti lukisan minyak, cat air dan lakaran juga termasuk gaya khas seperti cyberpunk, vaporwave, seni piksel, Ghibli dan rendering CG.
Gambar: Editor Cloud Report Teknologi menggunakan applet WeChat "Dream Stealer" untuk menjana
Malah, ini bukan Graf "Yiwensheng" yang pertama” perisian AI. Dari Midjourney ke Stable Diffusion, AI generatif telah menjadi topik paling hangat dalam tempoh dua tahun yang lalu.
Sebagai hala tuju penting dalam pembangunan AI, AI generatif mempunyai potensi besar untuk pembangunan.
Menurut data daripada Gartner pada separuh pertama tahun ini, AI generatif dijangka menyumbang 10% daripada semua data yang dijana menjelang 2025, berbanding kurang daripada 1% pada masa ini.
Sesetengah orang percaya bahawa 2022 akan menjadi tahun pertama apabila AI generatif matang daripada teknologi untuk menembusi asas masyarakat.
Pertumbuhan AI generatif yang meletup: daripada gambar ke video
Dalam beberapa tahun kebelakangan ini, perkembangan teknologi AI dalam bidang penglihatan boleh digambarkan sebagai "cepat".
Pada Januari tahun lepas, OpenAI, sebuah syarikat yang berdedikasi untuk "memanfaatkan semua manusia dengan kecerdasan buatan am", mengeluarkan DALL-E yang menghasilkan zaman berdasarkan model GPT-3, yang merealisasikan penjanaan imej daripada teks.
Pada April tahun ini, OpenAI mengeluarkan model DALL-E 2 generasi kedua, yang sekali lagi menetapkan penanda aras baharu dalam bidang penjanaan imej.
Pengguna boleh menjana imej yang sepadan melalui penerangan teks pendek (prompt), supaya orang yang tidak boleh melukis juga boleh menukar imaginasi mereka menjadi ciptaan artistik, seperti ayat "Alpaca bermain bola keranjang" Empat gambar yang dihasilkan oleh rupa ini sangat sesuai dengan jangkaan semua orang.
Contoh gambar yang dijana oleh model DALL-E 2
Bukan itu sahaja, kerana butiran huraian teks terus diperhalusi, imej yang dihasilkan akan menjadi lebih dan lebih canggih. Lebih tepat, kesannya akan agak mengejutkan kepada bukan profesional.
Walau bagaimanapun, model seperti DALL-E 2 masih kekal dalam bidang penciptaan dua dimensi, iaitu penjanaan imej dan tidak boleh menjana model 3D 360 darjah tanpa jalan buntu.
Walau bagaimanapun, ini masih tidak sukar untuk penyelidik algoritma yang sangat kreatif Salah satu hasil terbaharu model Google Research-DreamFusion, boleh menjana model 3D dengan memasukkan gesaan teks ringkas, yang bukan sahaja boleh digunakan dalam pencahayaan yang berbeza. keadaan Rendering dilakukan di bawah, dan model 3D yang dijana juga mempunyai ciri seperti ketumpatan dan warna Ia malah boleh menyepadukan berbilang model 3D yang dijana ke dalam satu pemandangan.
Selepas menjana imej 3D, kakitangan algoritma Meta terus membuka idea mereka, mencabar kesukaran yang lebih tinggi dan mula meneroka menggunakan gesaan teks untuk menjana video secara langsung.
Walaupun video pada asasnya adalah superposisi bagi satu siri imej, berbanding dengan penjanaan imej, apabila menggunakan teks untuk menjana video, ia bukan sahaja perlu menjana berbilang bingkai adegan yang sama, tetapi juga untuk memastikan bahawa bingkai bersebelahan koheren antara. Memandangkan terdapat sedikit data video berkualiti tinggi yang tersedia semasa melatih model, tetapi jumlah pengiraan adalah sangat besar, ia sangat meningkatkan kerumitan tugas penjanaan video.
Pada bulan September tahun ini, penyelidik dari Meta mengeluarkan Make-A-Video, model penjanaan video pendek berkualiti tinggi berdasarkan kecerdasan buatan, yang setara dengan versi video DALL-E, juga digelar "Make video dengan mulut anda" bermakna anda boleh mencipta kandungan video baharu melalui gesaan teks. Teknologi utama di belakangnya juga datang daripada teknologi sintesis "imej teks" yang digunakan oleh penjana imej seperti DALL-E.
Hanya seminggu kemudian, Ketua Pegawai Eksekutif Google Pichai secara rasmi mengumumkan dua model untuk mencabar Make-A-Video Meta secara langsung, iaitu Imagen Video dan Phenaki.
Berbanding dengan Make-A-Video, Imagen Video menyerlahkan ciri definisi tinggi video, boleh menjana resolusi 1280*768, 24 bingkai sesaat klip video, dan juga boleh memahami dan menjana karya gaya artistik yang berbeza . ;
Memahami struktur 3D objek dan tidak akan berubah bentuk semasa putaran; animasi.
Video Imej menjana contoh video
manakala Phenaki boleh menjana syot panjang resolusi yang lebih rendah selama lebih daripada 2 minit berdasarkan gesaan kira-kira 200 perkataan . , menceritakan kisah yang agak lengkap.
Contoh video hasil Phenaki
Pada masa ini, terdapat banyak aplikasi AI generatif di China.
Sebagai contoh, APP Jianying ByteDance menyediakan fungsi video yang dijana AI dan boleh digunakan secara percuma.
Fungsi video gambar-ke-teks Pemotongan adalah serupa dengan Google Pencipta boleh menjana video pendek kreatif melalui beberapa kata kunci atau perenggan pendek teks.
Klip juga boleh memadankan bahan video secara bijak berdasarkan penerangan teks dan membungkus video ke dalam karya kandungan yang lebih menegak, termasuk kewangan, sejarah, kemanusiaan dan kategori lain.
Pada Januari 2022, NetEase melancarkan platform penciptaan muzik AI sehenti "NetEase Tianyin", yang menjana ucapan Tahun Baharu janaan AI yang diedit oleh pengguna ke dalam lagu, dan melancarkan versi profesional bahagian web pada yang pertama. separuh tahun.
Pada September 2021, APP Caiyun Xiaomeng akan dilancarkan, yang boleh mencipta pelbagai jenis teks Pengguna hanya perlu memberikan permulaan 1-1000 perkataan, dan Caiyun Xiaomeng boleh terus menulis cerita berikut.
Sebenarnya, terdapat banyak bentuk penciptaan AI. Apabila teknologi AI generatif digunakan untuk menulis, versi mesin wartawan, novelis, penyair, penulis skrip, dll. Apabila ia digunakan dalam bidang lukisan, muzik dan tarian, ia boleh "memupuk" pelukis, komposer dan editor. Kakitangan tarian.
Di sebalik ledakan AI generatif
Pada tahun lalu, AI generatif telah berkembang dengan lebih baik. Gergasi perisian dalam bidang AI seperti Google, Microsoft, dan Meta telah mempromosikan teknologi ini secara dalaman dan mengintegrasikan AI generatif ke dalam produk mereka.
Mengapa AI generatif tiba-tiba begitu popular?
Malah, teknologi AI generatif telah berkembang pesat, tetapi ia sebelum ini terhad kepada bulatan kecil dalam dunia teknologi kerana ambang teknikal yang tinggi.
Mengimbas kembali sejarah pembangunan teknologi AI, anda akan mendapati bahawa ledakan AI generatif tidak dapat dipisahkan daripada tiga faktor: model yang lebih baik, lebih banyak data dan lebih banyak pengiraan.
Sebelum 2015, model kecil dianggap sebagai "teknologi terkini" untuk memahami bahasa. Model-model kecil ini cemerlang dalam tugasan analisis dan digunakan dalam pekerjaan daripada meramalkan masa penghantaran kepada mengklasifikasikan penipuan.
Walau bagaimanapun, mereka tidak cukup ekspresif untuk tugas generasi umum. Menjana penulisan atau kod peringkat manusia masih menjadi impian.
Pada tahun 2017, Google Research menerbitkan kertas penting (Perhatian Adalah Semua yang Anda Perlukan) yang menerangkan seni bina rangkaian saraf baharu untuk pemahaman bahasa semula jadi, dipanggil transformer, yang boleh menjana model bahasa Unggul yang berkualiti, pada masa yang sama, adalah lebih selari dan memerlukan masa latihan yang jauh lebih sedikit.
Sudah tentu, apabila model semakin besar, mereka mula menunjukkan prestasi luar biasa. Jumlah pengiraan yang digunakan untuk melatih model ini meningkat sebanyak enam urutan magnitud dari 2015 hingga 2020, dengan keputusan melebihi penanda aras untuk prestasi manusia dalam tulisan tangan, pertuturan dan pengecaman imej, pemahaman bacaan dan pemahaman bahasa.
Antaranya, GPT-3 OpenAI menyerlahkan prestasi model ini telah membuat lonjakan besar berbanding GPT-2, menunjukkan keupayaan yang lebih baik daripada penjanaan kod kepada penulisan jenaka.
Walaupun kemajuan dalam semua bidang penyelidikan asas, model ini tidak universal.
Ia besar, sukar dijalankan (memerlukan penyelarasan GPU), tidak tersedia secara meluas (tidak tersedia atau hanya dalam beta tertutup) dan mahal untuk digunakan sebagai perkhidmatan awan.
Tetapi di sebalik batasan ini, aplikasi AI generatif terawal mula memasuki medan perang.
Selepas itu, apabila pengkomputeran menjadi lebih murah, industri terus membangunkan algoritma yang lebih baik dan model yang lebih besar.
Kebenaran pembangun dikembangkan daripada beta tertutup kepada beta terbuka atau, dalam beberapa kes, sumber terbuka.
Sekarang lapisan platform stabil, model terus menjadi lebih baik, lebih pantas dan lebih murah, dan akses kepada model cenderung menjadi percuma dan sumber terbuka, lapisan aplikasi AI sudah matang untuk kreativiti meledak.
Sebagai contoh, pada bulan Ogos tahun ini, model penjanaan imej teks Stable Diffusion adalah sumber terbuka. Successors boleh menggunakan alat sumber terbuka ini dengan lebih baik untuk mencungkil ekologi kandungan yang lebih kaya dan mempopularkannya kepada rangkaian C yang lebih luas. -pengguna akhir memainkan peranan penting.
Kepopularan Stable Diffusion pada asasnya ialah sumber terbuka mengeluarkan kreativiti.
AI Generatif menghadapi cabaran sebenar
Firma modal teroka Sequoia Capital menyebut dalam catatan blog di laman web rasminya: “AI Generatifberpotensi menjana trilion Nilai ekonomi dolar .
” Menurut Sequoia Capital, AI generatif boleh mengubah setiap industri yang memerlukan manusia mencipta karya asli, daripada permainan kepada pengiklanan kepada undang-undang.
Secara khusus, senario aplikasi AI generatif pada masa hadapan adalah sangat luas Selain industri pengeluaran kandungan seperti penciptaan budaya dan berita, AI generatif juga akan digunakan dalam penjagaan kesihatan. perdagangan digital, pembuatan, Pertanian dan industri lain mempunyai prospek aplikasi yang kaya, seperti membantu doktor mengesan lesi dalam X-ray, CT dan imbasan peralatan lain, mencipta kembar digital barangan, membantu dalam menguji kualiti produk, dsb.
Terdapat juga ruang aplikasi yang banyak dalam teknologi popular seperti XR, kembar digital dan kenderaan autonomi.
Tetapi perlu diingat bahawa masih terdapat banyak masalah yang perlu diselesaikan dalam AI generatif semasa.
Sebagai contoh, dalam bidang hiburan, salah satu sebab mengapa ramai orang menggunakan AI generatif untuk penciptaan adalah untuk mengelakkan isu hak cipta, tetapi ini tidak bermakna tiada bahaya tersembunyi.
Di satu pihak, penciptaan AI juga menggabungkan semula data yang dipelajari mengikut keperluan Walaupun butirannya semakin halus, tidak dapat dielakkan bahawa sesetengah orang yang bermata tajam akan melihat bahawa ia. mungkin rujukan Sesetengah netizen malah berkata di platform sosial bahawa mereka telah samar-samar melihat kesan tandatangan yang disyaki pada gambar yang dijana AI.
Sebaliknya, kebanyakan platform penjanaan AI semasa tidak menuntut hak cipta atau dengan jelas menyatakan bahawa ia boleh digunakan untuk tujuan komersil Walau bagaimanapun, apabila AI generatif secara beransur-ansur dikomersialkan persekitaran hak cipta sedemikian wujud? Sama ada isu hak cipta baru akan timbul juga perlu dibincangkan.
Logik dan keselamatan AI generatif juga perlu dipertingkatkan. AI generatif semasa terdedah kepada membuat kesilapan akal, dan juga terdedah kepada masalah di kawasan yang memerlukan ingatan jangka panjang.
Sebagai contoh, dalam proses novel yang dihasilkan oleh AI, selalunya terdapat ketidakselarasan kerana panjangnya.
Oleh itu, walaupun AI generatif sudah boleh digunakan dalam banyak bidang, untuk benar-benar meletakkan AI generatif berfungsi, banyak latihan mesti dilakukan untuk mengelakkan "kesilapan" yang disebabkan oleh AI.
Lagipun, senario aplikasi seperti perubatan dan pembuatan tidak mempunyai ruang yang sama untuk percubaan dan kesilapan seperti industri budaya dan kreatif.
Kesimpulan
Walaupun AI generatif pada masa ini tidak dapat dipisahkan daripada campur tangan manusia, tidak dapat dinafikan bahawa AI generatif masih mempunyai potensi pembangunan yang berpotensi besar.
Kemunculan AI generatif bermakna AI telah mula memainkan peranan baharu dalam kandungan kehidupan sebenar daripada "pemerhatian dan ramalan" kepada "penjanaan langsung dan membuat keputusan". Dengan kata lain, AI generatif mencipta, bukan hanya menganalisis.
Seperti kata CEO OpenAI Sam Altman: "AI Generatif mengingatkan kita bahawa sukar untuk membuat ramalan tentang kecerdasan buatan.
Sepuluh tahun yang lalu kebijaksanaan konvensional ialah: AI akan memberi kesan kepada kerja fizikal dahulu; dan kemudian, mungkin suatu hari nanti, ia boleh melakukan kerja kreatif.
Atas ialah kandungan terperinci AI menulis novel, lukisan dan memotong video AI Generatif adalah lebih popular!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!
![Tidak boleh menggunakan chatgpt! Menjelaskan sebab dan penyelesaian yang boleh diuji dengan segera [terbaru 2025]](https://img.php.cn/upload/article/001/242/473/174717025174979.jpg?x-oss-process=image/resize,p_40)
Chatgpt tidak boleh diakses? Artikel ini menyediakan pelbagai penyelesaian praktikal! Ramai pengguna mungkin menghadapi masalah seperti tidak dapat diakses atau tindak balas yang perlahan apabila menggunakan chatgpt setiap hari. Artikel ini akan membimbing anda untuk menyelesaikan masalah ini langkah demi langkah berdasarkan situasi yang berbeza. Punca ketidakmampuan dan penyelesaian masalah awal Chatgpt Pertama, kita perlu menentukan sama ada masalah itu berada di sisi pelayan Openai, atau masalah rangkaian atau peranti pengguna sendiri. Sila ikuti langkah di bawah untuk menyelesaikan masalah: Langkah 1: Periksa status rasmi Openai Lawati halaman Status Openai (status.openai.com) untuk melihat sama ada perkhidmatan ChATGPT berjalan secara normal. Sekiranya penggera merah atau kuning dipaparkan, ini bermakna terbuka

Pada 10 Mei 2025, ahli fizik MIT Max Tegmark memberitahu The Guardian bahawa AI Labs harus mencontohi kalkulus ujian triniti Oppenheimer sebelum melepaskan kecerdasan super buatan. "Penilaian saya ialah 'Compton Constant', kebarangkalian perlumbaan

Teknologi penciptaan muzik AI berubah dengan setiap hari berlalu. Artikel ini akan menggunakan model AI seperti CHATGPT sebagai contoh untuk menerangkan secara terperinci bagaimana menggunakan AI untuk membantu penciptaan muzik, dan menerangkannya dengan kes -kes sebenar. Kami akan memperkenalkan bagaimana untuk membuat muzik melalui Sunoai, AI Jukebox pada muka yang memeluk, dan perpustakaan Python Music21. Dengan teknologi ini, semua orang boleh membuat muzik asli dengan mudah. Walau bagaimanapun, perlu diperhatikan bahawa isu hak cipta kandungan AI yang dihasilkan tidak boleh diabaikan, dan anda mesti berhati-hati apabila menggunakannya. Mari kita meneroka kemungkinan AI yang tidak terhingga dalam bidang muzik bersama -sama! Ejen AI terbaru Terbuka "Openai Deep Research" memperkenalkan: [Chatgpt] Ope

Kemunculan CHATGPT-4 telah memperluaskan kemungkinan aplikasi AI. Berbanding dengan GPT-3.5, CHATGPT-4 telah meningkat dengan ketara. Ia mempunyai keupayaan pemahaman konteks yang kuat dan juga dapat mengenali dan menghasilkan imej. Ia adalah pembantu AI sejagat. Ia telah menunjukkan potensi yang besar dalam banyak bidang seperti meningkatkan kecekapan perniagaan dan membantu penciptaan. Walau bagaimanapun, pada masa yang sama, kita juga harus memberi perhatian kepada langkah berjaga -jaga dalam penggunaannya. Artikel ini akan menerangkan ciri-ciri CHATGPT-4 secara terperinci dan memperkenalkan kaedah penggunaan yang berkesan untuk senario yang berbeza. Artikel ini mengandungi kemahiran untuk memanfaatkan sepenuhnya teknologi AI terkini, sila rujuknya. Ejen AI Terbuka Terbuka, sila klik pautan di bawah untuk butiran "Penyelidikan Deep Openai"

App ChatGPT: Melepaskan kreativiti anda dengan pembantu AI! Panduan pemula Aplikasi CHATGPT adalah pembantu AI yang inovatif yang mengendalikan pelbagai tugas, termasuk menulis, terjemahan, dan menjawab soalan. Ia adalah alat dengan kemungkinan tidak berkesudahan yang berguna untuk aktiviti kreatif dan pengumpulan maklumat. Dalam artikel ini, kami akan menerangkan dengan cara yang mudah difahami untuk pemula, dari cara memasang aplikasi telefon pintar ChATGPT, kepada ciri-ciri yang unik untuk aplikasi seperti fungsi input suara dan plugin, serta mata yang perlu diingat apabila menggunakan aplikasi. Kami juga akan melihat dengan lebih dekat sekatan plugin dan penyegerakan konfigurasi peranti-ke-peranti

Chatgpt Versi Cina: Buka kunci pengalaman baru dialog Cina AI Chatgpt popular di seluruh dunia, adakah anda tahu ia juga menawarkan versi Cina? Alat AI yang kuat ini bukan sahaja menyokong perbualan harian, tetapi juga mengendalikan kandungan profesional dan serasi dengan Cina yang mudah dan tradisional. Sama ada pengguna di China atau rakan yang belajar bahasa Cina, anda boleh mendapat manfaat daripadanya. Artikel ini akan memperkenalkan secara terperinci bagaimana menggunakan versi CHATGPT Cina, termasuk tetapan akaun, input perkataan Cina, penggunaan penapis, dan pemilihan pakej yang berbeza, dan menganalisis potensi risiko dan strategi tindak balas. Di samping itu, kami juga akan membandingkan versi CHATGPT Cina dengan alat AI Cina yang lain untuk membantu anda memahami lebih baik kelebihan dan senario aplikasinya. Perisikan AI Terbuka Terbuka

Ini boleh dianggap sebagai lonjakan seterusnya ke hadapan dalam bidang AI generatif, yang memberi kita chatgpt dan chatbots model bahasa besar yang lain. Daripada hanya menjawab soalan atau menghasilkan maklumat, mereka boleh mengambil tindakan bagi pihak kami, Inter

Teknik pengurusan akaun berganda yang cekap menggunakan CHATGPT | Penjelasan menyeluruh tentang cara menggunakan perniagaan dan kehidupan peribadi! ChatGPT digunakan dalam pelbagai situasi, tetapi sesetengah orang mungkin bimbang untuk menguruskan pelbagai akaun. Artikel ini akan menerangkan secara terperinci bagaimana untuk membuat pelbagai akaun untuk chatgpt, apa yang perlu dilakukan apabila menggunakannya, dan bagaimana untuk mengendalikannya dengan selamat dan cekap. Kami juga meliputi perkara penting seperti perbezaan dalam perniagaan dan penggunaan peribadi, dan mematuhi syarat penggunaan OpenAI, dan memberikan panduan untuk membantu anda menggunakan pelbagai akaun. Terbuka


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Pelayar Peperiksaan Selamat
Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

DVWA
Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

VSCode Windows 64-bit Muat Turun
Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)
