DreamFace: Hasilkan manusia digital 3D dalam satu ayat?-AI-php.cn

Rumah

Peranti teknologi

DreamFace: Hasilkan manusia digital 3D dalam satu ayat?

PHPz

May 16, 2023 pm 09:46 PM

3dlelaki digital

Dengan perkembangan pesat sains dan teknologi hari ini, penyelidikan dalam bidang kecerdasan buatan generatif dan grafik komputer telah menjadi semakin menarik Industri seperti pengeluaran filem dan televisyen serta pembangunan permainan menghadapi cabaran dan peluang yang besar. Artikel ini akan memperkenalkan anda kepada penyelidikan dalam bidang penjanaan 3D - DreamFace, yang merupakan rangka kerja penjanaan 3D progresif berpandukan teks pertama yang menyokong penjanaan aset 3D Sedia Pengeluaran, yang membolehkan orang digital hiper-realistik 3D dipacu penjanaan teks.

Karya ini telah diterima oleh Transactions on Graphics, jurnal antarabangsa teratas dalam bidang grafik komputer, dan akan dibentangkan di SIGGRAPH 2023, persidangan antarabangsa teratas mengenai grafik komputer.

DreamFace：一句话生成 3D 数字人？

Tapak web projek: https://sites.google.com/view/dreamface

Kertas pracetak: https://arxiv.org/abs/2304.03117

Demo Web : https ://hyperhuman.top

Ruang Muka Peluk: https://huggingface.co/spaces/DEEMOSTECH/ChatAvatar

Pengenalan

Sejak penemuan hebat dalam teknologi penjanaan teks dan imej, teknologi penjanaan 3D secara beransur-ansur menjadi tumpuan penyelidikan saintifik dan industri. Walau bagaimanapun, teknologi penjanaan 3D pada masa ini di pasaran masih menghadapi banyak cabaran, termasuk isu keserasian saluran paip CG, isu ketepatan dan isu kelajuan berjalan.

Untuk menyelesaikan masalah ini, pasukan R&D dari Yingmo Technology dan Universiti Sains dan Teknologi Shanghai mencadangkan rangka kerja penjanaan 3D progresif berpandukan teks - DreamFace. Rangka kerja ini boleh menjana secara langsung aset 3D yang mematuhi piawaian pengeluaran CG, dengan ketepatan yang lebih tinggi, kelajuan larian yang lebih pantas dan keserasian saluran paip CG yang lebih baik. Artikel ini akan memperkenalkan fungsi utama DreamFace secara terperinci dan meneroka prospek aplikasinya dalam pengeluaran filem dan televisyen, pembangunan permainan dan industri lain.

Gambaran keseluruhan rangka kerja DreamFace

DreamFace：一句话生成 3D 数字人？

Rangka kerja DreamFace terutamanya merangkumi tiga modul: penjanaan geometri, Bahan berasaskan fizik penjanaan penyebaran dan penjanaan keupayaan animasi. Ketiga-tiga modul ini saling melengkapi untuk mencapai teknologi penjanaan 3D yang cekap dan boleh dipercayai.

Penjanaan geometri

DreamFace：一句话生成 3D 数字人？

Modul penjanaan geometri Tugas teras adalah untuk menghasilkan model geometri yang konsisten dengan gesaan teks. DreamFace mengguna pakai rangka kerja pemilihan berdasarkan CLIP (Contrastive Language-Image Pra-Training), yang mula-mula memilih model geometri kasar terbaik daripada calon sampel rawak dalam ruang parameter geometri muka, dan kemudian memahatnya melalui Model Resapan Tersirat (LDM) Geometri. butiran untuk menjadikan model kepala lebih konsisten dengan isyarat teks. Selain itu, rangka kerja ini juga menyokong gaya rambut dan penjanaan warna berdasarkan gesaan teks.

DreamFace：一句话生成 3D 数字人？

Penjanaan resapan bahan berasaskan fizikal

DreamFace：一句话生成 3D 数字人？

Modul penjanaan resapan bahan berasaskan fizikal direka bentuk untuk meramalkan tekstur muka yang konsisten dengan ramalan geometri dan isyarat teks. DreamFace terlebih dahulu memperhalusi LDM pra-latihan pada set data bahan UV berskala besar yang dikumpul untuk mendapatkan dua model resapan LDM. Skim latihan bersama kemudiannya digunakan untuk menyelaraskan dua proses resapan, satu untuk menafikan secara langsung peta tekstur UV dan satu lagi untuk imej yang diberikan diselia.

DreamFace：一句话生成 3D 数字人？

Untuk memastikan peta tekstur yang dibuat tidak mengandungi ciri atau situasi pencahayaan yang tidak diingini, sambil mengekalkan kepelbagaian, strategi pembelajaran kiu telah direka. Pasukan ini menggunakan dua kaedah untuk menjana peta pantulan meresap berkualiti tinggi: (1) Penalaan Segera. Tidak seperti isyarat teks khusus domain buatan tangan, DreamFace menggabungkan dua isyarat teks berterusan khusus domain Cd dan Cu dengan isyarat teks yang sepadan, yang akan dioptimumkan semasa latihan denoiser U-Net untuk mengelakkan ketidakstabilan dan penulisan gesaan manual yang memakan masa. (2) Menutup kawasan bukan muka. Proses denoising LDM akan dikekang tambahan oleh topeng bukan kawasan muka untuk memastikan peta meresap yang terhasil tidak mengandungi sebarang unsur yang tidak diingini.

Akhir sekali, tekstur berasaskan fizikal 4K dijana melalui modul resolusi super untuk pemaparan berkualiti tinggi.

DreamFace：一句话生成 3D 数字人？

Penjanaan keupayaan animasi

DreamFace：一句话生成 3D 数字人？

Model yang dihasilkan oleh DreamFace mempunyai keupayaan animasi. Hasilkan animasi diperibadikan dengan meramalkan ubah bentuk unik dan menganimasikan model Neutral yang terhasil. Pendekatan animasi muka saraf DreamFace memberikan perincian ekspresi yang lebih halus dan membolehkan persembahan yang ditangkap dengan halus berbanding pendekatan yang menggunakan BlendShapes generik untuk kawalan ekspresi.

Aplikasi dan Tinjauan

DreamFace：一句话生成 3D 数字人？

Rangka kerja DreamFace telah membuat pencapaian hebat dalam penjanaan selebriti dan penjanaan watak berdasarkan huraian. Selain itu, penyuntingan tekstur menggunakan isyarat dan lakaran disokong untuk kesan penyuntingan global seperti penuaan dan solek. Dengan menggabungkan lagi topeng atau lakaran, pelbagai kesan boleh dicipta seperti tatu, janggut, dan tanda lahir.

DreamFace：一句话生成 3D 数字人？

Rangka kerja penjanaan progresif DreamFace menyediakan penyelesaian yang berkesan kepada tugas penjanaan 3D yang kompleks dan menjanjikan lebih banyak penyelidikan dan teknologi yang serupa pembangunan. Di samping itu, penjanaan penyebaran bahan berasaskan fizikal dan penjanaan keupayaan animasi akan menggalakkan aplikasi teknologi penjanaan 3D dalam pengeluaran filem dan televisyen, pembangunan permainan dan industri lain yang berkaitan Marilah kita tunggu dan lihat perkembangan dan aplikasinya pada masa hadapan.

Atas ialah kandungan terperinci DreamFace: Hasilkan manusia digital 3D dalam satu ayat?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajariApr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let ’

Memasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananApr 12, 2025 pm 12:09 PM

AI Menambah Penyediaan Makanan Walaupun masih dalam penggunaan baru, sistem AI semakin digunakan dalam penyediaan makanan. Robot yang didorong oleh AI digunakan di dapur untuk mengautomasikan tugas penyediaan makanan, seperti membuang burger, membuat pizza, atau memasang SA

Panduan Komprehensif mengenai Python Namespaces & Variable ScopesApr 12, 2025 pm 12:00 PM

Pengenalan Memahami ruang nama, skop, dan tingkah laku pembolehubah dalam fungsi Python adalah penting untuk menulis dengan cekap dan mengelakkan kesilapan runtime atau pengecualian. Dalam artikel ini, kami akan menyelidiki pelbagai ASP

Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400Apr 12, 2025 am 11:52 AM

Meneruskan irama produk, bulan ini MediaTek telah membuat satu siri pengumuman, termasuk Kompanio Ultra dan Dimensity 9400 yang baru. Produk ini mengisi bahagian perniagaan MediaTek yang lebih tradisional, termasuk cip untuk telefon pintar

Minggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuApr 12, 2025 am 11:51 AM

#1 Google melancarkan Agent2Agent Cerita: Ia Isnin pagi. Sebagai perekrut berkuasa AI, anda bekerja lebih pintar, tidak lebih sukar. Anda log masuk ke papan pemuka syarikat anda di telefon anda. Ia memberitahu anda tiga peranan kritikal telah diperolehi, dijadualkan, dan dijadualkan untuk

AI Generatif Bertemu PsychobabbleApr 12, 2025 am 11:50 AM

Saya akan meneka bahawa anda mesti. Kita semua seolah -olah tahu bahawa psychobabble terdiri daripada pelbagai perbualan yang menggabungkan pelbagai terminologi psikologi dan sering akhirnya menjadi tidak dapat difahami atau sepenuhnya tidak masuk akal. Semua yang anda perlu lakukan untuk memuntahkan fo

Prototaip: saintis menjadikan kertas menjadi plastikApr 12, 2025 am 11:49 AM

Hanya 9.5% plastik yang dihasilkan pada tahun 2022 dibuat daripada bahan kitar semula, menurut satu kajian baru yang diterbitkan minggu ini. Sementara itu, plastik terus menumpuk di tapak pelupusan sampah -dan ekosistem -sekitar dunia. Tetapi bantuan sedang dalam perjalanan. Pasukan Engin

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.