Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill-AI-php.cn

Rumah

Peranti teknologi

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 03, 2023 pm 06:17 PM

industriauthentic image completion

Mendapatkan foto yang tampan menjadi lebih mudah dan mudah.

Semasa melancong semasa cuti, mengambil gambar adalah satu kemestian. Walau bagaimanapun, kebanyakan foto yang diambil di tempat yang indah adalah lebih kurang mengesalkan sama ada terdapat sesuatu tambahan di latar belakang, atau ada sesuatu yang hilang.

Mendapatkan imej yang "sempurna" adalah salah satu matlamat yang telah lama diperjuangkan oleh penyelidik CV. Baru-baru ini, penyelidik dari Google Research dan Cornell University bekerjasama untuk mencadangkan teknologi "Penyelesaian Imej Sahih"—RealFill, model generatif untuk penyiapan imej.

Kelebihan model RealFill ialah ia boleh diperibadikan dengan sebilangan kecil imej rujukan pemandangan yang tidak perlu diselaraskan dengan imej sasaran malah boleh sangat berbeza dari segi sudut pandangan, keadaan pencahayaan, apertur kamera atau gaya imej. Setelah pemperibadian selesai, RealFill boleh melengkapkan imej sasaran dengan kandungan yang menarik secara visual dengan cara yang benar kepada adegan asal.

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

Sila klik pautan berikut untuk melihat kertas kerja: https://arxiv.org/abs/2309.16668
Pautan halaman projek: https://realfill.github.io/

Model pengecatan dan pengecatan adalah teknologi yang boleh menjana kandungan imej yang berkualiti tinggi dan munasabah dalam kawasan imej yang tidak diketahui Walau bagaimanapun, kandungan yang dihasilkan oleh model ini mestilah tidak realistik kerana model ini tidak realistik di sana adalah kekurangan dalam maklumat kontekstual tempat kejadian. Sebaliknya, RealFill menjana kandungan yang "sepatutnya" ada, menjadikan hasil penyiapan imej lebih realistik.

Pengarang menunjukkan dalam kertas bahawa mereka mentakrifkan masalah penyiapan imej baharu - "Penyiapan Imej Sahih". Berbeza daripada pemulihan imej generatif tradisional (kandungan yang menggantikan kawasan yang hilang mungkin tidak konsisten dengan adegan asal), matlamat penyiapan imej sebenar adalah untuk menjadikan kandungan yang telah dilengkapkan setepati mungkin dengan adegan asal, menggunakan kandungan yang "sepatutnya muncul sana". Lengkapkan imej sasaran dengan kandungan yang "mungkin ada di luar sana".

Pengarang menyatakan bahawa RealFill ialah kaedah pertama untuk mengembangkan kuasa ekspresif model pembaikan imej generatif dengan menambahkan lebih banyak syarat (iaitu menambah imej rujukan) pada proses tersebut.

RealFill dengan ketara mengatasi kaedah sedia ada pada penanda aras penyiapan imej baharu yang merangkumi set senario yang pelbagai dan mencabar. Matlamat

kaedah

RealFill adalah untuk menggunakan sebilangan kecil imej rujukan untuk melengkapkan bahagian yang hilang pada imej sasaran yang diberikan sambil mengekalkan ketulenan sebanyak mungkin. Khususnya, anda diberikan sehingga 5 imej rujukan dan imej sasaran yang secara kasarnya menangkap pemandangan yang sama (tetapi mungkin mempunyai reka letak atau rupa yang berbeza).

Untuk adegan tertentu, para penyelidik mula-mula mencipta model generatif yang diperibadikan dengan memperhalusi model resapan lukisan yang telah terlatih pada rujukan dan imej sasaran. Proses penalaan halus ini direka bentuk supaya model yang ditala halus bukan sahaja mengekalkan imej prior yang baik, tetapi juga mempelajari kandungan pemandangan, pencahayaan dan gaya dalam imej input. Model diperhalusi ini kemudiannya digunakan untuk mengisi kawasan yang hilang dalam imej sasaran melalui proses pensampelan resapan standard.

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

Perlu diperhatikan bahawa untuk nilai aplikasi praktikal, model ini memberi perhatian khusus kepada kes yang lebih mencabar dan tidak terhad, iaitu imej sasaran dan imej rujukan mungkin mempunyai sudut pandangan dan persekitaran yang sangat berbeza. keadaan , apertur kamera, gaya imej dan juga objek bergerak.

Hasil eksperimen

Menurut imej rujukan di sebelah kiri, RealFill boleh mengembangkan (menyahcrop) atau membaiki (mengecat) imej sasaran di sebelah kanan, bukan sahaja hasil yang dijana. tetapi juga Selaras dengan imej rujukan walaupun terdapat perbezaan besar antara imej rujukan dan imej sasaran dari segi sudut pandangan, apertur, pencahayaan, gaya imej dan gerakan objek.

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill ^{Kesan keluaran model Isi Sebenar. Memandangkan imej rujukan di sebelah kiri, RealFill boleh mengembangkan imej sasaran yang sepadan di sebelah kanan. Kawasan di dalam kotak putih disediakan kepada rangkaian sebagai piksel yang diketahui, manakala kawasan di luar kotak putih dijana. Hasilnya menunjukkan bahawa RealFill boleh menjana imej berkualiti tinggi yang sesuai dengan imej rujukan walaupun terdapat perbezaan besar antara imej rujukan dan imej sasaran, termasuk sudut pandangan, apertur, pencahayaan, gaya imej dan gerakan objek. Sumber: Kertas}

Eksperimen Terkawal

Para penyelidik membandingkan model RealFill dengan kaedah asas yang lain. Sebagai perbandingan, RealFill menghasilkan hasil berkualiti tinggi dan berprestasi lebih baik dari segi kesetiaan pemandangan dan konsistensi dengan imej rujukan.

Cat-demi-Contoh tidak boleh mencapai tahap kesetiaan pemandangan yang tinggi kerana ia bergantung pada pembenaman CLIP, yang hanya boleh menangkap maklumat semantik peringkat tinggi.

Pengecatan Resapan Stabil boleh menghasilkan hasil yang kelihatan munasabah, tetapi disebabkan kuasa ekspresif yang terhad, hasil akhir yang dihasilkan tidak konsisten dengan imej rujukan.

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

^{Perbandingan RealFill dengan dua kaedah asas yang lain. Kawasan yang diliputi oleh topeng putih lutsinar ialah bahagian imej sasaran yang tidak diubah suai. Sumber: realfill.github.io}

Limitations

Para penyelidik juga membincangkan beberapa potensi masalah dan batasan model RealFill, termasuk kelajuan pemprosesan, keupayaan untuk mengendalikan keperluan perubahan asas dan keperluan Keupayaan model untuk mengendalikan situasi yang mencabar. Khususnya:

RealFill memerlukan proses penalaan halus berasaskan kecerunan pada imej input, yang menjadikannya agak perlahan untuk dijalankan.

Apabila sudut pandangan berubah antara imej rujukan dan imej sasaran adalah sangat besar, RealFill selalunya tidak dapat memulihkan pemandangan 3D, terutamanya apabila terdapat hanya satu imej rujukan.

Memandangkan RealFill bergantung terutamanya pada imej prior yang diwarisi daripada model asas pra-latihan, ia tidak dapat mengendalikan situasi yang mencabar untuk model asas, seperti model resapan stabil yang tidak dapat mengendalikan teks dengan baik.

Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill

Akhirnya, penulis mengucapkan terima kasih kepada rakan usaha sama mereka:

Kami ingin mengucapkan terima kasih kepada Rundi Wu, Qianqian Wang, Viraj Shah, Ethan Weber, Zhengqi Li, Kyle Genova, Boyang Deng, Maya Goldenberg, Noah Snavely Ben Poole, Ben Mildenhall, Alex Rav-Acha, Pratul Srinivasan, Dor Verbin dan Jon Barron untuk perbincangan dan maklum balas yang berharga, dan kami juga berterima kasih kepada Zeya Peng, Rundi Wu dan Shan Nan atas sumbangan mereka kepada set data penilaian. Kami amat berterima kasih kepada Jason Baldridge, Kihyuk Sohn, Kathy Meier-Hellstern dan Nicole Brichtova atas maklum balas dan sokongan mereka terhadap projek itu.

Sila baca kertas asal dan lawati laman utama projek untuk maklumat lanjut

Atas ialah kandungan terperinci Keasliannya mengejutkan! Google dan Cornell University melancarkan teknologi penyiapan imej sebenar RealFill. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:机器之心. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Bahaya Tersembunyi Penggunaan Dalaman AI: Jurang Tadbir Urus dan Risiko BencanaApr 28, 2025 am 11:12 AM

Penyebaran dalaman yang tidak terkawal sistem AI yang canggih menimbulkan risiko yang signifikan, menurut laporan baru dari Apollo Research. Kekurangan pengawasan ini, lazim di kalangan firma AI utama, membolehkan hasil yang berpotensi bencana, mulai dari UNCON

Membina polygraph AIApr 28, 2025 am 11:11 AM

Pengesan kebohongan tradisional sudah lapuk. Bergantung pada penunjuk yang disambungkan oleh gelang tangan, pengesan kebohongan yang mencetak tanda -tanda penting subjek dan tindak balas fizikal tidak tepat dalam mengenal pasti kebohongan. Inilah sebabnya mengapa keputusan pengesanan kebohongan biasanya tidak diterima pakai oleh mahkamah, walaupun ia telah membawa kepada banyak orang yang tidak bersalah yang dipenjara. Sebaliknya, kecerdasan buatan adalah enjin data yang kuat, dan prinsip kerja adalah untuk memerhatikan semua aspek. Ini bermakna saintis boleh menggunakan kecerdasan buatan kepada aplikasi yang mencari kebenaran melalui pelbagai cara. Satu pendekatan adalah untuk menganalisis tindak balas penting orang yang diinterogasi seperti pengesan dusta, tetapi dengan analisis perbandingan yang lebih terperinci dan tepat. Pendekatan lain adalah menggunakan markup linguistik untuk menganalisis apa yang orang katakan dan menggunakan logik dan penalaran. Seperti kata pepatah, satu pembohongan membiak kebohongan yang lain, dan akhirnya

Adakah AI dibersihkan untuk berlepas dalam industri aeroangkasa?Apr 28, 2025 am 11:10 AM

Industri aeroangkasa, perintis inovasi, memanfaatkan AI untuk menangani cabaran yang paling rumit. Kerumitan Peningkatan Penerbangan Moden memerlukan automasi dan keupayaan perisikan masa nyata AI untuk keselamatan yang dipertingkatkan, dikurangkan oper

Menonton Perlumbaan Robot Spring BeijingApr 28, 2025 am 11:09 AM

Perkembangan pesat robotik telah membawa kita kajian kes yang menarik. Robot N2 dari Noetix beratnya lebih dari 40 paun dan tinggi 3 kaki dan dikatakan dapat backflip. Robot G1 Unitree berat kira -kira dua kali saiz N2 dan kira -kira 4 kaki tinggi. Terdapat juga banyak robot humanoid yang lebih kecil yang menyertai pertandingan ini, dan terdapat juga robot yang didorong ke hadapan oleh peminat. Tafsiran data Setengah maraton menarik lebih daripada 12,000 penonton, tetapi hanya 21 robot humanoid yang mengambil bahagian. Walaupun kerajaan menegaskan bahawa robot yang mengambil bahagian menjalankan "latihan intensif" sebelum pertandingan, tidak semua robot menyelesaikan keseluruhan persaingan. Champion - Tiangong Ult Dibangunkan oleh Pusat Inovasi Robot Humanoid Beijing

Perangkap Cermin: Etika AI dan keruntuhan imaginasi manusiaApr 28, 2025 am 11:08 AM

Kecerdasan buatan, dalam bentuknya sekarang, tidak benar -benar pintar; Ia mahir meniru dan menyempurnakan data sedia ada. Kami tidak mewujudkan kecerdasan buatan, tetapi sebaliknya kesimpulan buatan -merapikan yang memproses maklumat, sementara manusia su

New Google Leak mendedahkan kemas kini ciri Google Photos yang bergunaApr 28, 2025 am 11:07 AM

Laporan mendapati bahawa antara muka yang dikemas kini disembunyikan dalam kod untuk Google Photos Android versi 7.26, dan setiap kali anda melihat foto, satu baris lakaran muka yang baru dikesan dipaparkan di bahagian bawah skrin. Thumbnail wajah baru adalah tag nama yang hilang, jadi saya mengesyaki anda perlu mengkliknya secara individu untuk melihat lebih banyak maklumat mengenai setiap orang yang dikesan. Buat masa ini, ciri ini tidak memberikan maklumat selain daripada orang -orang yang ditemui oleh Google Foto dalam imej anda. Ciri ini belum tersedia, jadi kami tidak tahu bagaimana Google akan menggunakannya dengan tepat. Google boleh menggunakan gambar kecil untuk mempercepatkan mencari lebih banyak gambar orang terpilih, atau boleh digunakan untuk tujuan lain, seperti memilih individu untuk mengedit. Mari tunggu dan lihat. Buat masa ini

Panduan untuk Finetuning Pengukuhan - Analytics VidhyaApr 28, 2025 am 09:30 AM

Penguatkuasaan penguatkuasaan telah mengguncang pembangunan AI dengan mengajar model untuk menyesuaikan berdasarkan maklum balas manusia. Ia menggabungkan asas pembelajaran yang diawasi dengan kemas kini berasaskan ganjaran untuk menjadikannya lebih selamat, lebih tepat, dan benar-benar membantu

Let's Dance: Gerakan berstruktur untuk menyempurnakan jaring saraf manusia kitaApr 27, 2025 am 11:09 AM

Para saintis telah mengkaji secara meluas rangkaian saraf manusia dan mudah (seperti yang ada di C. elegans) untuk memahami fungsi mereka. Walau bagaimanapun, soalan penting timbul: Bagaimana kita menyesuaikan rangkaian saraf kita sendiri untuk berfungsi dengan berkesan bersama -sama dengan novel AI s

See all articles