Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat!-AI-php.cn

Rumah

Peranti teknologi

Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat!

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 03, 2024 pm 12:04 PM

datakereta api

0. Apa guna artikel ini?

Cadangan DepthFM: Model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens.

Mari kita baca karya ini bersama-sama~

1. Maklumat kertas

Tajuk: DepthFM: Anggaran Kedalaman Monokular Pantas dengan Padanan Aliran

Pengarang: Ming Gui, Johannes S. Fischering, P. Olga Grebenkova, Stefan Andreas Baumann, Vincent Tao Hu, Björn Ommer

Institusi: MCML

Pautan asal: https://arxiv.org/abs/2403.13788

Pautan kod: https://github.com/ CompVis -fm

Laman utama rasmi: https://depthfm.github.io/

2 Abstrak

adalah penting untuk banyak tugas dan aplikasi persiaran hiliran. Kaedah diskriminatif semasa untuk masalah ini dihadkan oleh artifak kabur, manakala kaedah generatif tercanggih mengalami kelajuan sampel latihan yang perlahan kerana sifat SDE mereka. Daripada bermula dengan hingar, kami mencari pemetaan terus daripada imej input kepada imej kedalaman. Kami melihat bahawa ini boleh dibina dengan cekap melalui pemadanan aliran, kerana trajektori lurusnya dalam ruang penyelesaian memberikan kecekapan dan kualiti yang tinggi. Kajian kami menunjukkan bahawa model resapan imej yang telah terlatih boleh digunakan sebagai pengetahuan sedia ada yang mencukupi untuk model padanan aliran yang mendalam. Pada penanda aras pemandangan semula jadi yang kompleks, pendekatan ringan kami menunjukkan prestasi tercanggih pada kos pengiraan yang sangat rendah walaupun dilatih hanya pada sejumlah kecil data sintetik.

3. Demonstrasi kesan

DepthFM ialah model pemadanan aliran inferens pantas dengan keupayaan generalisasi tangkapan sifar yang kuat, yang boleh menggunakan pengetahuan sedia ada yang kukuh dan mudah digeneralisasikan kepada imej sebenar yang tidak diketahui. Selepas latihan mengenai data sintetik, model ini membuat generalisasi dengan baik kepada imej sebenar yang tidak diketahui dan memadankan imej kedalaman dengan tepat.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Berbanding model tercanggih yang lain, DepthFM memperoleh imej yang lebih jelas dengan hanya satu penilaian fungsi. Anggaran kedalaman Marigold mengambil masa dua kali lebih lama daripada DethFM, tetapi ia tidak dapat menjana peta kedalaman dengan butiran yang sama.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

4. Sumbangan utama

(1) Cadangan DepthFM, model anggaran kedalaman monokular yang tercanggih, serba boleh dan pantas. Selain tugasan anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugasan hiliran seperti pengecatan dalam kedalaman dan sintesis imej berhawa dingin.

(2) menunjukkan kejayaan pemindahan imej terdahulu yang kukuh daripada model penyebaran kepada model padanan aliran dengan sedikit pergantungan pada data latihan dan tidak memerlukan imej dunia sebenar.

(3) menunjukkan bahawa model pemadanan aliran adalah cekap dan boleh mensintesis peta kedalaman dalam satu langkah inferens.

(4) Walaupun dilatih hanya pada data sintetik, DepthFM berprestasi baik pada set data penanda aras dan imej semula jadi.

(5) Gunakan kehilangan normal permukaan sebagai sasaran tambahan untuk mendapatkan anggaran kedalaman yang lebih tepat.

(6) Selain anggaran kedalaman, keyakinan ramalannya juga boleh diramalkan dengan pasti.

5. Apakah prinsip khusus?

Saluran Paip Latihan. Latihan dihadkan oleh pemadanan aliran dan kehilangan normal permukaan: untuk pemadanan aliran, pemadanan aliran bergantung data digunakan untuk mengundur medan vektor antara kedalaman kebenaran tanah dan imej yang sepadan. Selain itu, realisme geometri dicapai melalui kehilangan normal permukaan.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Padanan aliran berkaitan data: DepthFM mengundur medan vektor garis lurus antara taburan imej dan taburan kedalaman dengan menggunakan pasangan imej ke kedalaman. Pendekatan ini menggalakkan penaakulan beberapa langkah yang cekap tanpa mengorbankan prestasi.

Penalaan halus daripada Diffusion Priors: Pengarang menunjukkan kejayaan pemindahan prior imej yang berkuasa daripada model resapan sintesis imej asas (Stable Diffusion v2-1) kepada model padanan aliran dengan sedikit pergantungan pada data latihan dan tidak memerlukan penggunaan sebenar -Imej dunia.

Kehilangan normal permukaan tambahan: Memandangkan DepthFM hanya dilatih pada data sintetik, dan kebanyakan set data sintetik menyediakan normal permukaan kebenaran tanah, kehilangan normal permukaan digunakan sebagai sasaran tambahan untuk meningkatkan ketepatan anggaran kedalaman DepthFM.

6. Keputusan percubaan

DepthFM menunjukkan keupayaan generalisasi yang ketara dengan melatih hanya 63k sampel sintetik semata-mata, dan mampu membuat anggaran kedalaman sifar tangkapan pada set data dalaman dan luaran. Jadual 1 secara kualitatif menunjukkan perbandingan prestasi DepthFM dengan model sepadan yang terkini. Walaupun model lain sering bergantung pada set data yang besar untuk latihan, DepthFM memanfaatkan pengetahuan yang kaya yang wujud dalam model berasaskan resapan asas. Kaedah ini bukan sahaja menjimatkan sumber pengkomputeran, tetapi juga menekankan kebolehsuaian dan kecekapan latihan model.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Perbandingan anggaran kedalaman Marigold berasaskan resapan, penanda aras Padanan Aliran (FM) dan model DepthFM. Setiap kaedah dinilai menggunakan hanya satu ahli ensemble dan dengan bilangan penilaian fungsi (NFE) yang berbeza-beza pada dua set data penanda aras biasa. Berbanding dengan garis dasar FM, DepthFM menyepadukan kehilangan normal dan gandingan bergantung kepada data semasa latihan.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Hasil kualitatif untuk model Marigold dan DepthFM dalam bilangan penilaian fungsi yang berbeza. Perlu diingat bahawa Marigold tidak memberikan sebarang hasil yang bermakna melalui inferens satu langkah, manakala keputusan DepthFM sudah menunjukkan peta kedalaman sebenar.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Penyelesaian mendalam pada Hypersim. Kiri: Memberi sedikit kedalaman. Sederhana: Kedalaman dianggarkan daripada kedalaman separa yang diberikan. Kanan: Kedalaman sebenar.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

7. Ringkasan

DepthFM, kaedah pemadanan aliran untuk anggaran kedalaman monokular. Dengan mempelajari pemetaan langsung antara imej input dan kedalaman, dan bukannya menafikan taburan normal ke dalam peta kedalaman, pendekatan ini jauh lebih cekap daripada penyelesaian berasaskan resapan semasa sambil masih menyediakan peta kedalaman yang terperinci tanpa artifak biasa paradigma diskriminatif . DepthFM menggunakan model resapan imej yang telah terlatih sebagai model sebelumnya, dengan berkesan memindahkannya ke model padanan aliran dalam. Oleh itu, DepthFM hanya dilatih pada data sintetik tetapi masih digeneralisasikan dengan baik kepada imej semula jadi semasa inferens. Selain itu, kehilangan normal permukaan tambahan telah ditunjukkan untuk meningkatkan anggaran kedalaman. Pendekatan ringan DepthFM adalah kompetitif, pantas dan memberikan anggaran keyakinan yang boleh dipercayai.

Pembaca yang berminat dengan lebih banyak keputusan eksperimen dan butiran artikel boleh membaca kertas asal

Atas ialah kandungan terperinci Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

LLM sumber terbuka yang baik menggunakan Lamini-Analytics VidhyaApr 12, 2025 am 10:20 AM

Baru -baru ini, dengan peningkatan model bahasa yang besar dan AI, kami telah melihat kemajuan yang tidak terhitung dalam pemprosesan bahasa semulajadi. Model dalam domain seperti teks, kod, dan generasi imej/video telah mengarkibkan penalaran seperti manusia dan p

Pengesanan jantina dengan OpenCV dan Roboflow di Python - Analytics VidhyaApr 12, 2025 am 10:19 AM

Pengenalan Pengesanan jantina dari imej muka adalah salah satu daripada banyak aplikasi menarik penglihatan komputer. Dalam projek ini, kami menggabungkan OpenCV untuk menghadapi lokasi dan API Roboflow untuk klasifikasi jantina, menjadikan

Apakah peranan AI generatif dalam memperibadikan kandungan iklan?Apr 12, 2025 am 10:18 AM

Pengenalan Dunia iklan telah berada di bawah evolusi sejak konsep sistem barter. Pengiklan telah menemui cara kreatif untuk membawa produk mereka ke perhatian kami. Pada zaman sekarang, pengguna mengharapkan Br

Openai ' s O1-Preview vs O1-Mini: Langkah ke hadapan ke AGIApr 12, 2025 am 10:04 AM

Pengenalan Pada 12 September, OpenAI mengeluarkan kemas kini bertajuk "Pembelajaran untuk Alasan dengan LLMS." Mereka memperkenalkan model O1, yang dilatih menggunakan pembelajaran tetulang untuk menangani tugas -tugas pemikiran yang kompleks. Apa yang menetapkan mod ini

Bagaimana untuk membina permainan dengan Openai O1? - Analytics VidhyaApr 12, 2025 am 10:03 AM

Pengenalan Keluarga model Openai O1 secara signifikan memajukan kuasa penalaran dan prestasi ekonomi, terutamanya dalam sains, pengekodan, dan penyelesaian masalah. Matlamat Openai adalah untuk mencipta AI yang lebih maju, dan model O1

Alat ejen LLM yang popular untuk pengurusan pertanyaan pelangganApr 12, 2025 am 10:01 AM

Pengenalan Hari ini, dunia pengurusan pertanyaan pelanggan bergerak pada kadar yang tidak pernah berlaku sebelum ini, dengan alat -alat baru membuat tajuk utama setiap hari. Ejen Model Bahasa Besar (LLM) adalah inovasi terkini dalam konteks ini, meningkatkan CU

Pelan Pelaksanaan AI Generatif 100 Hari untuk PerusahaanApr 12, 2025 am 09:56 AM

Pengenalan Mengguna pakai AI generatif boleh menjadi perjalanan transformatif untuk mana -mana syarikat. Walau bagaimanapun, proses pelaksanaan GueLy sering boleh menjadi rumit dan mengelirukan. Rajendra Singh Pawar, Pengerusi dan Pengasas Bersama Niit Lim

Pixtral 12b vs qwen2-vl-72bApr 12, 2025 am 09:52 AM

Pengenalan Revolusi AI telah menimbulkan era kreativiti baru, di mana model teks-ke-imej telah mentakrifkan semula persimpangan seni, reka bentuk, dan teknologi. Pixtral 12b dan qwen2-vl-72b adalah dua pasukan perintis drivin

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7467

Tutorial CakePHP

1376

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi