cari
RumahPeranti teknologiAIJauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Regress ke ketinggian tanah untuk mencapai rumusan jarak-agnostik, sekali gus memudahkan proses pengoptimuman untuk kaedah hanya menyedari kamera. Pada penanda aras pengesanan 3D bagi kamera tepi jalan, kaedah ini jauh melebihi semua kaedah bertumpu penglihatan sebelumnya. Ia menghasilkan peningkatan ketara sebanyak +1.9% NDS dan +1.1% mAP berbanding BEVDepth. Pada set ujian nuScenes, kaedah tersebut mencapai kemajuan yang ketara, dengan NDS dan mAP meningkat masing-masing sebanyak +2.8% dan +1.7%.

Tajuk: BEVHeight++: Ke arah pengesanan objek 3D berpusat penglihatan yang teguh

Pautan kertas: https://arxiv.org/pdf/2309.16179.pdf

Gabungan pengarang: Universiti Tsinghua, Universiti Sun Yat-sen, Universiti Beijing Universiti

Dari komuniti pemanduan autonomi pertama di China: akhirnya menyiapkan pembinaan 20+ laluan pembelajaran arah teknikal (persepsi BEV/pengesan 3D/gabungan berbilang sensor/SLAM dan perancangan, dsb.)

Walaupun autonomi baru-baru ini sistem pemanduan memfokuskan pada Membangunkan kaedah penderiaan untuk penderia kenderaan, tetapi alternatif yang sering diabaikan ialah penggunaan kamera tepi jalan pintar untuk memanjangkan keupayaan penderiaan melangkaui julat visual. Pengarang mendapati bahawa kaedah pengesanan BEV tertumpu penglihatan tercanggih berprestasi buruk pada kamera tepi jalan. Ini kerana kaedah ini tertumpu terutamanya pada memulihkan kedalaman mengenai pusat kamera, di mana perbezaan kedalaman antara kereta dan tanah mengecut dengan cepat mengikut jarak. Dalam kertas kerja ini, penulis mencadangkan kaedah yang mudah tetapi berkesan, dipanggil BEVHeight++, untuk menyelesaikan masalah ini. Pada asasnya, pengarang mundur ke ketinggian tanah untuk mencapai rumusan jarak-agnostik, dengan itu memudahkan proses pengoptimuman untuk kaedah sedar kamera sahaja. Dengan menggabungkan teknik pengekodan ketinggian dan kedalaman, unjuran yang lebih tepat dan mantap daripada ruang 2D ke BEV dicapai. Kaedah ini dengan ketara mengatasi semua kaedah bertumpu penglihatan sebelumnya pada penanda aras pengesanan 3D yang popular untuk kamera tepi jalan. Untuk adegan kenderaan sendiri, BEVHeight++ mengatasi kaedah kedalaman sahaja

Secara khusus, ia menghasilkan peningkatan ketara sebanyak +1.9% NDS dan +1.1% mAP berbanding BEVDepth apabila dinilai pada set pengesahan nuScenes . Tambahan pula, pada set ujian nuScenes, kaedah ini mencapai kemajuan yang ketara, dengan NDS dan mAP meningkat masing-masing sebanyak +2.8% dan +1.7%.

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Rajah 1: (a) Untuk menjana kotak sempadan 3D daripada imej monokular, kaedah tercanggih terlebih dahulu meramalkan kedalaman setiap piksel, sama ada secara eksplisit atau tersirat, untuk menentukan kedudukan 3D objek latar depan berbanding latar belakang. Walau bagaimanapun, apabila kami memplot kedalaman setiap piksel pada imej, kami mendapati bahawa apabila kereta bergerak menjauhi kamera, perbezaan antara titik di atas bumbung dan tanah di sekeliling mengecut dengan cepat, menjadikan pengoptimuman menjadi tidak optimum, terutamanya untuk Jarak Jauh. objek. (b) Sebaliknya, kami memplot ketinggian per-piksel ke tanah dan memerhatikan bahawa perbezaan ini adalah agnostik tanpa mengira jarak dan secara visual lebih sesuai untuk rangkaian mengesan objek. Walau bagaimanapun, kedudukan 3D tidak boleh diregres secara langsung dengan meramalkan ketinggian sahaja. (c) Untuk tujuan ini, kami mencadangkan rangka kerja baharu BEVHeight++ untuk menyelesaikan masalah ini. Keputusan empirikal menunjukkan bahawa kaedah kami mengatasi kaedah terbaik sebanyak 5.49% pada tetapan bersih dan 28.2% pada tetapan bising.

Struktur rangkaian

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Perbandingan ketinggian dan kedalaman ramalan. (a) Gambaran keseluruhan kaedah berasaskan kedalaman sebelumnya dan saluran paip berasaskan ketinggian kami yang dicadangkan. Sila ambil perhatian bahawa kertas ini mencadangkan modul unjuran 2D hingga 3D novel. (b) Memplot histogram kedalaman setiap piksel (atas) dan ketinggian tanah (bawah), dapat diperhatikan dengan jelas bahawa julat kedalaman melebihi 200 meter, manakala ketinggian dalam lingkungan 5 meter, yang menjadikan ketinggian lebih mudah dipelajari.

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Dalam imej, terdapat perkaitan antara koordinat baris sasaran dengan kedalaman dan ketinggiannya. Kedudukan sasaran dalam imej boleh ditakrifkan oleh (u, v), di mana v mewakili koordinat baris imej. Dalam (a) kami menunjukkan contoh visual memperkenalkan hingar dengan menambahkan offset putaran dalam arah guling dan pic kepada taburan normal. Dalam (b) kami menunjukkan plot taburan taburan kedalaman. Dalam (c) kami menunjukkan ketinggian di atas tanah. Kita boleh perhatikan bahawa tetapan hingar untuk ketinggian mempunyai pertindihan yang lebih besar dengan taburan asalnya berbanding dengan kedalaman, menunjukkan bahawa anggaran ketinggian adalah lebih mantap

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Kerangka keseluruhan BEVHeight++ mengandungi tiga sub-rangkaian, iaitu cawangan berasaskan kedalaman (cyan), cawangan berasaskan ketinggian (hijau) dan proses gabungan ciri (kelabu). Saluran paip berasaskan kedalaman menukar ciri paparan imej kepada ciri BEV berasaskan kedalaman (BEV berasaskan D) menggunakan anggaran kedalaman setiap piksel. Saluran paip berasaskan ketinggian menjana ciri BEV berasaskan ketinggian (BEV berasaskan H) menggunakan ramalan ketinggian tanah bagi ciri lif dalam paparan imej. Gabungan ciri termasuk gabungan imej dan gabungan pandangan mata burung. Gabungan paparan imej memperoleh ciri gabungan dengan pengedaran ketinggian melata dan ciri imej, yang digunakan untuk operasi naik taraf seterusnya. Gabungan pandangan mata burung memperoleh ciri BEV bercantum daripada ciri BEV berasaskan ketinggian dan ciri BEV berasaskan kedalaman melalui perhatian silang boleh ubah bentuk, dan kemudian menggunakannya sebagai input kepala pengesan

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Hasil eksperimen

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!

Kandungan yang perlu ditulis semula ialah: Pautan asal: https://mp.weixin.qq.com/s/AdCXYzHIy2lTfAHk2AZ

Atas ialah kandungan terperinci Jauh di hadapan! BEVHeight++: Penyelesaian baharu untuk pengesanan sasaran visual 3D tepi jalan!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Bahaya Tersembunyi Penggunaan Dalaman AI: Jurang Tadbir Urus dan Risiko BencanaBahaya Tersembunyi Penggunaan Dalaman AI: Jurang Tadbir Urus dan Risiko BencanaApr 28, 2025 am 11:12 AM

Penyebaran dalaman yang tidak terkawal sistem AI yang canggih menimbulkan risiko yang signifikan, menurut laporan baru dari Apollo Research. Kekurangan pengawasan ini, lazim di kalangan firma AI utama, membolehkan hasil yang berpotensi bencana, mulai dari UNCON

Membina polygraph AIMembina polygraph AIApr 28, 2025 am 11:11 AM

Pengesan kebohongan tradisional sudah lapuk. Bergantung pada penunjuk yang disambungkan oleh gelang tangan, pengesan kebohongan yang mencetak tanda -tanda penting subjek dan tindak balas fizikal tidak tepat dalam mengenal pasti kebohongan. Inilah sebabnya mengapa keputusan pengesanan kebohongan biasanya tidak diterima pakai oleh mahkamah, walaupun ia telah membawa kepada banyak orang yang tidak bersalah yang dipenjara. Sebaliknya, kecerdasan buatan adalah enjin data yang kuat, dan prinsip kerja adalah untuk memerhatikan semua aspek. Ini bermakna saintis boleh menggunakan kecerdasan buatan kepada aplikasi yang mencari kebenaran melalui pelbagai cara. Satu pendekatan adalah untuk menganalisis tindak balas penting orang yang diinterogasi seperti pengesan dusta, tetapi dengan analisis perbandingan yang lebih terperinci dan tepat. Pendekatan lain adalah menggunakan markup linguistik untuk menganalisis apa yang orang katakan dan menggunakan logik dan penalaran. Seperti kata pepatah, satu pembohongan membiak kebohongan yang lain, dan akhirnya

Adakah AI dibersihkan untuk berlepas dalam industri aeroangkasa?Adakah AI dibersihkan untuk berlepas dalam industri aeroangkasa?Apr 28, 2025 am 11:10 AM

Industri aeroangkasa, perintis inovasi, memanfaatkan AI untuk menangani cabaran yang paling rumit. Kerumitan Peningkatan Penerbangan Moden memerlukan automasi dan keupayaan perisikan masa nyata AI untuk keselamatan yang dipertingkatkan, dikurangkan oper

Menonton Perlumbaan Robot Spring BeijingMenonton Perlumbaan Robot Spring BeijingApr 28, 2025 am 11:09 AM

Perkembangan pesat robotik telah membawa kita kajian kes yang menarik. Robot N2 dari Noetix beratnya lebih dari 40 paun dan tinggi 3 kaki dan dikatakan dapat backflip. Robot G1 Unitree berat kira -kira dua kali saiz N2 dan kira -kira 4 kaki tinggi. Terdapat juga banyak robot humanoid yang lebih kecil yang menyertai pertandingan ini, dan terdapat juga robot yang didorong ke hadapan oleh peminat. Tafsiran data Setengah maraton menarik lebih daripada 12,000 penonton, tetapi hanya 21 robot humanoid yang mengambil bahagian. Walaupun kerajaan menegaskan bahawa robot yang mengambil bahagian menjalankan "latihan intensif" sebelum pertandingan, tidak semua robot menyelesaikan keseluruhan persaingan. Champion - Tiangong Ult Dibangunkan oleh Pusat Inovasi Robot Humanoid Beijing

Perangkap Cermin: Etika AI dan keruntuhan imaginasi manusiaPerangkap Cermin: Etika AI dan keruntuhan imaginasi manusiaApr 28, 2025 am 11:08 AM

Kecerdasan buatan, dalam bentuknya sekarang, tidak benar -benar pintar; Ia mahir meniru dan menyempurnakan data sedia ada. Kami tidak mewujudkan kecerdasan buatan, tetapi sebaliknya kesimpulan buatan -merapikan yang memproses maklumat, sementara manusia su

New Google Leak mendedahkan kemas kini ciri Google Photos yang bergunaNew Google Leak mendedahkan kemas kini ciri Google Photos yang bergunaApr 28, 2025 am 11:07 AM

Laporan mendapati bahawa antara muka yang dikemas kini disembunyikan dalam kod untuk Google Photos Android versi 7.26, dan setiap kali anda melihat foto, satu baris lakaran muka yang baru dikesan dipaparkan di bahagian bawah skrin. Thumbnail wajah baru adalah tag nama yang hilang, jadi saya mengesyaki anda perlu mengkliknya secara individu untuk melihat lebih banyak maklumat mengenai setiap orang yang dikesan. Buat masa ini, ciri ini tidak memberikan maklumat selain daripada orang -orang yang ditemui oleh Google Foto dalam imej anda. Ciri ini belum tersedia, jadi kami tidak tahu bagaimana Google akan menggunakannya dengan tepat. Google boleh menggunakan gambar kecil untuk mempercepatkan mencari lebih banyak gambar orang terpilih, atau boleh digunakan untuk tujuan lain, seperti memilih individu untuk mengedit. Mari tunggu dan lihat. Buat masa ini

Panduan untuk Finetuning Pengukuhan - Analytics VidhyaPanduan untuk Finetuning Pengukuhan - Analytics VidhyaApr 28, 2025 am 09:30 AM

Penguatkuasaan penguatkuasaan telah mengguncang pembangunan AI dengan mengajar model untuk menyesuaikan berdasarkan maklum balas manusia. Ia menggabungkan asas pembelajaran yang diawasi dengan kemas kini berasaskan ganjaran untuk menjadikannya lebih selamat, lebih tepat, dan benar-benar membantu

Let's Dance: Gerakan berstruktur untuk menyempurnakan jaring saraf manusia kitaLet's Dance: Gerakan berstruktur untuk menyempurnakan jaring saraf manusia kitaApr 27, 2025 am 11:09 AM

Para saintis telah mengkaji secara meluas rangkaian saraf manusia dan mudah (seperti yang ada di C. elegans) untuk memahami fungsi mereka. Walau bagaimanapun, soalan penting timbul: Bagaimana kita menyesuaikan rangkaian saraf kita sendiri untuk berfungsi dengan berkesan bersama -sama dengan novel AI s

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

SublimeText3 versi Inggeris

SublimeText3 versi Inggeris

Disyorkan: Versi Win, menyokong gesaan kod!

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.