Rumah > Artikel > Peranti teknologi > Kecekapan meningkat sebanyak 16 kali ganda! VRSO: Anotasi 3D objek statik visual semata-mata, membuka gelung tertutup data!
Pengesanan Objek Statik (SOD), termasuk lampu isyarat, tanda panduan dan kon trafik, kebanyakan algoritma adalah rangkaian neural dalam dipacu data dan memerlukan sejumlah besar data latihan. Amalan semasa biasanya melibatkan anotasi manual bagi sejumlah besar sampel latihan pada data awan titik yang diimbas LiDAR untuk membetulkan kes ekor panjang.
Anotasi manual sukar untuk menangkap kebolehubahan dan kerumitan adegan sebenar, dan selalunya gagal mengambil kira oklusi, keadaan pencahayaan yang berbeza dan sudut tontonan yang pelbagai (anak panah kuning dalam Rajah 1). Keseluruhan proses mempunyai pautan yang panjang, sangat memakan masa, mudah ralat, dan mahal (Rajah 2). Jadi pada masa ini syarikat sedang mencari penyelesaian pelabelan automatik, terutamanya berdasarkan penglihatan tulen Lagipun, tidak setiap kereta mempunyai lidar. . ialah 2.6 piksel, kira-kira satu perempat daripada anotasi Waymo (10.6 piksel)
Berbanding dengan anotasi manual, kelajuan meningkat kira-kira 16 kali ganda Untuk objek statik, VRSO mengekstrak perkara utama melalui pembahagian contoh dan kontur untuk menyelesaikan Cabaran menyepadukan dan menyahduplikasi objek statik dari sudut pandangan yang berbeza, serta kesukaran pemerhatian yang tidak mencukupi disebabkan oleh isu oklusi, meningkatkan ketepatan anotasi.Daripada Rajah 1, berbanding dengan hasil anotasi manual set data Terbuka Waymo, VRSO menunjukkan keteguhan dan ketepatan geometri yang lebih tinggi.
Penyelesaian masalah
Sistem VRSO terbahagi terutamanya kepada dua bahagian:Pembinaan semula adegan dan Anotasi objek statik
.Bahagian pembinaan semula bukan fokus, ia berdasarkan algoritma SFM untuk memulihkan pose imej dan titik utama 3D yang jarang. Algoritma pelabelan objek statik, digabungkan dengan kod pseudo, proses umum adalah (perkara berikut akan diperincikan langkah demi langkah):
Menggunakan algoritma pengesanan dan segmentasi objek 2D siap sedia untuk menjana calonMenggunakan 3D-2D surat-menyurat titik penting dalam model SFM Perhubungan untuk menjejak kejadian 2D merentas bingkai
Memperkenalkan konsistensi unjuran semula untuk mengoptimumkan parameter anotasi 3D objek statik
langkah 3: Tentukan tika yang sepadan bagi titik 3D pada peta 2D semasa berdasarkan koordinat peta 2D dan titik sudut pembahagian contoh.
langkah 4: Tentukan korespondensi antara pemerhatian 2D dan kotak sempadan 3D untuk setiap imej 2D.Dapatkan nilai bucu awal objek statik di bawah keadaan 3D melalui triangulasi.
Dengan menyemak bilangan titik kunci dalam kotak sempadan 3D yang diperolehi oleh SFM dan segmentasi tika semasa pembinaan semula pemandangan, hanya kejadian dengan bilangan titik kunci melebihi ambang dianggap pemerhatian yang stabil dan sah. Untuk keadaan ini, kotak sempadan 2D yang sepadan dianggap sebagai pemerhatian yang sah. Melalui pemerhatian 2D ke atas berbilang imej, bucu kotak sempadan 2D ditriangulasi untuk mendapatkan koordinat kotak sempadan.
Untuk tanda bulat yang tidak membezakan bucu "kiri bawah, kiri atas, kanan atas, kanan atas, dan kanan bawah" pada topeng, tanda bulat ini perlu dikenal pasti. Hasil pengesanan 2D digunakan sebagai pemerhatian objek bulat, dan topeng segmentasi contoh 2D digunakan untuk pengekstrakan kontur. Titik tengah dan jejari dikira melalui algoritma pemadanan kuasa dua terkecil. Parameter tanda bulat termasuk titik tengah (,,), arah (θ) dan jejari ().
Padanan titik ciri penjejakan berdasarkan SFM. Tentukan sama ada hendak menggabungkan kejadian berasingan ini berdasarkan jarak Euclidean bucu kotak sempadan 3D dan unjuran kotak sempadan 2D IoU. Setelah penggabungan selesai, titik ciri 3D dalam contoh boleh dikelompokkan untuk mengaitkan lebih banyak titik ciri 2D. Perkaitan 2D-3D berulang dilakukan sehingga tiada titik ciri 2D boleh ditambah.
Mengambil tanda segi empat tepat sebagai contoh, parameter yang boleh dioptimumkan termasuk kedudukan (,,), arah (θ) dan saiz (,), dengan jumlah enam darjah kebebasan. Langkah utama termasuk:
Terdapat juga dalam beberapa kes yang sangat ringan dan berpanjangan.
Rangka kerja VRSO mencapai ketepatan tinggi dan anotasi 3D objek statik yang konsisten, menyepadukan pengesanan, segmentasi dan algoritma SFM dengan ketat, menghapuskan campur tangan manual dalam pemacuan pintar berasaskan LiDAR, Keputusan dan menyediakan anotasi boleh kompaun berasaskan LiDAR kepada anotasi manual. Penilaian kualitatif dan kuantitatif telah dijalankan dengan Set Data Terbuka Waymo yang diiktiraf secara meluas: berbanding dengan anotasi manual, kelajuan meningkat kira-kira 16 kali ganda, sambil mengekalkan ketekalan dan ketepatan yang terbaik.
Atas ialah kandungan terperinci Kecekapan meningkat sebanyak 16 kali ganda! VRSO: Anotasi 3D objek statik visual semata-mata, membuka gelung tertutup data!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!