Rumah >Peranti teknologi >AI >Pembunuh pengeluaran besar-besaran! P-Mapnet: Menggunakan peta SDMap berketepatan rendah sebelum ini, prestasi pemetaan dipertingkatkan dengan hampir 20 mata!
Salah satu algoritma yang digunakan oleh sistem pemanduan autonomi semasa untuk menghilangkan pergantungannya pada peta berketepatan tinggi adalah untuk mengambil kesempatan daripada fakta bahawa prestasi persepsi dalam julat jarak jauh masih lemah. Untuk tujuan ini, kami mencadangkan P-MapNet, di mana "P" memfokuskan pada menggabungkan peta sebelum untuk meningkatkan prestasi model. Khususnya, kami mengeksploitasi maklumat terdahulu dalam SDMap dan HDMap: di satu pihak, kami mengekstrak data SDMap yang sejajar dengan lemah daripada OpenStreetMap dan mengekodkannya ke dalam istilah bebas untuk menyokong input. Terdapat masalah penjajaran yang lemah antara input yang diubah suai dengan ketat dan HD+Map sebenar Struktur kami berdasarkan mekanisme Cross-attention boleh memfokus secara adaptif pada rangka SDMap dan membawa peningkatan prestasi yang ketara, sebaliknya, kami mencadangkan kaedah yang digunakan MAE Untuk menangkap modul halus pengedaran terdahulu HDMap, modul ini membantu menjana pengedaran yang lebih konsisten dengan peta sebenar dan membantu mengurangkan kesan oklusi, artifak, dsb. Kami menjalankan pengesahan percubaan yang meluas pada set data nuScenes dan Argoverse2. .
(2) HDMap kami sebelum ini boleh meningkatkan indeks kesedaran peta sehingga 6.34%.
(3) P-MapNet boleh bertukar kepada mod inferens yang berbeza untuk menukar ketepatan dan kecekapan. P-MapNet ialah penyelesaian penjanaan HD+Map jarak jauh, yang boleh membawa peningkatan yang lebih besar kepada julat penderiaan yang lebih jauh. Kod dan model kami telah dikeluarkan secara terbuka di https://jike5.github.io/P-MapNet/.Semakan kerja berkaitan
(1)Penjanaan peta dalam talian
Persepsi peta jarak jauh
Untuk menjadikan hasil yang dijana oleh peta dalam talian lebih baik digunakan oleh modul hiliran, beberapa kajian cuba mengembangkan lagi skop persepsi peta. SuperFusion[7] mencapai ramalan jarak jauh 90m ke hadapan dengan menggabungkan lidar dan kamera serta menggunakan transformasi BEV yang sedar mendalam. NeuralMapPrior[8] meningkatkan kualiti pemerhatian dalam talian semasa dan meluaskan skop persepsi dengan mengekalkan dan mengemas kini peta neural global. [6] memperoleh ciri BEV dengan mengagregatkan imej satelit dan data penderia kenderaan, dan seterusnya meramalkannya. MV-Map memfokuskan pada penjanaan peta jarak jauh luar talian Kaedah ini mengoptimumkan ciri BEV dengan mengagregatkan semua ciri bingkai yang berkaitan dan menggunakan medan sinaran saraf.Tinjauan keseluruhan P-MapNet
Rangka kerja keseluruhan ditunjukkan dalam Rajah 2.Input sistem ialah awan titik:
, kamera sekeliling:, denganialah bilangan kamera sekeliling. Tugas penjanaan HDMap biasa (seperti HDMapNet) boleh ditakrifkan sebagai: di mana mewakili pengekstrakan ciri, mewakili kepala segmentasi dan
ialah hasil ramalan HDMap.P-MapNet yang kami cadangkan menggabungkan Peta SD dan Peta HD sebelumnya. modul. Modul mempelajari pengedaran Peta HD sebelum melalui pra-latihan. Begitu juga, apabila hanya menggunakan SDMap sebelumnya, kami mendapat tetapan sahaja:
Output: Untuk tugas penjanaan peta, biasanya terdapat dua perwakilan peta: rasterisasi dan vektor. Dalam penyelidikan artikel ini, memandangkan dua modul a priori yang direka dalam artikel ini lebih sesuai untuk output raster, kami memberi tumpuan terutamanya pada perwakilan raster.
3.1 Modul Sebelum SDMap Penjanaan data SDMap Artikel ini menjalankan penyelidikan berdasarkan set data nuScenes dan Argoverse2, menggunakan data OpenStreetMap untuk menjana data SD Map dan melaksanakan kawasan set data yang sepadan di atas. transformasi sistem melalui GPS kenderaan Untuk mendapatkan Peta SD kawasan yang sepadan.
Pertanyaan BEV
Seperti yang ditunjukkan dalam Rajah 2, kami mula-mula melakukan pengekstrakan ciri dan penukaran perspektif pada data imej dan pengekstrakan ciri pada awan titik untuk mendapatkan ciri BEV. Kemudian ciri BEV diturunkan sampel melalui rangkaian konvolusi untuk mendapatkan ciri BEV baharu:, dan peta ciri diratakan untuk mendapatkan Pertanyaan BEV.
Peta SD gabungan sebelumnya
Untuk data Peta SD, selepas pengekstrakan ciri melalui rangkaian konvolusi, ciri yang diperolehi Mekanisme perhatian silang dengan Pertanyaan BEV:
BEV diperoleh selepas mekanisme perhatian silang Ciri-ciri diluluskan kepala pembahagian untuk mendapatkan ramalan awal elemen peta.
secara langsung menggunakan Peta HD raster sebagai input MAE asal akan dilatih melalui MSE Loss, yang menjadikannya tidak boleh digunakan sebagai modul penghalusan. Jadi dalam artikel ini, kami menggantikan output MAE dengan kepala segmentasi kami. Untuk menjadikan elemen peta yang diramalkan mempunyai kesinambungan dan ketulenan (lebih dekat dengan pengedaran Peta HD sebenar), kami menggunakan modul MAE yang telah terlatih untuk diperhalusi. Latihan modul ini terdiri daripada dua langkah: langkah pertama ialah menggunakan pembelajaran penyeliaan kendiri untuk melatih modul MAE untuk mempelajari pengedaran Peta HD, dan langkah kedua ialah memperhalusi semua modul rangkaian dengan menggunakan pemberat yang diperolehi. dalam langkah pertama sebagai pemberat awal.
Dalam langkah pertama pra-latihan, Peta HD sebenar yang diperoleh daripada set data bertopeng secara rawak dan digunakan sebagai input rangkaian , dan matlamat latihan adalah untuk melengkapkan Peta HD:
Dalam yang kedua langkah memperhalusi, Berat yang telah dilatih dalam langkah pertama digunakan sebagai pemberat awal Rangkaian lengkap ialah:
4.2 Keputusan Perbandingan dengan keputusan SOTA: Kami membandingkan hasil penjanaan peta kaedah yang dicadangkan dan kaedah SOTA semasa pada jarak dekat (60m × 30m) dan jarak jauh (90m × 30m). Seperti yang ditunjukkan dalam Jadual II, kaedah kami menunjukkan prestasi unggul berbanding kaedah penglihatan sahaja dan pelbagai mod (RGB+LiDAR) sedia ada.
mempunyai peningkatan yang lebih besar daripada tetapan
sahaja.
Visualisasi:
Atas ialah kandungan terperinci Pembunuh pengeluaran besar-besaran! P-Mapnet: Menggunakan peta SDMap berketepatan rendah sebelum ini, prestasi pemetaan dipertingkatkan dengan hampir 20 mata!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!