Rumah > Artikel > Peranti teknologi > ADMap: Idea baharu untuk peta ketepatan tinggi dalam talian anti-gangguan
Saya sangat gembira dijemput untuk menyertai acara Heart of Autonomous Driving Kami akan berkongsi kaedah anti-gangguan ADMap untuk pembinaan semula peta berketepatan tinggi bervektor. Anda boleh mendapatkan kod kami di https://github.com/hht1996ok/ADMap. Terima kasih semua atas perhatian dan sokongan anda.
Dalam bidang pemanduan autonomi, pembinaan semula peta definisi tinggi dalam talian sangat penting untuk tugasan perancangan dan ramalan Kerja baru-baru ini telah membina banyak model pembinaan semula peta definisi tinggi berprestasi tinggi untuk memenuhi keperluan ini. Walau bagaimanapun, susunan mata dalam contoh yang divektorkan mungkin terketar-ketar atau bergerigi kerana bias ramalan, yang akan menjejaskan tugasan seterusnya. Oleh itu, kami mencadangkan rangka kerja pembinaan semula Peta Anti-Gangguan (ADMap). Artikel ini berharap dapat mengambil kira kelajuan model dan ketepatan keseluruhan, dan tidak mengganggu jurutera semasa menggunakan. Oleh itu, tiga modul yang cekap dan berkesan dicadangkan: Multi-Scale Perception Neck (MPN), Instance Interactive Attention (IIA), dan Vector Direction Difference Loss (VDDL). Dengan melonjakkan untuk meneroka perhubungan susunan titik antara dan dalam keadaan, model kami menyelia proses ramalan pesanan titik dengan lebih baik.
Kami mengesahkan keberkesanan ADMap dalam set data nuScenes dan Argoverse2. Keputusan eksperimen menunjukkan bahawa ADMap mempamerkan prestasi terbaik dalam pelbagai ujian penanda aras. Dalam penanda aras nuScenes, ADMap menambah baik mAP sebanyak 4.2% dan 5.5% berbanding garis dasar hanya menggunakan data kamera dan data berbilang modal, masing-masing. ADMapv2 bukan sahaja mengurangkan kependaman inferens, tetapi juga meningkatkan prestasi garis dasar dengan ketara, dengan mAP tertinggi mencapai 82.8%. Dalam set data Argoverse, mAP ADMapv2 meningkat kepada 62.9% manakala kadar bingkai kekal pada 14.8FPS.
Ringkasnya, ADMap yang kami cadangkan mempunyai sumbangan utama berikut:
Seperti yang ditunjukkan dalam Rajah 1, titik ramalan dalam contoh selalunya tidak dapat dielakkan kegelisahan atau peralihan ini akan menyebabkan vektor contoh yang dibina semula menjadi tidak sekata atau bergerigi secara serius menjejaskan kualiti dan kepraktisan peta berketepatan tinggi dalam talian. Kami percaya sebabnya ialah model sedia ada tidak mempertimbangkan sepenuhnya interaksi antara kejadian dan dalam kejadian Interaksi yang tidak lengkap antara titik contoh dan maklumat topologi peta akan membawa kepada kedudukan ramalan yang tidak tepat. Di samping itu, hanya penyeliaan seperti kehilangan L1 dan kehilangan pembenaman kosinus tidak boleh menggunakan perhubungan geometri dengan berkesan untuk mengekang proses ramalan titik contoh Rangkaian perlu menggunakan segmen garis vektor antara titik untuk menangkap maklumat arah jujukan titik dengan lebih tepat mengekang setiap proses ramalan.
Untuk mengurangkan masalah di atas, kami secara inovatif mencadangkan rangka kerja pembinaan semula Peta Anti-Gangguan (ADMap) untuk mencapai pembinaan semula peta berketepatan tinggi bervektor secara masa nyata dan stabil.
Seperti yang ditunjukkan dalam Rajah 2, ADMap menggunakan Multi-Scale Perception Neck (MPN), Instance Interactive Attention (IIA) dan kehilangan Perbezaan Arah Vektor (Vector Direction Difference) Loss, VDDL) untuk meramalkan titik-tertib topologi dengan lebih tepat. MPN, IIA dan VDDL akan diperkenalkan masing-masing di bawah.
Untuk mendapatkan ciri BEV yang lebih terperinci, kami memperkenalkan Leher Persepsi Pelbagai Skala (MPN). MPN menerima ciri BEV bercantum sebagai input. Melalui pensampelan rendah, ciri BEV setiap peringkat disambungkan ke lapisan pensampelan naik untuk memulihkan peta ciri saiz asal. Akhir sekali, peta ciri pada setiap peringkat akan digabungkan menjadi ciri BEV berbilang skala.
Seperti yang ditunjukkan dalam Rajah 2, garis putus-putus mewakili bahawa langkah ini hanya dilaksanakan semasa latihan, dan garis pepejal mewakili bahawa langkah ini dilaksanakan semasa proses latihan dan inferens. Semasa proses latihan, peta ciri BEV berbilang skala dan peta ciri BEV pada setiap peringkat dihantar ke Penyahkod Transformer, yang membolehkan rangkaian meramalkan maklumat kejadian adegan pada skala berbeza untuk menangkap ciri berbilang skala yang lebih halus. Semasa proses inferens, MPN hanya mengekalkan ciri BEV berskala dan tidak mengeluarkan peta ciri pada setiap peringkat Ini memastikan bahawa penggunaan sumber leher semasa inferens kekal tidak berubah.
Penyahkod Transformer mentakrifkan satu set pertanyaan peringkat contoh dan satu set pertanyaan peringkat titik kemudiannya dikongsi kepada semua kejadian ini ditakrifkan sebagai:
Penyahkod terdiri daripada beberapa lapisan penyahkodan bertingkat yang mengemas kini pertanyaan hierarki secara berulang. Dalam setiap lapisan penyahkodan, pertanyaan hierarki dimasukkan ke dalam mekanisme perhatian kendiri, yang membolehkan maklumat ditukar antara pertanyaan hierarki Perhatian Boleh Bentuk digunakan untuk berinteraksi dengan pertanyaan hierarki dan ciri BEV berbilang skala.
Untuk mendapatkan lebih baik ciri setiap tika dalam peringkat penyahkodan, kami mencadangkan Instance Interactive Attention (IIA), yang terdiri daripada Perhatian kendiri Instans dan Perhatian kendiri Mata. Tidak seperti MapTRv2 yang mengekstrak pembenaman peringkat contoh dan peringkat titik secara selari, IIA mengekstrak pembenaman pertanyaan secara bertingkat. Interaksi ciri antara pembenaman contoh seterusnya membantu rangkaian mempelajari perhubungan antara pembenaman peringkat titik.
Seperti yang ditunjukkan dalam Rajah 3, keluaran benam berhierarki oleh Perhatian silang Boleh Ubah bentuk ialah input kepada perhatian kendiri Instans. Selepas menggabungkan dimensi titik dan dimensi saluran, transformasi dimensi adalah. Selepas itu, pembenaman hierarki disambungkan kepada Lapisan Benam yang terdiri daripada berbilang MLP untuk mendapatkan pertanyaan contoh. Pertanyaan dimasukkan ke dalam perhatian kendiri Berbilang kepala untuk menangkap hubungan topologi antara kejadian dan mendapatkan pembenaman tika. Untuk memasukkan maklumat peringkat contoh ke dalam pembenaman peringkat titik, kami menjumlahkan pembenaman contoh dan pembenaman hierarki. Ciri tambahan dimasukkan ke dalam perhatian kendiri Titik, yang berinteraksi dengan ciri titik dalam setiap kejadian untuk mengaitkan lagi hubungan topologi antara jujukan titik dengan lebih baik.
Peta berketepatan tinggi mengandungi elemen peta statik bervektor, termasuk garisan lorong, sekatan jalan dan lintasan. ADMap mencadangkan Kehilangan Perbezaan Arah Vektor untuk bentuk terbuka ini (garisan lorong, tepi jalan) dan bentuk tertutup (pejalan kaki). Kami memodelkan arah vektor jujukan titik di dalam contoh, dan arah titik boleh dipantau dengan lebih terperinci dengan perbezaan antara arah vektor yang diramalkan dan arah vektor sebenar. Di samping itu, titik dengan perbezaan besar dalam arah vektor sebenar dianggap mewakili perubahan drastik dalam topologi beberapa adegan (lebih sukar untuk diramal), dan memerlukan lebih perhatian daripada model. Oleh itu, titik dengan perbezaan arah vektor benar yang lebih besar diberi pemberat yang lebih besar untuk memastikan rangkaian dapat meramalkan titik perubahan drastik ini dengan tepat.
Rajah 4 menunjukkan pemodelan awal garis vektor yang diramalkan { dan garis vektor sebenar { dalam jujukan titik ramalan { dan jujukan titik sebenar { ). Untuk memastikan sudut bertentangan tidak mendapat kerugian yang sama, kami mengira kosinus beza sudut garis vektor θ':
di mana fungsi mengumpul kedudukan koordinat garis vektor, mewakili operasi normalisasi . Kami menggunakan perbezaan sudut vektor setiap titik dalam contoh sebenar untuk menetapkan berat saiz yang berbeza kepada mereka. Berat ditakrifkan seperti berikut:
, yang mewakili bilangan mata dalam contoh, dan fungsi mewakili fungsi eksponen dengan asas e. Oleh kerana perbezaan sudut vektor tidak boleh dikira antara titik pertama dan terakhir, kami menetapkan berat titik pertama dan terakhir kepada 1. Apabila perbezaan sudut vektor dalam kebenaran tanah menjadi lebih besar, kami memberikan titik itu berat yang lebih besar, yang menjadikan rangkaian memberi lebih perhatian kepada perubahan topologi peta dengan ketara. Kehilangan perbezaan sudut setiap titik dalam jujukan titik ditakrifkan sebagai:
Kami menggunakan θ untuk melaraskan selang nilai kerugian kepada [0.0, 2.0]. Dengan menambahkan kosinus bagi perbezaan sudut antara garis vektor bersebelahan pada setiap titik, kehilangan ini secara lebih komprehensif meliputi maklumat topologi geometri setiap titik. Oleh kerana hanya terdapat satu garis vektor bersebelahan antara titik pertama dan terakhir, kerugian pada titik pertama dan terakhir ialah kosinus bagi perbezaan sudut vektor tunggal.
Untuk penilaian yang adil, kami membahagikan elemen peta kepada tiga jenis: garisan lorong, sempadan jalan dan lintasan. Ketepatan purata (AP) digunakan untuk menilai kualiti pembinaan peta, dan jumlah jarak chamfer antara susunan titik yang diramalkan dan susunan titik sebenar digunakan untuk menentukan sama ada kedua-duanya sepadan. Ambang jarak Chamfer ditetapkan kepada [0.5, 1.0, 1.5], kami mengira AP di bawah ketiga-tiga ambang ini masing-masing dan menggunakan purata sebagai penunjuk akhir.
Jadual 1 melaporkan metrik ADMap dan kaedah terkini pada set data nuScenes. Di bawah rangka kerja kamera sahaja, mAP ADMap meningkat sebanyak 5.5% berbanding garis dasar (MapTR) dan ADMapv2 meningkat sebanyak 1.4% berbanding garis dasar (MapTRv2). ADMapv2 mempunyai mAP maksimum 82.8%, mencapai prestasi terbaik antara penanda aras semasa Beberapa butiran akan diumumkan dalam versi arxiv berikutnya. Dari segi kelajuan, ADMap meningkatkan prestasi model dengan ketara berbanding garis dasarnya pada FPS yang lebih rendah sedikit. Perlu dinyatakan bahawa ADMapv2 bukan sahaja meningkatkan prestasi, tetapi juga meningkatkan kelajuan inferens model.
Jadual 2 melaporkan metrik ADMap dan kaedah terkini dalam Argoverse2. Di bawah rangka kerja kamera sahaja, ADMap dan ADMapv2 masing-masing meningkat sebanyak 3.4% dan 1.3% berbanding garis dasar. Di bawah rangka kerja berbilang modal, ADMap dan ADMapv2 mencapai prestasi terbaik, dengan mAP masing-masing 75.2% dan 76.9%. Dari segi kelajuan. ADMapv2 bertambah baik sebanyak 11.4ms berbanding MapTRv2.
Dalam Jadual 3, kami menyediakan eksperimen ablasi untuk setiap modul ADMap pada penanda aras nuScenes.
Jadual 4 menunjukkan kesan memasukkan mekanisme perhatian yang berbeza pada prestasi akhir. DSA bermaksud perhatian kendiri yang dipisahkan, dan IIA bermaksud perhatian interaktif contohnya. Keputusan menunjukkan bahawa IIA meningkatkan mAP sebanyak 1.3% berbanding DSA.
Jadual 5 melaporkan kesan penambahan tulang belakang dan lapisan leher pada mAP selepas menggabungkan ciri. Selepas menambah lapisan tulang belakang dan leher berdasarkan KEDUA, mAP meningkat sebanyak 1.2%. Selepas menambah MPN, mAP model meningkat sebanyak 2.0% tanpa meningkatkan masa inferens.
Jadual 6 melaporkan kesan prestasi penambahan VDDL dalam penanda aras nuScenes. Dapat dilihat bahawa apabila berat ditetapkan kepada 1.0, mAP adalah yang tertinggi, mencapai 53.3%.
Jadual 7 melaporkan kesan bilangan lapisan pensampelan turun MPN pada prestasi akhir dalam penanda aras nuScenes. Lebih banyak lapisan pensampelan turun, lebih perlahan kelajuan inferens model. Oleh itu, untuk mengimbangi kelajuan dan prestasi, kami menetapkan bilangan lapisan pensampelan bawah kepada 2.
Untuk mengesahkan bahawa ADMap berkesan mengurangkan masalah gangguan pesanan titik, kami mencadangkan jarak chamfer purata (ACE). Kami memilih kejadian yang diramalkan yang jumlah jarak chamfernya kurang daripada 1.5 dan mengira jarak chamfer puratanya (ACE). Semakin kecil ACE, semakin tepat ramalan susunan titik contoh. Jadual 8 membuktikan bahawa ADMap berkesan dapat mengurangkan masalah gangguan awan titik.
Dua gambar berikut menunjukkan hasil visualisasi set data nuScenes dan set data Argoverse2.
ADMap ialah rangka kerja pembinaan semula peta berketepatan tinggi tervektor yang cekap dan berkesan, yang berkesan mengurangkan kegelisahan atau fenomena bergerigi yang mungkin berlaku dalam susunan titik yang wajar bagi vektor bias Eksperimen yang meluas menunjukkan bahawa kaedah yang dicadangkan kami mencapai prestasi terbaik pada kedua-dua penanda aras nuScenes dan Argoverse2. Kami percaya bahawa ADMap akan membantu memajukan penyelidikan tentang tugas pembinaan semula peta berketepatan tinggi vektor, dengan itu menggalakkan pembangunan pemanduan autonomi dan bidang lain dengan lebih baik.
Atas ialah kandungan terperinci ADMap: Idea baharu untuk peta ketepatan tinggi dalam talian anti-gangguan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!