Rumah >Peranti teknologi >AI >Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi

Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi

王林
王林ke hadapan
2023-10-30 14:45:05902semak imbas

Artikel ini dicetak semula dengan kebenaran akaun awam Heart of Autonomous Driving Sila hubungi sumber asal untuk mencetak semula

1. Rancangan Woven Planet (anak syarikat Toyota): Urban Driver 2021

. adalah dari 21 tahun, Tetapi banyak artikel baru menggunakannya sebagai garis dasar untuk perbandingan, jadi ia juga perlu untuk memahami kaedahnya

Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi

Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi

Selepas melihat kasar, ia terutamanya menggunakan Kecerunan Dasar untuk mempelajari fungsi pemetaan State->Recent Action Dengan pemetaan ini Fungsi boleh menyimpulkan keseluruhan trajektori pelaksanaan langkah demi langkah Kerugian terakhir adalah untuk membuat trajektori yang diberikan oleh potongan ini sedekat mungkin dengan trajektori pakar.

Kesannya sepatutnya cukup baik pada masa itu, jadi ia boleh menjadi garis dasar untuk algoritma baharu.

2. Rancangan Universiti Teknologi Nanyang 1 Perancangan Tingkah Laku Ramalan Bersyarat dengan Pembelajaran Peneguhan Songsang 2023.04

Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi


Pertama gunakan peraturan untuk menyenaraikan pelbagai tingkah laku dan menjana 10~30 (Keputusan ramalan tidak digunakan)

Gunakan Ramalan Bersyarat untuk mengira keputusan ramalan bagi setiap trajektori calon kenderaan hos, dan kemudian gunakan IRL untuk menjaringkan trajektori calon.

Model Ramalan Bersama Bersyarat kelihatan seperti ini:

Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi


Pada asasnya perkara yang hebat tentang kaedah ini ialah ia menggunakan Ramalan Bersama Bersyarat untuk melengkapkan ramalan interaktif, memberikan algoritma keupayaan permainan tertentu.

Tetapi saya secara peribadi berpendapat bahawa kelemahan algoritma ialah hanya 10 hingga 30 trajektori dijana sebelum ini, dan ramalan tidak dipertimbangkan semasa menjana trajektori, dan akhirnya, salah satu trajektori ini akan dipilih terus sebagai hasil akhir selepas IRL pemarkahan, yang memudahkan 10 ~30 situasi yang tidak sesuai selepas mempertimbangkan ramalan. Ia sama dengan memilih seorang jeneral di kalangan orang cacat, dan yang dipilih masih lumpuh. Berdasarkan penyelesaian ini, ia akan menjadi cara yang sangat baik untuk menyelesaikan masalah penjanaan kualiti sampel yang akan dipilih di hadapan Ketiga, penyelesaian NVIDIA: 2023.02 Perancangan Dasar Berstruktur Pokok dengan Model Tingkah Laku yang Dipelajari

Menggunakan pokok biasa. pensampelan, lapisan demi lapisan Untuk pertimbangan masa hadapan, hasilkan ramalan bersyarat untuk setiap subnod setiap lapisan, kemudian gunakan peraturan untuk menjaringkan keputusan ramalan dan trajektori kenderaan utama, dan gunakan beberapa peraturan untuk menghapuskan yang tidak sah, dan kemudian gunakan DP untuk menjana trajektori optimum pada masa hadapan , idea DP agak serupa dengan dp_path_optimizer dalam apollo, tetapi menambah dimensi masa.

Namun, kerana terdapat satu lagi dimensi, selepas pengembangan terlalu banyak kali, ruang penyelesaian akan tetap besar dan jumlah pengiraan akan menjadi terlalu besar Kaedah yang ditulis dalam kertas semasa adalah membuang secara rawak beberapa nod apabila ada adalah terlalu banyak nod. Pastikan jumlah pengiraan boleh dikawal (rasanya jika terlalu banyak nod, ia mungkin selepas n tahap, dan kesannya mungkin agak kecil)

Sumbangan utama artikel ini adalah untuk mengubah ruang penyelesaian berterusan kepada keputusan Markov melalui proses peraturan pensampelan pokok ini, dan kemudian menggunakan dp untuk menyelesaikannya.

4. kesan permainan tertentu

2. Ia boleh dibezakan dan boleh melepasi kembali keseluruhan kecerunan supaya ramalan boleh dilatih bersama-sama dengan IRL. Ia juga merupakan syarat yang diperlukan untuk dapat membina pemanduan autonomi hujung ke hujung Ketiga, Perancangan Dasar Pokok mungkin mempunyai keupayaan potongan interaktif tertentu Selepas membacanya dengan teliti, saya mendapati bahawa artikel ini sangat bermaklumat pandai.

Selepas menggabungkan dan menambah baik TPP NVIDIA dan Perancangan Tingkah Laku Ramalan Bersyarat Politeknik Nanyang dengan Pembelajaran Pengukuhan Songsang, masalah trajektori calon yang lemah dalam kertas Politeknik Nanyang sebelum ini telah berjaya diselesaikan


modul kertas utama:

1. Modul Ramalan Bersyarat memasukkan trajektori sejarah kenderaan utama + trajektori pantas + trajektori sejarah kenderaan halangan, dan memberikan trajektori ramalan kenderaan utama yang menghampiri trajektori pantas dan trajektori ramalan kenderaan halangan yang konsisten dengan tingkah laku kenderaan utama.

2. Modul pemarkahan boleh menjaringkan kenderaan utama + trajektori kenderaan halangan untuk melihat sama ada trajektori itu menyerupai tingkah laku pakar.

3 Modul Carian Dasar Pokok, digunakan untuk menjana sekumpulan trajektori calon

Algoritma Tree Search digunakan untuk meneroka penyelesaian yang boleh dilaksanakan bagi kenderaan utama Setiap langkah dalam proses penerokaan mengambil trajektori yang diterokai sebagai input, menggunakan algoritma Ramalan Bersyarat untuk menjana trajektori yang diramalkan bagi kenderaan utama dan kenderaan halangan, dan memanggil modul pemarkahan untuk menilai kecemerlangan trajektori adalah lemah, sekali gus menjejaskan arah carian seterusnya untuk nod pengembangan. Melalui kaedah ini, anda boleh menjana beberapa trajektori kenderaan utama yang berbeza daripada penyelesaian lain, dan mempertimbangkan interaksi dengan kenderaan halangan semasa menjana trajektori

IRL tradisional secara manual mencipta banyak ciri, seperti sekumpulan ciri depan dan belakang Pelbagai ciri-ciri halangan dalam dimensi masa trajektori (seperti relatif s, l dan ttc Dalam artikel ini, untuk menjadikan model boleh dibezakan, ramalan MLP konteks ego digunakan secara langsung untuk menjana tatasusunan Berat (saiz = 1 *). C), secara tersirat mewakili maklumat alam sekitar di sekeliling kenderaan hos, dan kemudian menggunakan MLP untuk menukar terus trajektori kenderaan hos + hasil ramalan berbilang mod yang sepadan kepada tatasusunan Ciri (saiz = C * N, N merujuk kepada bilangan trajektori calon ) , dan kemudian kedua-dua matriks didarab untuk mendapatkan skor trajektori akhir. Kemudian IRL membiarkan pakar mendapat mata tertinggi. Secara peribadi, saya merasakan bahawa ini mungkin untuk kecekapan pengiraan, menjadikan penyahkod semudah mungkin, tetapi masih terdapat kehilangan tertentu maklumat kenderaan utama Jika anda tidak memberi perhatian kepada kecekapan pengiraan, anda boleh menggunakan beberapa rangkaian yang lebih kompleks sambungkan Konteks Ego dan Trajektori Diramalkan, dan tahap kesannya harus lebih baik? Atau jika anda melepaskan kebolehbezaan, anda masih boleh mempertimbangkan untuk menambah ciri yang ditetapkan secara manual, yang juga harus meningkatkan kesan model.

Dari segi masa, penyelesaian ini menggunakan kaedah satu pengekodan semula + berbilang penyahkodan ringan, yang berjaya mengurangkan kelewatan pengiraan. Artikel tersebut menunjukkan bahawa kelewatan boleh dimampatkan kepada 98 milisaat

Ia tergolong dalam kedudukan SOTA dalam kalangan perancang berasaskan pembelajaran, dan kesan gelung tertutup adalah hampir dengan skema Berasaskan Peraturan No. 1 nuplan yang disebut dalam artikel sebelumnya. . trajektori

Untuk setiap Trajektori, gunakan Ramalan Bersama Bersyarat untuk membuat ramalan interaktif dan menjana ramalan ejen. Boleh meningkatkan prestasi permainan. IRL dan kaedah lain menggunakan keputusan Ramalan Bersama Bersyarat untuk menjaringkan trajektori kenderaan utama sebelum ini dan memilih trajektori yang optimum

  1. Kandungan yang perlu ditulis semula ialah: Pautan asal: https://mp.weixin. qq. com/s/ZJtMU3zGciot1g5BoCe9Ow

Atas ialah kandungan terperinci Kajian semula kaedah perancangan hujung ke hujung untuk pemanduan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam