Rumah > Artikel > Peranti teknologi > Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.
Memandangkan teknologi pemanduan autonomi terus berulang, gelagat kenderaan dan ramalan trajektori amat penting untuk pemanduan yang cekap dan selamat. Walaupun kaedah ramalan trajektori tradisional seperti potongan model dinamik dan analisis kebolehcapaian mempunyai kelebihan bentuk yang jelas dan kebolehtafsiran yang kuat, keupayaan mereka untuk memodelkan interaksi antara persekitaran dan objek agak terhad dalam persekitaran trafik yang kompleks. Oleh itu, dalam beberapa tahun kebelakangan ini, sejumlah besar penyelidikan dan aplikasi telah berdasarkan pelbagai kaedah pembelajaran mendalam (seperti LSTM, CNN, Transformer, GNN, dll.), dan pelbagai set data seperti BDD100K, nuScenes, Stanford Drone, ETH /UCY, INTERACTION, ApolloScape, dsb. juga telah muncul , menyediakan sokongan kuat untuk latihan dan menilai model rangkaian saraf dalam Banyak model SOTA seperti GroupNet, Trajectron++, MultiPath, dll. telah menunjukkan prestasi yang baik.
Model dan set data di atas tertumpu dalam senario pemanduan jalan biasa, dan menggunakan sepenuhnya infrastruktur dan ciri seperti garisan lorong dan lampu isyarat untuk membantu dalam proses ramalan kerana batasan peraturan lalu lintas, Corak pergerakan kebanyakan kenderaan juga agak jelas. Walau bagaimanapun, dalam "batu terakhir" pemanduan autonomi - senario tempat letak kereta autonomi, kami akan menghadapi banyak kesukaran baharu:
Dalam Persidangan Antarabangsa IEEE ke-25 mengenai Sistem Pengangkutan Pintar (IEEE ITSC 2022) yang baru sahaja berakhir pada Oktober 2022, daripada Universiti California, Penyelidik Berkeley mengeluarkan set data video & trajektori berdefinisi tinggi pertama untuk adegan tempat letak kereta, dan berdasarkan set data ini, menggunakan seni bina CNN dan Transformer untuk mencadangkan model ramalan trajektori yang dipanggil "ParkPredict+" .
Set data dikumpul menggunakan dron, dengan tempoh keseluruhan 3.5 jam, video peleraian Untuk 4K, kadar pensampelan ialah 25Hz. Pemandangan meliputi kawasan tempat letak kereta kira-kira 140m x 80m, dengan jumlah lebih kurang 400 tempat letak kereta. Set data dianotasi dengan tepat dan sejumlah 1216 kenderaan bermotor, 3904 basikal dan 3904 trajektori pejalan kaki telah dikumpulkan.
Selepas diproses semula, data trajektori boleh dibaca dalam bentuk JSON dan dimuatkan ke dalam struktur data graf sambungan (Graf ):
disediakan oleh set data Dua format muat turun:
JSON sahaja (disyorkan) : Fail JSON mengandungi semua jenis individu, bentuk, trajektori dan maklumat lain yang boleh dibaca terus, dipratonton dan dijana semantik imej (Imej Semantik) melalui API Python sumber terbuka. Jika matlamat penyelidikan hanyalah ramalan trajektori dan tingkah laku, format JSON boleh memenuhi semua keperluan.
Video dan anotasi asal: Jika penyelidikan berdasarkan kamera asal Untuk topik dalam bidang penglihatan mesin seperti pengesanan sasaran, pemisahan dan penjejakan imej mentah, anda mungkin perlu memuat turun video dan anotasi asal. Jika ini diperlukan, penyelidikan perlu diterangkan dengan jelas dalam aplikasi set data. Selain itu, fail anotasi perlu dihuraikan dengan sendirinya.
Sebagai contoh aplikasi, dalam kertas kerja IEEE ITSC 2022 "ParkPredict+: Niat Pelbagai Mod dan Ramalan Gerakan untuk Kenderaan dengan Tempat Letak Kereta CNN dan Transformer", pasukan penyelidik menggunakan set data ini untuk meramalkan niat (Niat) dan trajektori (Trajektori) kenderaan di tempat letak kereta berdasarkan seni bina CNN dan Transformer.
Pasukan menggunakan model CNN untuk meramalkan kebarangkalian pengedaran niat kenderaan (Intent) dengan membina imej semantik. Model ini hanya perlu membina maklumat persekitaran tempatan kenderaan, dan boleh terus menukar bilangan niat yang tersedia berdasarkan persekitaran semasa.
Pasukan menambah baik model Transformer dan memberikan hasil ramalan niat, sejarah pergerakan kenderaan dan peta semantik persekitaran sekitar sebagai input kepada mencapai pelbagai modal niat dan ramalan tingkah laku.
Atas ialah kandungan terperinci Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!