Rumah >Peranti teknologi >AI >Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-04-12 23:40:011952semak imbas

Memandangkan teknologi pemanduan autonomi terus berulang, gelagat kenderaan dan ramalan trajektori amat penting untuk pemanduan yang cekap dan selamat. Walaupun kaedah ramalan trajektori tradisional seperti potongan model dinamik dan analisis kebolehcapaian mempunyai kelebihan bentuk yang jelas dan kebolehtafsiran yang kuat, keupayaan mereka untuk memodelkan interaksi antara persekitaran dan objek agak terhad dalam persekitaran trafik yang kompleks. Oleh itu, dalam beberapa tahun kebelakangan ini, sejumlah besar penyelidikan dan aplikasi telah berdasarkan pelbagai kaedah pembelajaran mendalam (seperti LSTM, CNN, Transformer, GNN, dll.), dan pelbagai set data seperti BDD100K, nuScenes, Stanford Drone, ETH /UCY, INTERACTION, ApolloScape, dsb. juga telah muncul , menyediakan sokongan kuat untuk latihan dan menilai model rangkaian saraf dalam Banyak model SOTA seperti GroupNet, Trajectron++, MultiPath, dll. telah menunjukkan prestasi yang baik.

Model dan set data di atas tertumpu dalam senario pemanduan jalan biasa, dan menggunakan sepenuhnya infrastruktur dan ciri seperti garisan lorong dan lampu isyarat untuk membantu dalam proses ramalan kerana batasan peraturan lalu lintas, Corak pergerakan kebanyakan kenderaan juga agak jelas. Walau bagaimanapun, dalam "batu terakhir" pemanduan autonomi - senario tempat letak kereta autonomi, kami akan menghadapi banyak kesukaran baharu:

Peraturan lalu lintas di tempat letak kereta Keperluan untuk garisan lorong dan garisan lorong tidak ketat, dan kenderaan sering memandu sesuka hati dan "mengambil jalan pintas"
Untuk menyelesaikan tugas parkir, kenderaan perlu menyelesaikan tindakan parkir yang lebih kompleks, termasuk kerap mengundur , Tempat letak kereta, stereng, dsb. Jika pemandu tidak berpengalaman, tempat letak kereta mungkin menjadi satu proses yang panjang
Terdapat banyak halangan dan kekusutan di tempat letak kereta, dan jarak antara kenderaan adalah dekat dan calar
Pejalan kaki selalunya berjalan melalui tempat letak kereta sesuka hati, dan kenderaan memerlukan lebih banyak tindakan mengelak
Dalam senario sedemikian, gunakan sahaja yang sedia ada. sukar bagi model ramalan trajektori untuk mencapai hasil yang ideal, dan model latihan semula tidak mempunyai sokongan data yang sepadan. Set data berasaskan tempat letak kereta semasa seperti CNRPark+EXT dan CARPK hanya direka untuk pengesanan ruang letak kereta percuma. Gambar-gambar itu datang daripada perspektif orang pertama bagi kamera pengawasan, mempunyai kadar pensampelan yang rendah dan mempunyai banyak oklusi, menjadikannya tidak dapat. digunakan untuk ramalan trajektori.

Dalam Persidangan Antarabangsa IEEE ke-25 mengenai Sistem Pengangkutan Pintar (IEEE ITSC 2022) yang baru sahaja berakhir pada Oktober 2022, daripada Universiti California, Penyelidik Berkeley mengeluarkan set data video & trajektori berdefinisi tinggi pertama untuk adegan tempat letak kereta, dan berdasarkan set data ini, menggunakan seni bina CNN dan Transformer untuk mencadangkan model ramalan trajektori yang dipanggil "ParkPredict+" .

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Pautan kertas: https://arxiv.org/abs/2204.10777
Halaman utama set data, aplikasi percubaan dan muat turun: https://sites.google.com/berkeley.edu/dlp-dataset (Jika anda tidak boleh mengakses, anda boleh Cuba halaman alternatif https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )
Dataset Python API: https://github.com/ MPC- Berkeley/dlp-dataset

Maklumat set data

Set data dikumpul menggunakan dron, dengan tempoh keseluruhan 3.5 jam, video peleraian Untuk 4K, kadar pensampelan ialah 25Hz. Pemandangan meliputi kawasan tempat letak kereta kira-kira 140m x 80m, dengan jumlah lebih kurang 400 tempat letak kereta. Set data dianotasi dengan tepat dan sejumlah 1216 kenderaan bermotor, 3904 basikal dan 3904 trajektori pejalan kaki telah dikumpulkan.

Selepas diproses semula, data trajektori boleh dibaca dalam bentuk JSON dan dimuatkan ke dalam struktur data graf sambungan (Graf ):

Individu (Agen): Setiap ejen (Agen) ialah objek yang bergerak dalam adegan semasa (Scene) Ia mempunyai sifat-sifat seperti bentuk dan jenis geometrik yang disimpan sebagai objek yang mengandungi Senarai Contoh Terpaut
Instance: Setiap kejadian ialah keadaan individu (Ejen) dalam bingkai (Bingkai), Mengandungi kedudukan, sudut, kelajuan dan pecutannya. Setiap tika mengandungi penuding kepada tika individu dalam bingkai sebelumnya dan bingkai seterusnya
Bingkai (Bingkai): Setiap bingkai (Bingkai) ialah titik pensampelan dan Mengandungi semua yang boleh dilihat kejadian (Instance) pada masa semasa, dan penunjuk ke bingkai sebelumnya dan seterusnya
Halangan: halangan ada dalam rekod ini Objek yang tidak bergerak sama sekali, termasuk kedudukan, sudut dan saiz geometri setiap objek
Adegan: Setiap adegan (Adegan) sepadan dengan fail video yang dirakam, yang mengandungi penunjuk , menunjuk ke bingkai pertama dan terakhir rakaman, semua individu ( Ejen) dan semua halangan (Halangan)

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

disediakan oleh set data Dua format muat turun:

JSON sahaja (disyorkan) : Fail JSON mengandungi semua jenis individu, bentuk, trajektori dan maklumat lain yang boleh dibaca terus, dipratonton dan dijana semantik imej (Imej Semantik) melalui API Python sumber terbuka. Jika matlamat penyelidikan hanyalah ramalan trajektori dan tingkah laku, format JSON boleh memenuhi semua keperluan.

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Video dan anotasi asal: Jika penyelidikan berdasarkan kamera asal Untuk topik dalam bidang penglihatan mesin seperti pengesanan sasaran, pemisahan dan penjejakan imej mentah, anda mungkin perlu memuat turun video dan anotasi asal. Jika ini diperlukan, penyelidikan perlu diterangkan dengan jelas dalam aplikasi set data. Selain itu, fail anotasi perlu dihuraikan dengan sendirinya.

Model ramalan tingkah laku dan trajektori: ParkPredict+

Sebagai contoh aplikasi, dalam kertas kerja IEEE ITSC 2022 "ParkPredict+: Niat Pelbagai Mod dan Ramalan Gerakan untuk Kenderaan dengan Tempat Letak Kereta CNN dan Transformer", pasukan penyelidik menggunakan set data ini untuk meramalkan niat (Niat) dan trajektori (Trajektori) kenderaan di tempat letak kereta berdasarkan seni bina CNN dan Transformer.

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Pasukan menggunakan model CNN untuk meramalkan kebarangkalian pengedaran niat kenderaan (Intent) dengan membina imej semantik. Model ini hanya perlu membina maklumat persekitaran tempatan kenderaan, dan boleh terus menukar bilangan niat yang tersedia berdasarkan persekitaran semasa.

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Pasukan menambah baik model Transformer dan memberikan hasil ramalan niat, sejarah pergerakan kenderaan dan peta semantik persekitaran sekitar sebagai input kepada mencapai pelbagai modal niat dan ramalan tingkah laku.

Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.

Ringkasan

Sebagai set data berketepatan tinggi pertama untuk senario tempat letak kereta, set data Dragon Lake Parking (DLP) boleh mencapai pengiktirafan dan penjejakan sasaran berskala besar, terbiar Penyelidikan mengenai pengesanan ruang letak kereta, tingkah laku kenderaan dan pejalan kaki serta ramalan trajektori, pembelajaran tiruan, dsb. menyediakan data dan sokongan API
Dengan menggunakan seni bina CNN dan Transformer, ParkPredict + gelagat model dalam senario tempat letak kereta Selain itu untuk menunjukkan keupayaan yang baik dalam ramalan trajektori
Set data Dragon Lake Parking (DLP) dibuka untuk percubaan dan aplikasi Anda boleh melawati halaman utama set data di https://sites.google. com /berkeley.edu/dlp-dataset Ketahui lebih lanjut (jika anda tidak boleh mengakses, anda boleh mencuba halaman alternatif https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )

Atas ialah kandungan terperinci Berkeley sumber terbuka set data definisi tinggi dan model ramalan pertama dalam senario tempat letak kereta, menyokong pengecaman sasaran dan ramalan trajektori.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python php 架构 json for 指针数据结构 github cnn lstm transformer https

Kenyataan：

Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Gunakan 40 model pembelajaran mesin dalam dua baris kod PythonArtikel seterusnya：Gunakan 40 model pembelajaran mesin dalam dua baris kod Python

Artikel berkaitan

Lihat lagi