


ST-P3: Kaedah penglihatan pembelajaran ciri spatiotemporal hujung ke hujung untuk pemanduan autonomi
kertas arXiv "ST-P3: Pemanduan Autonomi Berasaskan Penglihatan Hujung-ke-hujung melalui Pembelajaran Ciri Spatial-Temporal", 22 Julai, pengarang dari Shanghai Jiao Tong University, Shanghai AI Laboratory, University of California San Diego dan JD. com Institut Penyelidikan Beijing.
Cadangkan skim pembelajaran ciri spatiotemporal yang boleh menyediakan satu set ciri yang lebih representatif untuk persepsi, ramalan dan perancangan secara serentak, yang dipanggil ST-P3. Khususnya, teknik pengumpulan sejajar egosentrik dicadangkan untuk mengekalkan maklumat geometri dalam ruang 3-D sebelum mengesan penukaran BEV; unit penghalusan diperkenalkan untuk mengimbangi pengecaman elemen visual yang dirancang. Butiran kod sumber, model dan protokol sumber terbuka https://github.com/OpenPerceptionX/ST-P3.
Kaedah Perintis LSS mengekstrak ciri perspektif daripada kamera berbilang paparan, mengangkatnya kepada 3D melalui anggaran kedalaman dan menggabungkannya ke dalam ruang BEV. Transformasi ciri antara dua paparan, yang ramalan kedalaman terpendamnya adalah penting.
Menaik taraf maklumat satah dua dimensi kepada tiga dimensi memerlukan dimensi tambahan, iaitu kedalaman yang sesuai untuk tugas pemanduan autonomi dengan geometri tiga dimensi. Untuk menambah baik lagi perwakilan ciri, adalah wajar untuk memasukkan maklumat temporal ke dalam rangka kerja kerana kebanyakan adegan ditugaskan dengan sumber video.
Seperti yang diterangkan dalam rajahST- P3Rangka kerja keseluruhan: Khususnya, diberikan satu set video kamera sekeliling, masukkannya ke dalam tulang belakang untuk menjana ciri pandangan hadapan awal. Melakukan anggaran kedalaman tambahan untuk menukar ciri 2D kepada ruang 3D. Skim pengumpulan penjajaran berpusatkan diri mula-mula menjajarkan ciri-ciri lepas kepada sistem koordinat paparan semasa. Ciri semasa dan masa lalu kemudiannya diagregatkan dalam ruang tiga dimensi, mengekalkan maklumat geometri sebelum ditukar kepada perwakilan BEV. Selain daripada model domain masa ramalan yang biasa digunakan, prestasi dipertingkatkan lagi dengan membina laluan kedua untuk menerangkan perubahan gerakan yang lalu. Pemodelan dwi-laluan ini memastikan perwakilan ciri yang lebih kukuh untuk membuat kesimpulan hasil semantik masa hadapan. Untuk mencapai matlamat akhir trajektori perancangan , ciri awal pengetahuan sedia ada rangkaian disepadukan. Modul penghalusan telah direka bentuk untuk menjana trajektori akhir dengan bantuan arahan peringkat tinggi tanpa adanya peta HD.
Gambar menunjukkan kaedah pengumpulan penjajaran egosentrik persepsi. (a) Gunakan anggaran kedalaman untuk menaikkan ciri pada cap masa semasa kepada 3D dan bergabung menjadi ciri BEV selepas penjajaran (b-c) Selaraskan ciri 3D bingkai sebelumnya dengan paparan bingkai semasa dan bercantum dengan semua keadaan masa lalu dan semasa; mempertingkatkan perwakilan ciri.
Seperti yang ditunjukkan dalam rajah ialah model dua hala yang digunakan untuk ramalan: (i) Kod terpendam ialah taburan daripada peta ciri; (ii iii) Cara a Ia menggabungkan taburan ketidakpastian yang menunjukkan pelbagai mod pada masa hadapan, manakala laluan b belajar daripada perubahan masa lalu, membantu maklumat laluan a untuk mengimbangi.
Sebagai matlamat utama, anda perlu merancang trajektori yang selamat dan selesa untuk mencapai titik sasaran. Perancang gerakan ini mengambil sampel satu set trajektori yang berbeza dan memilih satu yang meminimumkan fungsi kos yang dipelajari. Walau bagaimanapun, menyepadukan maklumat daripada titik sasaran dan lampu isyarat melalui model domain masa menambahkan langkah pengoptimuman tambahan.
Rajah menunjukkan penyepaduan dan penghalusan pengetahuan sedia ada untuk perancangan : gambar rajah kos keseluruhan termasuk dua subkos. Trajektori kos minimum ditakrifkan semula menggunakan ciri berpandangan ke hadapan untuk mengagregatkan maklumat berasaskan penglihatan daripada input kamera.
Menghukum trajektori dengan pecutan sisi yang besar, jerk atau kelengkungan. Semoga trajektori ini akan sampai ke destinasi dengan cekap, jadi kemajuan ke hadapan akan diberi ganjaran. Walau bagaimanapun, item kos di atas tidak mengandungi maklumat sasaran yang biasanya disediakan oleh peta laluan. Gunakan arahan peringkat tinggi, termasuk ke hadapan, belok kiri dan belok kanan, dan nilaikan trajektori hanya berdasarkan arahan yang sepadan.
Selain itu, lampu isyarat adalah penting untuk SDV mengoptimumkan trajektori melalui rangkaian GRU. Keadaan tersembunyi dimulakan dengan ciri kamera hadapan modul pengekod dan setiap titik sampel bagi jangka kos digunakan sebagai input.
Keputusan percubaan adalah seperti berikut:
Atas ialah kandungan terperinci ST-P3: Kaedah penglihatan pembelajaran ciri spatiotemporal hujung ke hujung untuk pemanduan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Model bahasa yang besar (LLMS) telah melonjak populariti, dengan ciri-ciri alat yang secara dramatik memperluaskan keupayaan mereka di luar penjanaan teks mudah. Sekarang, LLMS dapat mengendalikan tugas automasi yang kompleks seperti penciptaan UI dinamik dan autonomi a

Bolehkah permainan video meringankan kebimbangan, membina fokus, atau menyokong kanak -kanak dengan ADHD? Memandangkan cabaran penjagaan kesihatan melonjak di seluruh dunia - terutamanya di kalangan belia - inovator beralih kepada alat yang tidak mungkin: permainan video. Sekarang salah satu hiburan terbesar di dunia Indus

"Sejarah telah menunjukkan bahawa walaupun kemajuan teknologi memacu pertumbuhan ekonomi, ia tidak sendiri memastikan pengagihan pendapatan yang saksama atau menggalakkan pembangunan manusia yang inklusif," tulis Rebeca Grynspan, Setiausaha Agung Unctad, dalam Mukadimah.

Easy-peasy, gunakan AI Generatif sebagai tutor rundingan dan rakan kongsi sparring anda. Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menjelaskan

Persidangan TED2025, yang diadakan di Vancouver, membungkus edisi ke -36 semalam, 11 April. Ia menampilkan 80 penceramah dari lebih daripada 60 negara, termasuk Sam Altman, Eric Schmidt, dan Palmer Luckey. Tema Ted, "Kemanusiaan Reimagined," telah disesuaikan dibuat

Joseph Stiglitz adalah ahli ekonomi yang terkenal dan penerima Hadiah Nobel dalam Ekonomi pada tahun 2001. Stiglitz berpendapat bahawa AI dapat memburukkan lagi ketidaksamaan dan kuasa yang disatukan di tangan beberapa syarikat dominan, akhirnya menjejaskan ekonomi

Pangkalan Data Graf: Merevolusi Pengurusan Data Melalui Hubungan Apabila data berkembang dan ciri -cirinya berkembang di pelbagai bidang, pangkalan data grafik muncul sebagai penyelesaian transformatif untuk menguruskan data yang saling berkaitan. Tidak seperti tradisional

Routing Model Besar (LLM): Mengoptimumkan Prestasi melalui Pengedaran Tugas Pintar Landskap LLM yang pesat berkembang membentangkan pelbagai model, masing -masing dengan kekuatan dan kelemahan yang unik. Beberapa cemerlang di Gen Kandungan Kreatif


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

VSCode Windows 64-bit Muat Turun
Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

Dreamweaver CS6
Alat pembangunan web visual

Versi Mac WebStorm
Alat pembangunan JavaScript yang berguna

Pelayar Peperiksaan Selamat
Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa