L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan-AI-php.cn

L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan

PHPz

Aug 07, 2024 am 04:35 AM

industrimodel duniaPemanduan pintarkereta yang idealModel besar multimodalVLM

Baru-baru ini, dengan peningkatan teknologi AI generatif, banyak kuasa pembuatan kereta baharu sedang meneroka kaedah baharu model bahasa visual dan model dunia pemacu pintar hujung-ke-hujung nampaknya telah menjadi hala tuju penyelidikan biasa. Bulan lalu, Li Auto mengeluarkan seni bina teknologi pemanduan autonomi generasi ketiga bagi model bahasa visual + VLM hujung ke hujung + model dunia. Seni bina ini telah ditolak kepada beribu-ribu orang untuk ujian dalaman. Ia menggambarkan tingkah laku pemanduan pintar, meningkatkan kecekapan pemprosesan maklumat AI, dan meningkatkan keupayaan untuk memahami dan bertindak balas terhadap keadaan jalan yang kompleks. Li Xiang pernah berkata dalam perkongsian awam bahawa dalam menghadapi persekitaran pemanduan yang jarang berlaku yang sukar untuk kebanyakan algoritma untuk mengenal pasti dan memproses, VLM (Model Bahasa Visual) secara sistematik boleh meningkatkan keupayaan pemanduan autonomi Kaedah ini boleh dicapai secara teori .

L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan

Generasi baharu sistem pemanduan autonomi telah meningkatkan had atas keupayaan dengan banyak - membolehkan AI menangani banyak situasi yang sukar diselesaikan pada masa lalu, dan juga menurunkan ambang - mengurangkan keperluan untuk saiz R&D teknologi pasukan, dan dijangka membolehkan lebih ramai orang memandu dalam masa terdekat Dapatkan pengalaman yang jauh lebih baik pada masa hadapan.
Set seni bina teknologi pemanduan autonomi ini diilhamkan oleh teori sistem pantas dan perlahan pemenang Hadiah Nobel Daniel Kahneman Mensimulasikan pemikiran manusia dan proses membuat keputusan dalam bidang pemanduan autonomi juga memerlukan "sistem pantas" dan "sistem perlahan" Bekerjasama. . Antaranya:
・ Sistem pantas (Sistem 1) pandai mengendalikan tugas mudah dan intuisi manusia dibentuk berdasarkan pengalaman dan tabiat dalam pemanduan autonomi, ia terdiri daripada model besar hujung ke hujung, termasuk persepsi dan perancangan , yang cukup untuk menangani 95% masalah semasa memandu kenderaan senario rutin.
・ Sistem perlahan (Sistem 2) ialah penaakulan logik, analisis kompleks dan keupayaan pengkomputeran yang dibentuk oleh manusia melalui pemahaman dan pembelajaran yang lebih mendalam dalam sistem pemanduan autonomi, ia terutamanya model VLM, yang digunakan untuk menyelesaikan kompleks atau tidak diketahui masalah semasa memandu kenderaan Adegan trafik menyumbang kira-kira 5% daripada adegan pemanduan harian.
Minggu lepas, pada acara yang diadakan di ibu pejabat R&D Li Auto di Beijing, Naib Presiden Pemanduan Pintar Li Auto Lang Xianpeng menekankan bahawa pemanduan pintar Li Auto kini telah disepadukan sepenuhnya ke dalam penyelesaian model hujung ke hujung + besar, yang membolehkan kenderaan untuk memahami keadaan jalan raya yang kompleks dan peraturan lalu lintas.
"Kedua-dua model membuat keputusan persepsi hujung-ke-hujung dan tradisional memerlukan sejumlah besar data untuk latihan. Satu masalah yang berpotensi ialah sistem tidak akan berfungsi dengan baik jika ia menghadapi adegan yang tidak kelihatan," kata Lang Xianpeng. "Kami sedang meneroka keupayaan kenderaan untuk berfikir dan membuat keputusan seperti orang ramai."

L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan

Sejak separuh kedua tahun lalu, Ideal mula menyesuaikan strateginya dan mengubah trajektorinya. Pada Februari tahun ini, dalam kertas DriveVLM yang dikemukakan oleh Institut Penyelidikan Silang Maklumat Universiti Tsinghua dan Li Auto, penyelidik menggunakan model bahasa visual (VLM) yang baru-baru ini muncul dalam bidang AI generatif dan menunjukkan keupayaan luar biasa dalam pemahaman dan penaakulan visual. . Dalam industri, ini adalah kerja pertama untuk mencadangkan sistem kelajuan pemanduan autonomi, kaedahnya menggabungkan sepenuhnya saluran paip pemanduan autonomi arus perdana dan saluran paip model besar dengan pemikiran logik, dan merupakan yang pertama menyelesaikan kerja model besar ujian akhir. penempatan (Berdasarkan platform NVIDIA Orin).

Sistem DriveVLM

L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan

DriveVLM terdiri daripada proses Chain-of-Though (CoT) dengan tiga modul utama: Penerangan Senario: Gunakan bahasa untuk menerangkan persekitaran pemanduan dan mengenal pasti objek utama.

Analisis Senario: Selami ciri-ciri objek utama dan kesannya terhadap kenderaan ego.

Perancangan hierarki: Pembangunan pelan langkah demi langkah daripada meta-tindakan dan penerangan keputusan kepada titik laluan.
Modul ini sepadan dengan persepsi, ramalan dan komponen perancangan dalam proses sistem pemanduan autonomi tradisional Perbezaannya terletak pada keupayaan mereka untuk mengendalikan persepsi objek, ramalan tahap niat dan perancangan peringkat tugas, yang telah menjadi sangat mencabar dalam masa. lalu.

Pengesahan teknikal

Teknologi pengesahan yang ideal berkesan dalam senario long-tail:

Nyahhimpun data persekitaran sebenar

Gunakan model generatif untuk menambah perspektif baharu

yang lain
Aplikasi praktikal

Model hujung ke hujung Li Auto dan model VLM dijalankan dalam masa nyata:

Model hujung ke hujung: kadar bingkai yang lebih tinggi

Model VLM: bilangan parameter yang lebih besar, kadar bingkai yang lebih rendah

Di bandar yang kompleks Dalam senario, VLM memainkan peranan dalam situasi yang membuat keputusan adalah mustahil dan menyampaikan keputusan dan trajektori kepada model hujung ke hujung.

Pendekatan hujung ke hujung

Pendekatan hujung ke hujung telah menjadi aliran teknologi, menandakan permulaan penggunaan sebenar AI.

Model AI generasi baharu

Model AI generasi baharu boleh berfungsi sebagai pembuat soalan:

Pilih data pengguna yang memenuhi standard pemandu kereta persendirian sebagai "soalan sebenar"

Digabungkan dengan dunia model untuk menjana "soalan simulasi"

Cabaran kuasa pengkomputeran

Le déploiement de modèles tels que VLM côté véhicule est confronté à des défis de puissance de calcul :

Maintenir le nombre optimal de paramètres
Optimiser l'ingénierie pour améliorer la latence de prise de décision

Perspectives de concurrence

Tesla FSD est sur le point de entrez dans le domaine de la conduite intelligente nationale Entrez dans une nouvelle étape de compétition :

Objectif de la voiture idéale : de bout en bout + livraison en série de conduite autonome VLM

Atas ialah kandungan terperinci L3 akan dilancarkan selewat-lewatnya pada separuh pertama tahun depan: pemanduan autonomi hujung-ke-hujung yang ideal dan prestasi yang sangat dipertingkatkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface SmollmApr 18, 2025 am 11:52 AM

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung

AI untuk Kesihatan Mental dianalisis dengan penuh perhatian melalui inisiatif baru yang menarik di Stanford UniversityApr 18, 2025 am 11:49 AM

Pelancaran AI4MH mereka berlaku pada 15 April, 2025, dan Luminary Dr. Tom Insel, M.D., pakar psikiatri yang terkenal dan pakar neurosains, berkhidmat sebagai penceramah kick-off. Dr. Insel terkenal dengan kerja cemerlangnya dalam penyelidikan kesihatan mental dan techno

Kelas Draf WNBA 2025 memasuki liga yang semakin meningkat dan melawan gangguan dalam talianApr 18, 2025 am 11:44 AM

"Kami mahu memastikan bahawa WNBA kekal sebagai ruang di mana semua orang, pemain, peminat dan rakan kongsi korporat, berasa selamat, dihargai dan diberi kuasa," kata Engelbert, menangani apa yang telah menjadi salah satu cabaran sukan wanita yang paling merosakkan. Anno

Panduan Komprehensif untuk Struktur Data Terbina Python - Analytics VidhyaApr 18, 2025 am 11:43 AM

Pengenalan Python cemerlang sebagai bahasa pengaturcaraan, terutamanya dalam sains data dan AI generatif. Manipulasi data yang cekap (penyimpanan, pengurusan, dan akses) adalah penting apabila berurusan dengan dataset yang besar. Kami pernah meliputi nombor dan st

Tayangan pertama dari model baru Openai berbanding dengan alternatifApr 18, 2025 am 11:41 AM

Sebelum menyelam, kaveat penting: Prestasi AI adalah spesifik yang tidak ditentukan dan sangat digunakan. Dalam istilah yang lebih mudah, perbatuan anda mungkin berbeza -beza. Jangan ambil artikel ini (atau lain -lain) sebagai perkataan akhir -sebaliknya, uji model ini pada senario anda sendiri

AI Portfolio | Bagaimana untuk membina portfolio untuk kerjaya AI?Apr 18, 2025 am 11:40 AM

Membina portfolio AI/ML yang menonjol: Panduan untuk Pemula dan Profesional Mewujudkan portfolio yang menarik adalah penting untuk mendapatkan peranan dalam kecerdasan buatan (AI) dan pembelajaran mesin (ML). Panduan ini memberi nasihat untuk membina portfolio

AI AI apa yang boleh dimaksudkan untuk operasi keselamatanApr 18, 2025 am 11:36 AM

Hasilnya? Pembakaran, ketidakcekapan, dan jurang yang melebar antara pengesanan dan tindakan. Tak satu pun dari ini harus datang sebagai kejutan kepada sesiapa yang bekerja dalam keselamatan siber. Janji Agentic AI telah muncul sebagai titik perubahan yang berpotensi. Kelas baru ini

Google Versus Openai: AI berjuang untuk pelajarApr 18, 2025 am 11:31 AM

Impak segera berbanding perkongsian jangka panjang? Dua minggu yang lalu Openai melangkah ke hadapan dengan tawaran jangka pendek yang kuat, memberikan akses kepada pelajar A.S. dan Kanada.

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang laluByDDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang laluByDDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SublimeText3 versi Inggeris

Disyorkan: Versi Win, menyokong gesaan kod!

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7557

Tutorial CakePHP

1384

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi