Rumah >Peranti teknologi >AI >LeCun amat kecewa dengan penipuan unicorn memandu sendiri
Adakah anda rasa ini video memandu sendiri biasa?
Gambar
Kandungan ini perlu ditulis semula ke dalam bahasa Cina tanpa mengubah maksud asal
Tiada satu bingkai pun "nyata".
Gambar
Keadaan jalan yang berbeza, pelbagai keadaan cuaca, dan lebih daripada 20 situasi boleh disimulasikan, dan kesannya sama seperti yang sebenar.
Gambar
Model dunia telah melakukan kerja yang hebat sekali lagi! LeCun dengan penuh semangat mengetweet semula ini selepas melihatnya.
Gambar
Mengikut kesan di atas, ini dibawakan oleh versi terbaru GAIA-1
Skala projek ini telah mencapai 9 bilion parameter Melalui latihan video memandu selama 4700 jam, ia telah berjaya dicapai video input, Manfaat paling langsung untuk menjana video memandu sendiri daripada teks atau operasi ialah ia boleh meramalkan peristiwa masa hadapan dengan lebih baik, dan lebih daripada 20 senario boleh disimulasikan, sekali gus meningkatkan lagi keselamatan pemanduan sendiri dan mengurangkan kos.
Gambar Pasukan kreatif kami secara terus terang menyatakan bahawa ini akan mengubah sepenuhnya peraturan permainan pemanduan autonomi!
Jadi bagaimana GAIA-1 dilaksanakan?
Semakin besar skala, semakin baik
Dengan memanfaatkan video, teks dan tindakan sebagai input, sistem boleh menjana video adegan pemanduan yang realistik dan boleh mengawal kawalan halus autonomi ke atas kenderaan ciri tingkah laku dan pemandangan
Video boleh dijana dengan hanya menggunakan gesaan teks
Gambar Prinsip modelnya adalah serupa dengan model bahasa besar, iaitu, meramalkan token seterusnya
Model boleh menggunakan pengkuantitian vektor bingkai video dan kemudian meramalkan adegan masa hadapan ditukar kepada meramalkan token seterusnya dalam jujukan. Model resapan kemudiannya digunakan untuk menjana video berkualiti tinggi daripada ruang bahasa model dunia.
Langkah-langkah khusus adalah seperti berikut:
GambarLangkah pertama mudah difahami, iaitu mengekod semula dan menyusun serta menggabungkan pelbagai input.
Dengan menggunakan pengekod khusus untuk mengekod pelbagai input dan menayangkan input berbeza ke dalam perwakilan bersama. Pengekod teks dan video mengasingkan dan membenamkan input, manakala perwakilan operasi diunjurkan secara individu menjadi perwakilan dikongsi
Perwakilan yang dikodkan ini konsisten secara sementara.
Selepas mengatur, bahagian utama model dunia muncul.
Sebagai Transformer autoregresif, ia boleh meramalkan set token imej seterusnya dalam jujukan. Dan ia bukan sahaja mengambil kira token imej sebelumnya, tetapi juga mengambil kira maklumat kontekstual teks dan operasi.
Kandungan yang dijana oleh model bukan sahaja mengekalkan ketekalan imej, tetapi juga konsisten dengan teks dan tindakan yang diramalkan
Pasukan memperkenalkan bahawa saiz model dunia dalam GAIA-1 ialah 6.5 bilion parameter dan telah dilatih pada 64 A100s selama 15 hari Menjadi.
Akhir sekali, gunakan penyahkod video dan model penyebaran video untuk menukar token ini kembali kepada video.
Kepentingan langkah ini adalah untuk memastikan kualiti semantik, ketepatan imej dan ketekalan temporal video
Penyahkod video GAIA-1 mempunyai skala 2.6 bilion parameter dan telah dilatih menggunakan 32 A100 selama 15 hari.
Perlu dinyatakan bahawa GAIA-1 bukan sahaja serupa dengan prinsip model bahasa berskala besar, tetapi juga menunjukkan ciri kualiti penjanaan yang lebih baik apabila skala model berkembang
GambarPasukan menyemak dikeluarkan sebelum ini Jun Versi awal dan kesan terkini dibandingkan
Yang terakhir adalah 480 kali lebih besar daripada yang pertama.
Anda boleh melihat secara intuitif bahawa butiran dan peleraian video telah dipertingkatkan dengan ketara.
GambarDari perspektif aplikasi praktikal, kemunculan GAIA-1 juga telah membawa sedikit impak bahawa ini akan mengubah peraturan pemanduan autonomi
Picture
Sebabnya boleh dijelaskan dari tiga aspek:
Kedua, data latihan juga sangat penting untuk pemanduan autonomi. AI Generatif boleh menyelesaikan salah satu cabaran senario ekor panjang yang dihadapi oleh pemanduan autonomi. Ia boleh mengendalikan lebih banyak senario kelebihan, seperti menghadapi pejalan kaki yang melintas jalan dalam cuaca berkabus. Ini akan meningkatkan lagi keupayaan pemanduan autonomi
Siapakah Wayve?
GAIA-1 telah dibangunkan oleh syarikat permulaan memandu sendiri British Wayve
Pengasasnya ialah Alex Kendall dan Amar Shah, kedua-duanya mempunyai PhD dalam pembelajaran mesin dari Universiti Cambridge
Gambar
# 🎜🎜#Pada laluan teknikal, seperti Tesla, Wayve menyokong penyelesaian visual semata-mata menggunakan kamera, meninggalkan peta berketepatan tinggi sangat awal dan mengikuti laluan "persepsi segera". Tidak lama dahulu, sebuah lagi model besar LINGO-1 yang dikeluarkan oleh pasukan turut menarik perhatian meluas
Model pemanduan autonomi ini boleh menjana ulasan dalam masa nyata semasa pemanduan, dengan itu dipertingkatkan lagi kebolehtafsiran model Pada Mac tahun ini, Bill Gates turut memandu uji dalam kereta pandu sendiri Wayve. PictureAlamat kertas: https://www.php.cn/link/4a08c14e fbf # 🎜🎜#Pautan rujukan:
[1]https://www.php.cn/link/85dca1d270f7f9aef00c9d372#f114🎜 https ://www.php.cn/link/a4c22565dfafb162a17a7c357ca9e0be
Atas ialah kandungan terperinci LeCun amat kecewa dengan penipuan unicorn memandu sendiri. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!