Rumah >Peranti teknologi >AI >Robot bahagian atas model besar OpenAI menunjukkan letupan pada kelajuan penuh!
Robot yang dikuasakan oleh model besar OpenAI akan datang lewat malam!
Nama ialah Rajah 01, ia boleh mendengar, bercakap dan bergerak secara fleksibel.
Dapat menerangkan semua yang anda lihat di hadapan anda:
Saya melihat sebiji epal merah di atas meja, dan terdapat beberapa pinggan dan cawan di atas rak penyaliran, anda berdiri di sebelahnya, dengan tangan anda perlahan-lahan meletakkannya di atas meja.
Gambar
Apabila manusia berkata "Saya mahu makan", saya segera menyerahkan epal itu.
Gambar
Dan saya mempunyai pemahaman yang jelas tentang apa yang saya lakukan, saya memberikan epal itu kerana ia adalah satu-satunya perkara yang boleh dimakan di atas meja.
Ia juga mengatur perkara dengan cara, dan boleh mengendalikan dua tugas pada masa yang sama.
Gambar
Yang paling penting ialah demonstrasi ini tidak dipercepatkan, pergerakan asal robot begitu pantas.
(Tiada sesiapa di belakang kemudi)
Kini netizen tidak dapat duduk diam dan segera @Boston Dynamics:
Orang tua, lelaki ini sangat teruja. Kita perlu kembali ke makmal dan biarkan robot lama (Boston Dynamics) menari sedikit lagi.
Gambar
Ada juga netizen yang menonton OpenAI melancarkan model bahasa besar dan video Vincent, dan kemudian membidas robot itu dan berkata dengan penuh emosi:
Ini adalah persaingan yang sengit dengan kerjasama OpenAI; melepasi tarikan Tesla.
Tetapi dari segi perkakasan, Optimus Prime nampak lebih cantik, Rajah 01 masih memerlukan sedikit "pembedahan kosmetik". (doge)
Gambar
Seterusnya, mari kita terus melihat butiran Rajah 01.
Menurut pengenalan pengasas, Rajah 01 boleh bercakap dengan manusia secara bebas melalui rangkaian neural hujung ke hujung.
Berdasarkan pemahaman visual dan keupayaan pemahaman bahasa yang disediakan oleh OpenAI, ia boleh menyelesaikan tindakan yang pantas, mudah dan cekap.
Model itu hanya dikatakan sebagai model bahasa visual yang besar Tidak diketahui sama ada ia adalah GPT-4V.
Gambar
Ia juga boleh merancang tindakan, mempunyai keupayaan ingatan jangka pendek, dan menerangkan proses penaakulannya dalam bahasa. .
Ia menggunakan model bahasa visual yang dilatih oleh OpenAI Kamera robot akan menangkap imej pada 10Hz, dan kemudian rangkaian saraf akan mengeluarkan 24 darjah gerakan kebebasan (pergelangan tangan + sudut sendi jari) pada 200Hz. Dari segi pembahagian kerja khusus, strategi robot juga hampir sama dengan manusia.
Tindakan kompleks diserahkan kepada model AI yang besar Model pra-latihan akan melakukan penaakulan akal pada imej dan teks dan memberi pelan tindakan Tindakan mudah seperti meraih beg plastik (anda boleh ambil di mana-mana sahaja), robot adalah berdasarkan visi yang dipelajari- Strategi pelaksanaan tindakan membolehkan anda membuat beberapa tindakan tindak balas pantas "bawah sedar". Pada masa yang sama, seluruh pengawal badan akan bertanggungjawab untuk mengekalkan keseimbangan badan dan pergerakan yang stabil. GambarKeupayaan suara robot diperhalusi berdasarkan model pertuturan teks yang besar.
PicturesSelain model AI yang paling maju, pengasas dan CEO Figure, syarikat di sebalik Rajah 01, turut menyebut dalam tweet bahawa Figure menyepadukan semua komponen utama robot.
Termasuk motor, sistem pengendalian perisian tengah, penderia, struktur mekanikal, dsb., semuanya direka oleh jurutera Rajah.
Difahamkan syarikat pemula robotik ini hanya mengumumkan kerjasama dengan OpenAI secara rasmi 2 minggu lalu, tetapi ia hanya membawa hasil yang begitu besar 13 hari kemudian. Ramai orang mula menantikan kerjasama seterusnya.
Gambar
Oleh itu, satu lagi bintang baharu dalam bidang kecerdasan yang diwujudkan telah menjadi tumpuan.
speaking angka, syarikat ini ditubuhkan pada tahun 2022. Seperti yang dinyatakan sebelum ini, ia sekali lagi menarik perhatian dari dunia luar. pusingan baharu AS$675 juta diperoleh dalam pembiayaan, dan penilaian mencecah AS$2.6 bilion Pelabur mengumpulkan hampir separuh daripada Silicon Valley, termasuk Microsoft, OpenAI, Nvidia, pengasas Amazon Bezos, dll.
Lebih penting, OpenAI turut mendedahkan rancangan untuk kerjasama selanjutnya dengan Rajah: memperluaskan keupayaan model besar berbilang modal kepada persepsi robot, penaakulan dan interaksi, "membangunkan robot humanoid yang boleh menggantikan manusia dalam kerja fizikal" .
Untuk menggunakan perbendaharaan kata teknologi yang paling hangat sekarang, kita perlu bekerjasama untuk membangunkan kecerdasan yang terkandung.
GambarPada masa itu, perkembangan terkini Rajah 01 adalah daripada Mak Cik Jiang:
Dengan menonton video demonstrasi manusia, Rajah 01 boleh belajar membuat kopi dengan mesin kopi kapsul dalam masa 10 jam sahaja latihan hingga akhir.
GambarSebaik sahaja kerjasama antara Figure dan OpenAI didedahkan kepada umum, netizen sudah penuh dengan harapan untuk penemuan masa depan.
GambarLagipun, Brett Adcock menulis di laman utama peribadinya bahawa "satu-satunya tumpuan ialah membina Tokoh dari perspektif 30 tahun untuk memberi kesan positif kepada masa depan umat manusia."
Tetapi mungkin tiada siapa yang dapat membayangkan bahawa dalam masa kira-kira dua minggu sahaja, kemajuan baru akan datang.
Sangat pantas, setakat ini. Dan ia boleh terus digeneralisasikan dan dikembangkan dalam skala.GambarPerlu dinyatakan bahawa maklumat pengambilan Figure dikeluarkan pada masa yang sama dengan demo tapak pengeboman:
Kami membawa robot humanoid ke dalam kehidupan. sertai kami.GambarPautan rujukan:
[1]https://www.php.cn/link/59bbfbe0d3922ccd1d167661a26d8353 34dce 15cda93287496c84af5203c
[3]https://www.php.cn/link/194585b5215aea447389c5fefca09c61
Atas ialah kandungan terperinci Robot bahagian atas model besar OpenAI menunjukkan letupan pada kelajuan penuh!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!