Rumah >Peranti teknologi >AI >Alumni Universiti Shanghai Jiao Tong memenangi kertas terbaik, dan anugerah untuk CoRL 2022, persidangan robotik teratas, diumumkan
Sejak pertama kali diadakan pada 2017, CoRL telah menjadi salah satu persidangan akademik terbaik dunia di persimpangan robotik dan pembelajaran mesin. CoRL ialah persidangan trek tunggal untuk penyelidikan pembelajaran robot, meliputi pelbagai topik seperti robotik, pembelajaran mesin dan kawalan, termasuk teori dan aplikasi.
Persidangan CoRL 2022 akan diadakan di Auckland, New Zealand, dari 14 hingga 18 Disember.
Persidangan ini menerima sebanyak 504 penyertaan, dan akhirnya menerima 34 kertas Lisan dan 163 kertas Poster kadar ialah 39%.
Pada masa ini, CoRL 2022 telah mengumumkan Anugerah Kertas Terbaik, Anugerah Kertas Sistem Terbaik, Anugerah Inovasi Khas, dsb. Anugerah. Kun Huang, ijazah sarjana dari Makmal GRASP Universiti Pennsylvania dan alumni Universiti Jiao Tong Shanghai, memenangi anugerah kertas terbaik pada persidangan itu.
Pemenang Anugerah Kertas Terbaik pada persidangan ini adalah kajian daripada University of Pennsylvania.
Ringkasan kertas: Selalunya, interaksi fizikal membantu mendedahkan maklumat yang kurang jelas, seperti kita mungkin menarik kaki meja untuk menilai Sama ada ia stabil atau bertukar botol air terbalik untuk memeriksa sama ada ia bocor, kajian itu mencadangkan tingkah laku interaktif ini boleh diperoleh secara automatik dengan melatih robot untuk menilai hasil percubaan robot untuk melakukan kemahiran. Penilaian ini, seterusnya, berfungsi sebagai IRF (fungsi ganjaran interaktif) yang digunakan untuk melatih dasar pembelajaran pengukuhan untuk melaksanakan kemahiran sasaran, seperti mengetatkan kaki meja. Tambahan pula, IRF boleh berfungsi sebagai mekanisme pengesahan untuk meningkatkan pelaksanaan tugas dalam talian walaupun selepas latihan penuh selesai. Untuk sebarang tugasan yang diberikan, latihan IRF adalah sangat mudah dan tidak memerlukan spesifikasi lanjut.
Keputusan penilaian menunjukkan bahawa IRF boleh mencapai peningkatan prestasi yang ketara dan malah melepasi garis dasar dengan akses kepada tunjuk cara atau ganjaran yang dibuat dengan teliti. Sebagai contoh, dalam gambar di bawah, robot mesti menutup pintu terlebih dahulu, dan kemudian memutarkan pemegang pintu simetri untuk mengunci pintu sepenuhnya.
Demonstrasi contoh penilaian penguncian pintu
Tujuan eksperimen berikut adalah untuk menggabungkan 3 Visual yang serupa blok disusun ke dalam menara yang stabil, dengan satu blok kecil nyata lebih berat daripada dua yang lain, jadi strategi terbaik adalah meletakkannya di bahagian bawah.
Demonstrasi contoh penilaian bertindan
Untuk menyemak keteguhan dan keluasan algoritma, kajian ini A D'Claw dengan 9 sendi digunakan untuk mengujinya dalam eksperimen mengetatkan robot sebenar. Tujuan tugasan ini adalah untuk memutarkan injap 4-cabang kira-kira 180° mengikut arah jam ke dalam keadaan yang diketatkan (garisan putih pada tapak injap).
Pengenalan pengarang
Terdapat tiga pengarang yang memenangi Anugerah Kertas Terbaik CoRL 2022 kali ini iaitu Kun Huang, Edward Hu, dan Dinesh Jayaraman.
Dinesh Jayaraman ialah penolong profesor di Makmal GRASP di Universiti Pennsylvania Beliau mengetuai kumpulan penyelidikan Persepsi, Tindakan dan Pembelajaran (PAL), yang khusus untuk persimpangan penglihatan komputer, pembelajaran mesin, dan penyelidikan masalah.
Kun Huang ialah sarjana Makmal GRASP di Universiti Pennsylvania dan mempelajari pembelajaran pengukuhan di bawah bimbingan Profesor Dinesh Jayaraman. Beliau menerima BS dalam Sains Komputer dari University of Michigan, di mana beliau bekerja pada persepsi robot dengan Profesor Dmitry Berenson. Kun Huang lulus dari Universiti Shanghai Jiao Tong dengan ijazah sarjana muda Minat penyelidikannya termasuk robotik dan aplikasi dunia sebenar. Kun Huang telah menjalani latihan di Waymo semasa ijazah sarjananya dan akan menyertai Cruise sebagai jurutera pembelajaran mesin selepas tamat pengajian.
Laman utama LinkedIn: https://www.linkedin.com/in/kun-huang-620034171/
Edward S. Hu I saya seorang pelajar kedoktoran di Makmal GRASP Universiti Pennsylvania, belajar di bawah Profesor Dinesh Jayaraman. Minat penyelidikan utama beliau termasuk pembelajaran peneguhan berasaskan model. Edward menerima ijazah sarjana dan sarjana muda dalam sains komputer dari University of Southern California, tempat beliau bekerja dalam pembelajaran pengukuhan dan peniruan dalam robot dengan Profesor Joseph J. Lim.
Sebanyak 3 kertas telah disenarai pendek untuk Anugerah Kertas Terbaik pada persidangan ini Selain kertas pemenang akhir, 2 kertas lagi adalah :
Pemenang Anugerah Kertas Sistem Terbaik pada persidangan ini adalah kajian daripada CMU dan UC Berkeley.
Abstrak kertas: Haiwan mampu menggunakan penglihatan untuk membuat pergerakan yang tepat dan tangkas, dan mereplikasi keupayaan ini telah menjadi matlamat lama robotik. Pendekatan tradisional adalah untuk memecahkan masalah kepada fasa pemetaan ketinggian dan perancangan tapak. Walau bagaimanapun, pemetaan ketinggian terdedah kepada gangguan dan bunyi kawasan besar, memerlukan perkakasan khusus dan tidak boleh dilaksanakan secara biologi.
Dalam makalah ini, penyelidik mencadangkan sistem pergerakan hujung ke hujung pertama yang mampu merentasi tangga, sekatan, batu loncatan, dan lompang dalam saiz sederhana, satu hadapan. ditunjukkan pada robot berkaki empat dengan kamera kedalaman. Oleh kerana saiz robot yang kecil, terdapat keperluan untuk menemui corak gaya berjalan khusus yang tidak ditemui di tempat lain. Kamera perlu menguasai strategi mengingati maklumat masa lalu untuk menganggar rupa bumi di belakang dan di bawahnya.
Para penyelidik melatih strategi robot dalam persekitaran simulasi. Latihan dibahagikan kepada dua peringkat: pertama menggunakan pembelajaran tetulang untuk melatih dasar mengenai varian imej dalam dengan kos pengiraan yang rendah, dan kemudian memperhalusinya menjadi dasar akhir menggunakan pembelajaran diselia mendalam.
Strategi yang terhasil boleh dipindahkan ke dunia sebenar dan boleh dijalankan dalam masa nyata pada kuasa pengkomputeran terhad robot itu. Ia boleh merentasi pelbagai rupa bumi sambil teguh kepada gangguan seperti permukaan licin dan rupa bumi berbatu.
Batu loncatan dan celah
Robot dapat melangkah ke atas bangku bar dalam pelbagai konfigurasi, melaraskan langkah panjang kepada Jurang yang berlebihan. Memandangkan tiada kamera berhampiran kaki belakang, robot perlu mengingati kedudukan bangku bar dan meletakkan kaki belakangnya dengan sewajarnya.
Tangga dan tepi jalan
Robot itu mampu memanjat sehingga 24 cm Tinggi, 30 cm lebar tangga. Strategi digunakan untuk tangga dan jalan yang berbeza di bawah pelbagai keadaan pencahayaan. Pada tangga yang tidak sekata, robot pada mulanya akan tersangkut, tetapi akhirnya akan dapat menggunakan tingkah laku memanjat untuk melepasi halangan ini.
Rupa bumi tidak berstruktur
Robot boleh melintasi kawasan yang bukan sebahagian latihannya Salah satu kategori, rupa bumi tidak berstruktur, menunjukkan keupayaan generalisasi sistem.
Pergerakan dalam gelap
Kamera kedalaman menggunakan cahaya inframerah untuk corak projek, menganggar kedalaman dengan tepat walaupun dalam cahaya persekitaran yang hampir tiada.
Keteguhan
Strategi melawan daya tinggi (melempar berat 5kg dari ketinggian) dan licin Permukaan (air dituangkan ke kepingan plastik) adalah teguh.
Pengenalan kepada pengarang
Item ini Kajian mempunyai empat orang pengarang.
Jitendra Malik kini ialah Profesor Arthur J. Chick di Jabatan Kejuruteraan Elektrik dan Sains Komputer di UC Berkeley termasuk penglihatan komputer, pemodelan pengiraan penglihatan manusia, grafik komputer dan biologi analisis imej, dsb.
Salah seorang pengarang kajian yang memenangi anugerah ini, Ashish Kumar, ialah pelajar kedoktorannya.
Deepak Pathak kini merupakan penolong profesor di Universiti Carnegie Mellon Beliau menerima PhD dari University of California, Berkeley, dan topik penyelidikannya termasuk pembelajaran mesin, robotik dan penglihatan komputer.
Ananye Agarwal, salah seorang pengarang kajian yang memenangi anugerah ini, ialah pelajar kedoktorannya.
Selain itu, Deepak Pathak mempunyai satu lagi kajian mengenai senarai pendek untuk Anugerah Kertas Sistem Terbaik pada persidangan ini.
Kali ini Persidangan itu juga memilih anugerah inovasi khas Penyelidikan ini telah disiapkan bersama oleh ramai penyelidik dari Google.
Ringkasan kertas: Model bahasa yang besar boleh mengekod sejumlah besar pengetahuan semantik tentang dunia, pengetahuan sedemikian sangat berguna untuk robot. Walau bagaimanapun, model bahasa mempunyai kelemahan kerana kurang pengalaman dengan dunia sebenar, yang menjadikannya sukar untuk memanfaatkan semantik untuk membuat keputusan mengenai tugasan yang diberikan.
Penyelidik dari Google mencadangkan untuk menyediakan asas dunia sebenar untuk model bahasa besar melalui kemahiran pra-latihan yang digunakan untuk mengekang model untuk menghasilkan bahasa semula jadi yang boleh dilaksanakan dan sesuai kontekstual. Robot boleh berfungsi sebagai "tangan dan mata" model bahasa, yang memberikan pengetahuan semantik peringkat tinggi tentang tugas itu. Kajian ini menunjukkan bagaimana kemahiran peringkat rendah boleh digabungkan dengan model bahasa yang besar supaya model bahasa menyediakan pengetahuan peringkat tinggi tentang proses yang melaksanakan arahan yang kompleks dan lanjutan masa, manakala fungsi nilai yang dikaitkan dengan kemahiran ini menyediakan cara untuk menyambung. pengetahuan ini kepada persekitaran fizikal tertentu yang diperlukan.
Penyelidik menggunakan prinsip ini apabila menggabungkan model bahasa besar (LLM) dengan tugas fizikal robot: selain membenarkan LLM hanya mentafsir arahan, anda juga boleh menggunakan Ia menilai kebarangkalian bahawa satu tindakan akan membantu menyelesaikan keseluruhan arahan peringkat tinggi. Ringkasnya, setiap tindakan boleh mempunyai perihalan bahasa dan kami boleh menggunakan model bahasa segera untuk membenarkan tindakan itu menjaringkan tindakan ini. Tambahan pula, jika setiap tindakan mempunyai fungsi kemampuan yang sepadan, adalah mungkin untuk mengukur kemungkinan kejayaannya daripada keadaan semasa (cth., fungsi nilai yang dipelajari). Hasil darab dua nilai kebarangkalian ialah kebarangkalian bahawa robot boleh berjaya menyelesaikan tindakan yang membantu arahan. Isih satu siri tindakan mengikut kebarangkalian ini dan pilih satu yang mempunyai kebarangkalian tertinggi.
Contoh di bawah menunjukkan robot sedang membantu mengambil sebiji epal:
Atas ialah kandungan terperinci Alumni Universiti Shanghai Jiao Tong memenangi kertas terbaik, dan anugerah untuk CoRL 2022, persidangan robotik teratas, diumumkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!