Rumah >Peranti teknologi >AI >'Rahsia' pelaksanaan robot: pembelajaran berterusan, pemindahan pengetahuan dan penyertaan autonomi
Artikel ini diterbitkan semula daripada Lei Feng.com Jika anda perlu mencetak semula, sila pergi ke tapak web rasmi Lei Feng.com untuk memohon kebenaran.
Pada 23 Mei 2022, ICRA 2022 (IEEE International Conference on Robotics and Automation), persidangan antarabangsa tahunan teratas dalam bidang robotik, telah diadakan seperti yang dijadualkan di Philadelphia, Amerika Syarikat.
Ini adalah tahun ke-39 ICRA. ICRA ialah persidangan perdana Persatuan Robotik dan Automasi IEEE dan forum antarabangsa utama untuk penyelidik robotik membentangkan dan membincangkan kerja mereka.
Di ICRA tahun ini, tiga daripada ketua pakar robotik Amazon, Sidd Srinivasa, Tye Brady dan Philipp Michel, membincangkan secara ringkas cabaran membina sistem robotik untuk interaksi manusia-mesin di dunia nyata.
Kapsyen: Dari kiri ke kanan ialah Sidd Srinivasa, pengarah kecerdasan buatan untuk Amazon Robotics, Tye Brady, ketua pakar teknologi di Amazon Robotics (Global), dan pengurus kanan sains gunaan di Amazon Scout Philipp MichelSidd
Srinivasa ialah pakar robotik yang terkenal di dunia, IEEE Fellow, kini merupakan Profesor Terhormat di Boeing di University of Washington, dan ketua Projek Kepintaran Buatan Robot Amazon bertanggungjawab untuk mengurus algoritma robot autonomi yang membantu pekerja pusat logistik Amazon Penyelidikan robot yang boleh mengambil dan membungkus produk dan robot gaya troli yang boleh mengangkat, memunggah dan mengangkut barang secara autonomi.
Tye Brady ialah ketua pakar teknikal Amazon Robotics (global) dan mempunyai ijazah sarjana dalam kejuruteraan aeroangkasa daripada MIT. Philipp Michel dan Sidd Srinivasa adalah alumni kedoktoran Institut Robotik CMU dan merupakan pengurus kanan projek robot Pengakap Amazon.
Mereka mengemukakan pendapat mereka sendiri tentang menyelesaikan cabaran pelaksanaan robot. Kajian teknologi AI telah disusun tanpa mengubah maksud asalnya, seperti berikut:
S: Penyelidikan anda dalam bidang robotik menyelesaikan masalah yang berbeza?
Sidd Srinivasa: Kesukaran penting dalam penyelidikan robotik ialah kita hidup dalam dunia terbuka. Kami tidak tahu apa yang akan dihadapi oleh "input". Di pusat pemenuhan kami, saya mempunyai lebih 20 juta item untuk dikawal, dan bilangan item meningkat ratusan setiap hari. Selalunya, robot kami tidak tahu apa barang yang mereka ambil, tetapi mereka perlu mengambilnya dengan berhati-hati dan membungkusnya dengan cepat tanpa merosakkannya.
Philipp Michel: Bagi Scout, kesukarannya ialah objek yang ditemui di kaki lima dan persekitaran pengangkutan. Kami mempunyai kemudahan penghantaran persendirian yang digunakan di empat negeri di seluruh Amerika Syarikat. Keadaan cuaca, keadaan pencahayaan... jelas dari awal bahawa kami terpaksa berhadapan dengan sejumlah besar pembolehubah untuk membolehkan robot menyesuaikan diri dengan persekitaran yang kompleks.
Tye Brady: Dalam proses membangunkan robot pelaksanaan, kami mempunyai kelebihan yang ketara, iaitu beroperasi dalam persekitaran separa berstruktur. Kami boleh membuat peraturan lalu lintas kami sendiri untuk robot, dan memahami alam sekitar benar-benar membantu saintis dan jurutera kami memperoleh pemahaman yang mendalam tentang objek yang ingin kami gerakkan, manipulasi, klasifikasikan dan kenal pasti untuk memenuhi pesanan. Dalam erti kata lain, kita boleh merealisasikan mengejar teknologi di dunia sebenar.
Philipp Michel: Satu lagi persamaan yang kami ada ialah kami sangat bergantung pada pembelajaran daripada data untuk menyelesaikan masalah. Scout menerima data dunia sebenar semasa ia menjalankan tugas dan kemudian secara berulang membangunkan penyelesaian pembelajaran mesin untuk persepsi, penyetempatan dan navigasi.
Sidd Srinivasa: Saya sangat bersetuju (belajar daripada data untuk menyelesaikan masalah). Saya fikir pembelajaran mesin dan kawalan penyesuaian adalah kunci kepada penskalaan super-linear. Jika kita menggunakan beribu-ribu robot, kita tidak boleh mempunyai beribu-ribu saintis dan jurutera yang bekerja pada mereka. Kita perlu bergantung pada data dunia sebenar untuk mencapai pertumbuhan super-linear.
Selain itu, saya rasa dunia terbuka akan memaksa kita untuk berfikir tentang cara "continuous learning". Model pembelajaran mesin kami sering dilatih berdasarkan beberapa pengagihan data input, tetapi kerana ini adalah dunia terbuka, kami akan menghadapi masalah "anjakan kovariat", iaitu, data yang kami lihat tidak sepadan dengan pengedaran , yang menyebabkan mesin model pembelajaran sering menjadi terlalu yakin tanpa sebab.
Jadi, banyak kerja yang kami lakukan ialah mencipta "anjing pemerhati" (anjing pemerhati, peranti penyeliaan) yang mengenal pasti apabila pengedaran data input menyimpang daripada pengedaran yang dilatih. Kemudian, kami melakukan "pensampelan kepentingan" supaya kami boleh memilih data yang telah berubah dan melatih semula model pembelajaran mesin.
Philipp Michel: Ini adalah salah satu sebab mengapa kami ingin melatih robot di tempat yang berbeza, supaya kami dapat mengetahui lebih awal tentang data kehidupan sebenar yang mungkin dihadapi oleh robot, yang seterusnya memaksa kami untuk Membangunkan penyelesaian yang menangani data baharu.
Sidd Srinivasa: Ini sememangnya idea yang bagus. Salah satu kelebihan mempunyai berbilang robot ialah keupayaan sistem untuk mengenali kandungan yang diubah, melatih semula, dan kemudian berkongsi pengetahuan ini dengan robot lain.
Fikirkan cerita tentang robot pengisihan: Di sudut dunia, robot menemui jenis pembungkusan baharu. Pada mulanya, ia bermasalah kerana ia tidak pernah melihat perkara seperti ini sebelum ini dan tidak dapat mengenalinya. Kemudian penyelesaian baharu muncul: robot yang boleh menghantar jenis pembungkusan baharu kepada semua robot di dunia. Dengan cara itu, apabila jenis pembungkusan baharu ini muncul di tempat lain, robot lain akan tahu apa yang perlu dilakukan dengannya. Ia sama dengan mempunyai "sandaran". Apabila data baharu muncul pada satu titik, titik lain akan mengetahuinya, kerana sistem telah dapat melatih semula dirinya dan berkongsi maklumat.
Philipp Michel: Robot kami melakukan perkara yang serupa. Jika robot kami menghadapi halangan baharu yang tidak pernah mereka temui sebelum ini, kami cuba melaraskan model untuk mengecam dan menangani halangan ini, dan kemudian menggunakan model baharu kepada semua robot.
Salah satu perkara yang membuatkan saya terjaga pada waktu malam ialah idea bahawa robot kami akan menemui objek baharu di kaki lima yang tidak akan mereka temui lagi untuk tiga tahun akan datang, contohnya: orang di kaki lima Gargoyles digunakan untuk menghiasi rumput untuk Halloween, atau orang meletakkan payung di atas meja berkelah untuk menjadikannya kelihatan kurang seperti "meja berkelah." Dalam kes ini, semua algoritma pembelajaran mesin gagal mengenali bahawa ini adalah jadual berkelah.
Jadi sebahagian daripada penyelidikan kami juga adalah tentang cara mengimbangi perkara biasa yang tidak perlu dijerat dengan kategori perkara tertentu. Jika ini penutup lurang terbuka, robot mesti pandai mengenal pasti, jika tidak, ia akan jatuh. Tetapi jika ia hanya kotak rawak, kita mungkin tidak perlu mengetahui hierarki kotak itu, cuma ini adalah objek yang ingin kita jalan-jalan.
Sidd Srinivasa: Cabaran lain ialah apabila anda menukar model anda, mungkin terdapat akibat yang tidak diingini. Model yang diubah mungkin tidak menjejaskan persepsi robot, tetapi ia mungkin mengubah cara robot "brek", menyebabkan galas bebola haus selepas dua bulan. Dalam sistem hujung ke hujung, banyak penyelidikan masa depan yang menarik adalah mengenai "memahami kesan perubahan dalam bahagian sistem terhadap prestasi keseluruhan sistem."
Philipp Michel: Kami menghabiskan banyak masa memikirkan sama ada kami harus membahagikan bahagian yang berlainan pada susunan robot. Integrasi antara mereka boleh membawa banyak faedah, tetapi ia juga terhad. Satu kes yang melampau ialah pembelajaran kamera-ke-motor-ke-torsi, yang sangat mencabar dalam mana-mana aplikasi robotik dunia sebenar. Kemudian terdapat timbunan robotik tradisional, yang dibahagikan dengan baik kepada bahagian seperti penyetempatan, persepsi, perancangan dan kawalan.
Kami juga menghabiskan banyak masa memikirkan tentang cara timbunan itu perlu berkembang dari semasa ke semasa, dan apakah peningkatan prestasi yang ada apabila merapatkan bahagian ini? Pada masa yang sama, kami mahu mempunyai sistem yang kekal boleh ditafsirkan sebaik mungkin. Kami cuba memaksimumkan penyepaduan komponen pembelajaran yang memanfaatkan keseluruhan timbunan sambil mengekalkan kebolehtafsiran dan bilangan ciri keselamatan.
Sidd Srinivasa: Ini adalah perkara yang bagus, saya bersetuju sepenuhnya dengan Philipp bahawa tidak semestinya betul menggunakan satu model untuk mengawal semua model. Tetapi selalunya, kami akhirnya membina model pembelajaran mesin yang berkongsi tulang belakang dengan berbilang kepala yang digunakan. Apakah objek dan apakah maksud membahagikan objek? Ia mungkin sesuatu seperti memilih, menyusun atau mengemas, tetapi masing-masing memerlukan kepala khusus, menunggang tulang belakang yang pakar dalam tugas.
Philipp Michel: Beberapa faktor yang kami pertimbangkan ialah bateri, julat, suhu, ruang dan kekangan pengkomputeran. Jadi kita perlu cekap dengan model kita, mengoptimumkan model dan cuba memanfaatkan tulang belakang yang dikongsi sebanyak mungkin, seperti yang Sidd sebutkan, ketua yang berbeza untuk tugasan yang berbeza.
Kapsyen: Amazon Scout ialah robot penghantaran autonomi yang boleh bergerak pada kelajuan berjalan di kaki lima awam dan kini sedang menjalani ujian lapangan di empat negeri di Amerika Syarikat.
S: Apabila saya bertanya tentang persamaan antara projek anda, satu perkara yang terlintas di fikiran ialah robot anda semuanya berfungsi dalam persekitaran yang sama seperti manusia. Mengapa ini merumitkan isu?
Sidd Srinivasa: Robot menghampiri kehidupan manusia, dan kita mesti menghormati semua interaksi kompleks yang berlaku di dunia manusia. Selain berjalan, memandu, dan melaksanakan tugas, terdapat juga interaksi sosial yang kompleks. Apa yang penting bagi robot ialah, pertama, sedar dan, kedua, terlibat.
Sangat sukar, apabila anda memandu, kadangkala sukar untuk memberitahu apa yang orang lain fikirkan dan memutuskan cara bertindak berdasarkan apa yang mereka fikirkan. Sekadar penaakulan tentang masalah itu sukar, dan kemudian menutup gelung adalah lebih sukar.
Jika robot sedang bermain catur atau bermain menentang manusia, adalah lebih mudah untuk meramalkan apa yang akan mereka lakukan kerana peraturan telah disusun dengan baik. Jika anda menganggap lawan anda adalah optimum, anda akan melakukannya dengan baik walaupun mereka tidak optimum. Ini dijamin dalam beberapa permainan dua pemain.
Tetapi keadaan sebenar tidak seperti ini Apabila kita bermain permainan koperasi ini yang memastikan situasi menang-menang, kita dapati sebenarnya sukar untuk diramal dengan tepat semasa permainan, walaupun rakan usaha sama mempunyai niat yang baik. .
Philipp Michel: Dan tingkah laku dunia manusia banyak berubah. Sesetengah haiwan peliharaan mengabaikan robot sepenuhnya, dan beberapa haiwan peliharaan akan berjalan ke arah robot. Perkara yang sama berlaku untuk pejalan kaki, dengan sesetengahnya menutup mata terhadap robot dan yang lain berjalan ke arahnya. Kanak-kanak, khususnya, sangat ingin tahu dan sangat interaktif, dan kita perlu dapat mengendalikan semua situasi dengan selamat, dan kebolehubahan ini menjadikannya menarik.
Atas ialah kandungan terperinci 'Rahsia' pelaksanaan robot: pembelajaran berterusan, pemindahan pengetahuan dan penyertaan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!