Rumah >Peranti teknologi >AI >Sony AI mengalahkan pelumba manusia terkemuka, menewaskan manusia sebanyak 1.5 saat

Sony AI mengalahkan pelumba manusia terkemuka, menewaskan manusia sebanyak 1.5 saat

WBOY
WBOYke hadapan
2023-04-09 08:21:021478semak imbas

Sony AI mengalahkan pelumba manusia terkemuka, menewaskan manusia sebanyak 1.5 saat

"Apa yang berlaku?" Emily Jones tidak percaya dia ketinggalan.

Emily Jones ialah pelumba permainan GT terkemuka yang telah memenangi pelbagai kejuaraan dia menampar stereng berdedikasi e-sukannya dan merenung skrin di hadapannya: "Saya mencuba yang terbaik, tetapi saya masih boleh'. Ikuti perkembangannya - bagaimana ia melakukannya? "

Dalam permainan Gran Turismo, Jones memandu keretanya pada kelajuan 120 batu sejam. Untuk bersaing dengan "pemain" terpantas di dunia, dia memandu pada kelajuan 140 dan 150 batu sejam.

"Pemain" ini sebenarnya adalah kecerdasan buatan bernama GT Sophy. Dikeluarkan oleh Makmal Penyelidikan Kecerdasan Buatan Sony pada tahun 2020, ia menggunakan teknologi kecerdasan buatan untuk mempelajari cara mengawal kereta dalam permainan GT. Sony mengadu AI dengan pelumba GT terkemuka pada satu siri acara tertutup pada tahun 2021.

Pada Julai 2021, Jones telah menyertai acara yang dianjurkan oleh Sony sebagai ahli pasukan e-sukan Trans Tasman Racing, tetapi pada masa itu dia tidak tahu apa yang diharapkan.

"Tiada sesiapa memberi saya apa-apa maklumat cuma memberitahu saya bahawa saya tidak perlu melakukan apa-apa latihan dan tidak perlu risau tentang masa pusingan," katanya. "Sikap saya juga sangat mudah. ​​Hanya rahsiakan. Ini pastinya bukan perkara yang buruk

Akhirnya, GT Sophy mengalahkan keputusan terbaik Jones dengan 1.5 saat - seorang pelumba manusia memecahkan GT." rekod Mereka pada asasnya diukur dalam milisaat, dan 1.5 saat bermakna perbezaan yang besar.

Tetapi Sony dengan cepat mengetahui bahawa kelajuan sahaja tidak mencukupi untuk menjadikan GT Sophy sebagai pemenang. Ia mengatasi prestasi pemandu manusia pada satu trek, memecahkan rekod pada tiga trek berbeza dengan hasil yang luar biasa.

Tetapi apabila Sony bersaing dengan beberapa pemandu manusia, ia kalah - perlumbaan berbilang pemain memerlukan bukan sahaja kelajuan, tetapi juga sejumlah kecerdasan. GT Sophy kadangkala dikenakan penalti kerana terlalu agresif dan melulu, dan pada masa lain terlalu malu, mengalah apabila tidak diperlukan.

Sony melatih semula AI dan menjalankan pusingan kedua pada Oktober 2021. Kali ini, GT Sophy dengan mudah mengalahkan pemain manusia. Apakah perubahan yang telah dilakukannya?

Pertama sekali, Sony telah membina rangkaian saraf yang lebih besar, dan prestasi program ini lebih berkuasa, tetapi perbezaan penting ialah GT Sophy telah mempelajari "etika trek".

Ketua Amerika Peter Warman () berkata bahawa etika ini dipatuhi secara meluas oleh pemandu manusia Intipatinya ialah keupayaan untuk mengimbangi pencerobohan dan konsesi, dan secara dinamik memilih tingkah laku yang paling sesuai dalam arena yang sentiasa berubah.

Inilah yang menjadikan GT Sophy lebih baik daripada permainan perlumbaan AI. Interaksi dan etika pemandu di landasan adalah contoh istimewa tingkah laku dinamik dan sedar konteks yang sepatutnya dimiliki oleh robot apabila berinteraksi dengan orang ramai, katanya.

Mengiktiraf masa untuk mengambil risiko dan masa untuk bermain selamat akan berguna untuk kecerdasan buatan, sama ada di tingkat pembuatan, di robot rumah atau dalam kereta pandu sendiri.

berkata: "Saya tidak fikir kita telah mempelajari prinsip umum bagaimana menangani norma manusia yang mesti dipatuhi. Tetapi ini adalah permulaan yang baik dan mudah-mudahan ia akan memberi kita sedikit gambaran tentang masalah ini. ."

GT Sophy hanyalah salah satu daripada banyak sistem AI yang telah mengalahkan manusia, daripada catur hingga StarCraft dan DOTA2, AI telah menewaskan pemain manusia terbaik di dunia. Tetapi permainan GT memberikan Sony cabaran baharu.

Tidak seperti permainan lain, terutamanya permainan berasaskan giliran, GT memerlukan pemain terbaik untuk mengawal kenderaan dalam masa nyata sambil menghampiri had fizik (kelajuan ultra-tinggi). Dalam pertandingan, semua pemain lain melakukan perkara yang sama.

Kereta lumba maya itu meluncur laju pada kelajuan 100 batu sejam, hanya beberapa inci dari tepi selekoh. Pada kelajuan ini, ralat kecil boleh menyebabkan perlanggaran.

Dilaporkan bahawa permainan GT terkenal kerana menangkap dan mereplikasi fizik dunia sebenar secara terperinci, meniru aerodinamik kereta dan geseran tayar di trek. Permainan ini kadangkala digunakan untuk melatih dan merekrut pelumba dunia sebenar.

"Ia melakukan kerja yang hebat dari segi realisme," kata Davide Scaramuzza, ketua Kumpulan Robotik dan Persepsi di Universiti Zurich di Switzerland Dia tidak terlibat dalam projek GT Sophy, tetapi pasukannya telah menggunakan permainan GT Untuk melatih pemandu kecerdasan buatan, ia belum lagi diuji pada manusia.

GT Sophy memainkan permainan secara berbeza daripada pemain manusia. Daripada membaca piksel pada skrin, ia mendapat data tentang kedudukannya sendiri di trek dan kedudukan kereta di sekelilingnya. Ia juga menerima maklumat tentang daya fizikal maya yang mempengaruhi kenderaannya.

Sebagai tindak balas, GT Sophy mengawal kereta untuk membelok atau brek. Interaksi antara GT Sophy dan permainan ini berlaku 10 kali sesaat, yang didakwa oleh rakan sekerjanya adalah serupa dengan masa reaksi pemain manusia.

Sony menggunakan pembelajaran tetulang untuk melatih GT Sophy dari awal melalui kaedah percubaan dan ralat. Pada mulanya, AI hanya boleh cuba mengekalkan kereta di jalan raya.

Tetapi selepas latihan menggunakan 10 PS4 (setiap satu menjalankan 20 contoh program), GT Sophy bertambah baik kepada tahap kecerdasan buatan terbina dalam GT yang setara dengan pemain amatur dalam masa kira-kira 8 jam. Dalam masa 24 jam, ia berada di bahagian atas papan pendahulu hasil terbaik 17,700 pemain manusia.

GT Sophy menghabiskan masa 9 hari untuk menurunkan masa pusingan. Pada akhirnya, ia lebih pantas daripada mana-mana pemain manusia.

Boleh dikatakan bahawa kecerdasan buatan Sony telah mempelajari cara memandu pada had yang dibenarkan oleh permainan dan menyelesaikan tindakan yang di luar kemampuan pemain manusia. Apa yang paling mengagumkan Jones ialah cara GT Sophy membelok, membrek lebih awal untuk memecut keluar dari selekoh dengan laluan yang lebih ketat.

Dia berkata: "GT Sophy mempunyai cara yang pelik untuk merawat penghalaan dan melakukan perkara yang tidak pernah saya fikirkan, contohnya GT Sophy sering memacu tayar ke dalam rumput di tepi trek ke atas." kemudian meluncur ke sudut. Kebanyakan orang tidak berbuat demikian kerana terlalu mudah untuk melakukan kesilapan. Ia seperti anda mengawal kemalangan. Beri saya seratus peluang, saya mungkin hanya berjaya sekali. ”

GT Sophy cepat memahami fizik permainan, tetapi masalah yang lebih besar ialah pengadil Dalam arena profesional, perlumbaan GT diawasi oleh pengadil manusia yang mempunyai kuasa untuk memotong mata untuk pemanduan berbahaya.

Mengumpul penalti merupakan sebab utama GT Sophy tewas pada pusingan pertama pada Julai 2021, walaupun lebih pantas daripada mana-mana pemandu manusia pada pusingan kedua beberapa bulan kemudian berbeza

Selepas menghabiskan beberapa tahun di GT Sophy terdapat gambar dua kereta berebut kedudukan di dinding di belakang mejanya "GT Sophy yang memotong Yamanaka," katanya, merujuk kepada bahagian atas Pemandu GT Jepun Tomoaki Yamanaka, salah satu daripada empat pelumba pro sim Jepun yang bersaing dengan GT Sophy pada tahun 2021.

Dia tidak ingat dari mana permainan ini berasal dari perlawanan Oktober 2021, Yamanaka mungkin akan menikmatinya itu kerana dia menghadapi lawan yang kuat tetapi adil Ini adalah acara Julai 2022, dan dia mungkin akan mengutuk komputer kerana tidak dapat difahami

Rakan sepasukan Yamanaka Takuma Miyazono secara ringkas menerangkan acara Julai 2022 kepada kami melalui perisian terjemahan Katanya. : “Ada beberapa kali kami tersingkir dari trek oleh (GT Sophy) kerana ia melakukan selekoh terlalu agresif. Ini membuatkan kami marah kerana pemain manusia akan memperlahankan kelajuan semasa selekoh untuk mengelak daripada keluar dari trek. "

berkata amat sukar untuk melatih AI untuk bermain adil tanpa kehilangan kelebihan daya saingnya. Pengadil manusia membuat panggilan subjektif yang bergantung pada persekitaran, menjadikannya sukar untuk menterjemahkannya kepada sesuatu yang boleh dipelajari oleh AI.

Penyelidik Sony cuba memberikan AI banyak isyarat berbeza untuk memanggil dan menyesuaikannya, dengan harapan dapat mencari kombinasi yang berkesan Jika ia terkeluar dari landasan atau melanggar pagar, menyebabkan perlanggaran kenderaan atau mungkin dihukum oleh pengadil, maka ia akan dihukum

Sony juga telah meningkatkan persaingan yang dihadapi oleh GT Sophy dalam latihan Sebelum ini, ia terutamanya berlatih melawan versi lama sebelum perlawanan semula pada Oktober 2021, Sony akan jemput pemandu GT teratas setiap minggu untuk membantu menguji kecerdasan buatan, dan kemudian melaraskan keputusan secara komprehensif "Ini memberi kami maklum balas yang kami perlukan untuk membuat pelarasan yang betul antara pencerobohan dan konsesi," kata.

Ia berjaya Tiga bulan kemudian, apabila Miyazono berlumba dengan GT Sophy, prestasi agresif yang terakhir telah hilang - tetapi ia bukan sekadar menahan “Apabila dua kereta memasuki satu sudut sebelah menyebelah, GT Sophy meninggalkan ruang yang mencukupi untuk pemandu manusia lalu,” katanya. “Ia membuatkan anda berasa seperti berlumba dengan manusia lain. "

Dia menambah: "Pelumba mendapat keghairahan dan keseronokan yang berbeza apabila berdepan dengan reaksi seperti ini. Ini sangat mengagumkan saya. "

Saya amat kagum dengan hasil kerja Sony. Dia berkata: "Kami menggunakan keupayaan manusia untuk mengukur kemajuan teknologi robotik. ” Bagaimanapun, rakan sekerjanya Elia Kaufman menegaskan bahawa masih penyelidik manusia yang mendominasi latihan tingkah laku pembelajaran GT Sophy

"Etika trek yang baik diajar oleh manusia Kecerdasan buatan," katanya. "Ia akan. menjadi sangat menarik jika ini boleh dilakukan secara automatik. "Mesin sebegini bukan sahaja akan mempunyai gelagat trek yang baik, tetapi yang lebih penting, ia boleh memahami apa itu gelagat trek dan dapat mengubah tingkah lakunya untuk menyesuaikan diri dengan tetapan baharu. Pasukan

kini sedang mengusahakannya. Kereta lumba GT , digunakan untuk pertandingan dron dunia sebenar, menggunakan input video mentah dan bukannya data simulasi untuk melatih kecerdasan buatan untuk terbang Pada Jun 2022, mereka menjemput dua juruterbang dron peringkat kejohanan untuk bersaing dengan komputer 🎜>Dia berkata: “Wajah mereka selepas melihat permainan AI kami menyatakan semuanya. Mereka terkejut. ”

Dia percaya bahawa kemajuan sebenar dalam robotik mesti meluas ke dunia sebenar. "Selalunya akan ada ketidakpadanan antara simulasi dan dunia sebenar," katanya "Itu sesuatu yang dilupakan apabila orang bercakap tentang kemajuan luar biasa dalam AI. Dari segi strategik, Ya. Tetapi dari segi penggunaan ke dalam yang sebenar. dunia, kita masih jauh."

Buat masa ini, Sony masih berkeras untuk menggunakan teknologi itu hanya dalam permainan. Ia merancang untuk menggunakan GT Sophy dalam versi permainan GT yang akan datang. "Kami mahu ini menjadi sebahagian daripada produk," kata Peter Stone, pengarah eksekutif syarikat itu. "Sony ialah syarikat hiburan dan kami berharap ini menjadikan permainan ini lebih menyeronokkan."

Jones percaya seluruh komuniti perlumbaan sim boleh belajar banyak apabila orang ramai berpeluang menonton GT Sophy di belakang pemandu. "Di banyak trek, kami akan mendapati bahawa banyak teknik pemanduan yang telah digunakan selama bertahun-tahun adalah cacat, dan sebenarnya terdapat kaedah yang lebih pantas." , seperti yang telah ditunjukkan bahawa ini boleh dicapai. "Jika garis dasar berubah, kemahiran semua orang bertambah baik," kata Jones

Atas ialah kandungan terperinci Sony AI mengalahkan pelumba manusia terkemuka, menewaskan manusia sebanyak 1.5 saat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam