Heim >Technologie-Peripheriegeräte >KI >Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

PHPzOriginal: 2024-08-09 16:01:321683Durchsuche

Tetapi mungkin anda tidak boleh mengalahkan lelaki tua di taman?

Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong.

Tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif.

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

Alamat kertas: https://arxiv.org/pdf/2408.03906

Sejauh manakah robot DeepMind ini bermain pingpong? Mungkin setanding dengan pemain amatur manusia:

Kedua-dua pukulan depan dan kilas:

Pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh menahannya:

servis putaran berbeza :

Namun, saingan nampaknya tidak sehebat pertarungan antara lelaki tua di taman itu.

Untuk robot, pingpong memerlukan penguasaan kemahiran peringkat rendah yang kompleks dan permainan strategik, dan memerlukan latihan jangka panjang. DeepMind percaya bahawa strategi yang tidak optimum tetapi boleh melaksanakan kemahiran tahap rendah dengan cekap mungkin merupakan pilihan yang lebih baik. Ini membezakan pingpong daripada permainan strategik semata-mata seperti catur dan Go.

Oleh itu, pingpong ialah penanda aras yang berharga untuk meningkatkan keupayaan robot, termasuk pergerakan berkelajuan tinggi, membuat keputusan tepat dan strategik masa nyata, reka bentuk sistem dan persaingan langsung dengan lawan manusia.

Untuk ini, ketua saintis Google DeepMind memuji: "Robot pingpong akan membantu kami menyelesaikan masalah kawalan dan persepsi berkelajuan tinggi

Kajian itu menjalankan 29 permainan pingpong antara robot dan manusia, termasuk Bot." memenangi 45% daripada masa (13/29). Semua pemain manusia adalah pemain yang tidak pernah dilihat oleh robot sebelum ini, dari segi kebolehan daripada pemula hingga pemain kejohanan.

Sementara bot itu tewas semua perlawanannya menentang pemain peringkat tertinggi, ia memenangi 100% perlawanannya menentang pemula dan 55% perlawanannya menentang pemain pertengahan, menunjukkan prestasi seorang amatur manusia.

Secara keseluruhannya, sumbangan penyelidikan ini termasuk:

Mencadangkan seni bina dasar hierarki dan modular yang merangkumi:
pengawal peringkat rendah dan deskriptor kemahiran terperinci mereka yang berguna untuk Keupayaan dan ejen adalah model. membantu merapatkan jurang antara simulasi dan realiti;
Pilih pengawal peringkat tinggi dengan kemahiran peringkat rendah.
Teknologi untuk melaksanakan simulasi sampel sifar kepada realiti, termasuk mentakrifkan kaedah berulang berdasarkan pengagihan tugas dunia sebenar dan mentakrifkan kurikulum automatik.
Menyesuaikan diri dengan lawan yang tidak kelihatan dalam masa nyata.

Pengenalan kaedah

Ejen terdiri daripada perpustakaan kemahiran peringkat rendah dan pengawal peringkat tinggi. Kumpulan kemahiran peringkat rendah memfokuskan pada aspek tertentu pingpong, seperti pukulan atas pukulan depan, sasaran pukulan kilas atau servis pukulan depan. Selain menggabungkan strategi latihan, kajian ini juga mengumpul dan menyimpan maklumat di luar talian dan dalam talian tentang kekuatan, kelemahan dan batasan setiap kemahiran peringkat rendah. Pengawal peringkat tinggi yang bertanggungjawab untuk menyelaraskan kemahiran peringkat rendah akan memilih kemahiran terbaik berdasarkan statistik permainan semasa dan penerangan kemahiran.

Selain itu, kajian itu juga mengumpul sejumlah kecil data permainan sparring manusia dan manusia sebagai benih untuk keadaan tugas awal Set data termasuk maklumat kedudukan, kelajuan dan putaran. Ejen itu kemudiannya dilatih dalam persekitaran simulasi menggunakan pembelajaran pengukuhan dan menggunakan beberapa teknik sedia ada untuk menggunakan dasar dengan lancar kepada perkakasan sebenar.

Ejen bermain dengan manusia untuk menjana lebih banyak data latihan Apabila robot terus belajar, standard permainan menjadi lebih kompleks, membolehkan ejen mempelajari tindakan yang lebih dan lebih kompleks. Gelung "simulasi-realiti" hibrid ini mencipta pengajaran automatik yang membolehkan kemahiran robot bertambah baik dari semasa ke semasa.

Mehrschichtige Kontrolle

Die geschichtete Kontrolle umfasst hauptsächlich die folgenden Teile:

Tischtennis-Spielstil: Der High-Level-Controller (HLC, High-Level-Controller) entscheidet zunächst, welcher Spielstil verwendet werden soll (Vorhand oder Rückhand);
Anpassung: Behalten Sie die Präferenz (H-Wert) jedes HLC online bei, basierend auf Statistiken aus Spielen gegen Gegner.
Wählen Sie die effektivste Fähigkeit aus: HLC-Paare in der engeren Wahl. Stichprobe durch LLC;
Updates: H-Werte und Gegnerstatistiken werden bis zum Ende des Spiels aktualisiert.

Ergebnisse

Die Forscher verglichen das Mittel mit 29 Tischtennisspielern unterschiedlichen Niveaus, darunter Anfänger, Mittelstufe, Fortgeschrittene und Fortgeschrittene + Fähigkeiten. Menschliche Spieler spielten drei Spiele gegen den Roboter nach den Standard-Tischtennisregeln, die Regeln wurden jedoch leicht geändert, da der Roboter nicht in der Lage war, aufzuschlagen.

Bei allen Gegnern gewann der Roboter 45 % der Spiele und 46 % der Spiele. Aufgeschlüsselt nach Fähigkeitsniveau gewann der Bot alle seine Spiele gegen Anfänger, verlor alle seine Spiele gegen fortgeschrittene und Fortgeschrittene+-Spieler und gewann 55 % seiner Spiele gegen fortgeschrittene Spieler. Dies zeigt, dass der Agent in Tischtennisrunden das Niveau eines fortgeschrittenen menschlichen Spielers erreicht.

Der Grund, warum Roboter fortgeschrittene Spieler nicht schlagen können, liegt in physischen und technischen Einschränkungen, einschließlich Reaktionsgeschwindigkeit, Kameraerkennungsfähigkeiten, Rotationsverarbeitung usw., die in einer Simulationsumgebung nur schwer genau modelliert werden können.

Sparring mit Robotern ist auch sehr attraktiv

Untersuchungsteilnehmer gaben an, dass ihnen das Spielen mit Robotern sehr viel Spaß machte und gaben den Robotern hohe Bewertungen in Bezug auf „interessant“ und „attraktiv“. Sie äußerten auch einstimmig, dass sie „sehr bereit“ seien, erneut gegen den Roboter zu kämpfen. In der Freizeit spielten sie durchschnittlich 4 Minuten und 06 Sekunden über 5 Minuten mit dem Roboter.

Der Roboter ist nicht gut im Unterschnitt.

Der Teilnehmer mit den besten Fähigkeiten erwähnte, dass der Roboter nicht gut im Umgang mit Unterschnitt ist. Um diese Beobachtung zu testen, zeichneten die Forscher die Landegeschwindigkeit des Roboters im Vergleich zum Spin des Balls auf. Die Ergebnisse zeigten, dass die Landegeschwindigkeit des Roboters deutlich abnahm, je mehr Backspin-Bälle ihm gegenüberstanden. Dieser Fehler liegt zum einen daran, dass der Roboter beim Umgang mit niedrigen Bällen versucht, eine Kollision mit dem Tisch zu vermeiden, und zum anderen daran, dass es wirklich schwierig ist, den Spin des Balls in Echtzeit zu bestimmen.

Referenzlink:

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1

Das obige ist der detaillierte Inhalt vonDer DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

架构循环 table https

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Wird spekulatives Sampling die Inferenzgenauigkeit großer Sprachmodelle verlieren?Nächster Artikel：Wird spekulatives Sampling die Inferenzgenauigkeit großer Sprachmodelle verlieren?

In Verbindung stehende Artikel

Mehr sehen