하지만 공원에 있는 노인을 이길 수는 없을까요?
파리올림픽이 본격화되면서 탁구가 많은 주목을 받고 있습니다. 동시에 로봇은 탁구 경기에서도 새로운 돌파구를 마련했습니다.
방금 DeepMind는 탁구 경기에서 인간 아마추어 선수 수준에 도달할 수 있는 최초의 학습 로봇 에이전트를 제안했습니다.

문서 주소: https://arxiv.org/pdf/2408.03906
이 DeepMind 로봇은 탁구를 얼마나 잘 치나요? 아마도 인간 아마추어 선수들과 동등할 것입니다:

포핸드와 백핸드 모두:

상대는 다양한 플레이 스타일을 사용하고 로봇도 이를 견딜 수 있습니다.

다양한 스핀으로 서브 받기 :

그러나 경쟁은 공원 노인들의 싸움만큼 치열하지 않은 것 같습니다.
로봇에게 탁구는 복잡한 저레벨 기술과 전략적인 게임 플레이를 익히는 것이 필요하며, 장기적인 훈련이 필요합니다. DeepMind는 차선책이지만 낮은 수준의 기술을 능숙하게 수행할 수 있는 전략이 더 나은 선택일 수 있다고 믿습니다. 이것이 체스나 바둑 같은 순수 전략 게임과 탁구를 구별하는 점입니다.
따라서 탁구는 고속 이동, 실시간 정밀하고 전략적인 의사결정, 시스템 설계, 인간 상대와의 직접적인 경쟁 등 로봇 능력 향상을 위한 귀중한 벤치마크입니다.
이에 대해 Google DeepMind의 수석 과학자는 "탁구 로봇은 고속 제어 및 인식 문제를 해결하는 데 도움이 될 것입니다."라고 칭찬했습니다.

이 연구는 Bots를 포함하여 로봇과 인간 간의 29가지 탁구 게임을 수행했습니다. 45%의 확률로 승리했습니다(13/29). 모든 인간 플레이어는 초보자부터 토너먼트 플레이어에 이르기까지 로봇이 이전에 본 적이 없는 플레이어였습니다.
최상급 플레이어를 상대로는 전 경기에서 패했지만, 초심자 상대로는 100%, 중급자 상대로는 55% 승리하며 인간 아마추어의 활약을 펼쳤습니다.
전반적으로 이 연구의 기여는 다음과 같습니다.
다음을 포함하는 계층적 및 모듈식 정책 아키텍처 제안:
다음에 유용한 하위 수준 컨트롤러 및 자세한 기술 설명 에이전트의 기능은 모델링되고 시뮬레이션과 현실 사이의 격차를 줄이는 데 도움이 됩니다.
낮은 수준의 기술을 갖춘 높은 수준의 컨트롤러를 선택하세요.
실제 작업 분포를 기반으로 한 반복 방법 정의, 자동 커리큘럼 정의 등 제로 샘플 시뮬레이션을 현실로 구현하는 기술입니다.
보이지 않는 상대에게 실시간으로 적응하세요.
방법 소개
에이전트는 낮은 수준의 스킬 라이브러리와 높은 수준의 컨트롤러로 구성됩니다. 낮은 수준의 스킬 풀은 포핸드 톱스핀, 백핸드 조준 또는 포핸드 서브와 같은 탁구의 특정 측면에 중점을 둡니다. 훈련 전략을 통합하는 것 외에도, 연구는 또한 각 하위 수준 기술의 강점, 약점 및 한계에 대한 정보를 오프라인과 온라인으로 수집하고 저장합니다. 하위 레벨 스킬 조정을 담당하는 상위 컨트롤러는 현재 게임 통계 및 스킬 설명을 기반으로 최고의 스킬을 선택합니다.
또한 연구에서는 초기 작업 조건의 시드로 소량의 인간 및 인간 대련 게임 데이터도 수집했습니다. 데이터 세트에는 위치, 속도 및 회전 정보가 포함됩니다. 그런 다음 강화 학습을 사용하여 시뮬레이션된 환경에서 에이전트를 훈련하고, 일부 기존 기술을 사용하여 정책을 실제 하드웨어에 원활하게 배포합니다.

에이전트는 더 많은 훈련 데이터를 생성하기 위해 인간과 함께 플레이합니다. 로봇이 계속 학습할수록 게임 표준은 점점 더 복잡해지며 에이전트는 점점 더 복잡한 동작을 학습할 수 있습니다. 이 하이브리드 "시뮬레이션-현실" 루프는 시간이 지남에 따라 로봇의 기술을 향상시킬 수 있는 자동화된 교육을 생성합니다.

Layered control
Layered control은 주로 다음과 같은 부분을 포함합니다:
탁구 플레이 스타일: 상위 수준 컨트롤러(HLC, 상위 수준 컨트롤러)는 먼저 사용할 플레이 스타일(포핸드 또는 상위 컨트롤러)을 결정합니다. 백핸드);
조정: 상대방과의 경기 통계를 기반으로 온라인에서 각 HLC의 선호도(H 값)를 유지합니다.
가장 효과적인 기술 선택: LLC가 조정한 H 값 샘플링을 기반으로 HLC가 후보에 오른 선수를 연결합니다.
- 업데이트: H 값과 상대 통계는 게임이 끝날 때까지 업데이트됩니다.

Results
연구진은 초급, 중급, 고급, 고급 + 기술을 포함하여 다양한 수준의 탁구 선수 29명과 에이전트를 비교했습니다. 인간 선수들은 표준 탁구 규칙에 따라 로봇을 상대로 세 게임을 펼쳤으나 로봇이 서브를 할 수 없어 규칙이 약간 수정되었습니다. 모든 상대와 대결하여 로봇은 45%의 경기와 46%의 게임을 승리했습니다. 기술 수준별로 분석한 결과, 봇은 초보자를 상대로 한 모든 경기에서 승리했고, 고급 및 고급+ 플레이어를 상대로 한 모든 경기에서 패했으며, 중급 플레이어를 상대로 한 경기의 55%를 승리했습니다. 이는 에이전트가 탁구 라운드에서 중급 인간 수준에 도달했음을 보여줍니다. 로봇이 고급 플레이어를 이길 수 없는 이유는 시뮬레이션 환경에서 정확하게 모델링하기 어려운 반응 속도, 카메라 감지 기능, 회전 처리 등 물리적, 기술적 한계 때문입니다.
로봇과의 대련도 매우 매력적입니다
연구 참가자들은 로봇과 노는 것이 매우 즐거웠다고 말하며 로봇에 '재미있다', '매력적이다'라는 점에서 높은 평가를 주었습니다. 그들은 또한 로봇과 다시 싸울 의향이 매우 높다고 만장일치로 표현했습니다. 자유시간에는 5분 동안 평균 4분06초 동안 로봇과 함께 놀았습니다.

백스핀을 잘 못하는 로봇
기술이 가장 뛰어난 참가자는 로봇이 백스핀을 잘 못 다룬다고 언급했습니다. 이 관찰을 테스트하기 위해 연구원들은 공의 스핀에 대한 로봇의 착지 속도를 플롯했으며 그 결과 로봇이 더 많은 백 스핀 공을 직면할수록 로봇의 착지 속도가 크게 떨어지는 것으로 나타났습니다. 이 결함은 부분적으로는 로봇이 낮은 공을 다룰 때 테이블과의 충돌을 피하려고 하기 때문에 발생하고, 두 번째로는 공의 회전을 실시간으로 판단하기가 정말 어렵다는 사실 때문입니다.
참조 링크:
https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1
위 내용은 딥마인드 로봇이 탁구를 치는데 포핸드와 백핸드가 공중으로 미끄러져 인간 초보자를 완전히 제압했다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 할 일

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀

최근 Enterprise Analytics 플랫폼 Alteryx의 CEO 인 Andy MacMillan과의 대화는 AI 혁명 에서이 비판적이면서도 저평가 된 역할을 강조했습니다. MacMillan에서 설명했듯이 원시 비즈니스 데이터와 AI-Ready Informat의 격차


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.
