>  기사  >  기술 주변기기  >  소니 AI, 인간을 1.5초 앞지르며 최고의 인간 레이서를 이겼습니다.

소니 AI, 인간을 1.5초 앞지르며 최고의 인간 레이서를 이겼습니다.

WBOY
WBOY앞으로
2023-04-09 08:21:021370검색

소니 AI, 인간을 1.5초 앞지르며 최고의 인간 레이서를 이겼습니다.

"무슨 일이죠?" Emily Jones는 자신이 뒤쳐지고 있다는 사실을 믿을 수 없었습니다.

Emily Jones는 여러 번의 우승을 차지한 최고의 GT 게임 레이서입니다. 그녀는 자신의 e스포츠 전용 운전대를 치며 눈앞의 화면을 바라보며 "최선을 다했지만 여전히 따라잡을 수 없습니다. 그것은—— 어떻게 그런 일을 할 수 있나요?”

Gran Turismo 게임에서 Jones는 시속 120마일의 속도로 차를 운전합니다. 세계에서 가장 빠른 "플레이어"를 따라잡기 위해 그녀는 시속 140마일과 150마일의 속도로 운전했습니다.

이 "플레이어"는 실제로 GT Sophy라는 인공 지능입니다. 소니 인공지능연구소에서 2020년 출시한 이 게임은 인공지능 기술을 이용해 GT 게임에서 자동차 조종 방법을 학습하는 게임이다. 소니는 2021년 일련의 비공개 이벤트에서 AI를 최고의 GT 레이서들과 대결했습니다.

2021년 7월, Jones는 e스포츠 팀 Trans Tasman Racing의 일원으로 Sony가 주최하는 이벤트에 참가했지만 당시 그녀는 무슨 일이 일어날지 몰랐습니다.

“아무도 나에게 아무 정보도 주지 않았어요. 연습도 필요 없고 랩 타임도 걱정하지 않아도 된다고만 했어요.”라고 그녀는 회상했습니다. "내 태도도 매우 단순합니다. 비밀로 하세요. 이것은 확실히 나쁜 것은 아닙니다."

결국 GT Sophy는 Jones의 최고 기록을 1.5초 차로 이겼습니다. 인간 레이서들은 기본적으로 In milliseconds로 GT 기록을 갱신합니다. 1.5초는 엄청난 차이를 의미합니다.

그러나 Sony는 속도만으로는 GT Sophy를 승자로 만들기에 충분하지 않다는 것을 빨리 깨달았습니다. 단일 트랙에서는 인간 운전자를 능가했으며, 세 가지 다른 트랙에서 놀라운 결과로 기록을 경신했습니다.

그러나 Sony가 여러 명의 운전자와 경쟁했을 때 패배했습니다. 멀티플레이어 경주에는 속도뿐만 아니라 어느 정도의 지능도 필요합니다. GT 소피는 때로는 너무 공격적이고 무모해서 페널티를 받기도 했고, 어떤 때는 너무 소심해서 필요하지 않을 때 굴복하기도 했습니다.

Sony는 AI를 재교육하고 2021년 10월에 2차 라운드를 실시했습니다. 이번에는 GT Sophy가 인간 플레이어를 쉽게 이겼습니다. 어떤 변화가 생겼나요?

소니는 우선 더 큰 신경망을 구축해 프로그램 성능도 더 강력해졌지만, 본질적인 차이점은 GT 소피가 '트랙 에티켓'을 배웠다는 점이다.

미국 대표 Peter Warman()은 이 에티켓이 인간 운전자들에 의해 널리 준수된다고 말했습니다. 그 본질은 공격성과 양보의 균형을 맞추고 끊임없이 변화하는 경기장에서 가장 적절한 행동을 역동적으로 선택하는 능력입니다.

이것이 레이싱 게임 AI보다 GT Sophy를 더 좋게 만드는 이유입니다. 운전자의 트랙 내 상호 작용과 에티켓은 로봇이 사람과 상호 작용할 때 가져야 하는 역동적이고 상황 인식 행동의 특별한 예라고 그는 말했습니다.

위험을 감수해야 할 때와 안전하게 플레이해야 할 때를 인식하는 것은 제조 현장, 가정용 로봇, 자율주행차 등 인공지능에 유용합니다.

는 다음과 같이 말했습니다. "우리는 따라야 하는 인간 규범을 다루는 방법에 대한 일반적인 원칙을 배우지 못한 것 같습니다. 하지만 이것은 좋은 시작이며 바라건대 이것이 우리에게 문제에 대한 통찰력을 줄 것입니다."

GT Sophy Just a lot of beats 체스부터 스타크래프트, 도타 2까지 세계 최고의 인공지능 시스템 중 하나인 인공지능은 세계 최고의 인간 선수들을 이겼습니다. 하지만 GT는 소니에게 새로운 도전을 제시합니다.

다른 게임, 특히 턴제 게임과 달리 GT에서는 최고의 플레이어가 물리학의 한계(초고속)에 접근하면서 실시간으로 차량을 제어해야 합니다. 경쟁에서는 다른 모든 플레이어도 같은 일을 합니다.

가상 경주용 자동차는 시속 100마일의 속도로 곡선 가장자리에서 불과 몇 인치 떨어진 곳까지 질주합니다. 이러한 속도에서는 작은 오류가 충돌로 이어질 수 있습니다.

GT 게임은 자동차의 공기 역학과 트랙의 타이어 마찰을 세부적으로 캡처하고 복제하는 것으로 유명하다고 합니다. 이 게임은 때로는 실제 레이서를 훈련하고 모집하는 데에도 사용됩니다.

스위스 취리히 대학의 로봇 공학 및 인식 그룹 책임자인 Davide Scaramuzza는 "사실주의 측면에서 좋은 역할을 합니다."라고 말했습니다. 그는 GT Sophy 프로젝트에 참여하지 않지만 그의 팀은 GT를 사용했습니다. 인공지능 운전자를 훈련시키는 게임은 아직 인간에게 테스트되지 않았습니다.

GT Sophy는 인간 플레이어와는 다르게 게임을 플레이합니다. 화면의 픽셀을 읽는 대신 트랙에서의 자체 위치와 주변 차량의 위치에 대한 데이터를 얻습니다. 또한 차량에 영향을 미치는 가상 물리적 힘에 대한 정보도 수신합니다.

이에 대응하여 GT Sophy는 차량의 방향을 바꾸거나 브레이크를 밟도록 제어합니다. GT Sophy와 게임 간의 이러한 상호 작용은 초당 10회 발생했으며, 동료들은 이것이 인간 플레이어의 반응 시간과 유사하다고 주장합니다.

Sony는 강화 학습을 사용하여 시행착오 방법을 통해 처음부터 GT Sophy를 훈련했습니다. 처음에는 AI가 차를 도로에 유지하려고만 할 수 있었습니다.

그러나 10대의 PS4(각각 20개의 프로그램 인스턴스 실행)에서 훈련한 후 GT Sophy는 약 8시간 만에 아마추어 플레이어와 동등한 GT 내장 인공 지능 수준으로 향상되었습니다. 24시간 이내에 17,700명의 인간 플레이어의 최고 결과가 포함된 순위표의 거의 최상위에 올랐습니다.

GT Sophy는 9일 동안 랩 타임을 기록했습니다. 결국 그 어떤 인간 플레이어보다 빨랐다.

소니의 인공지능은 게임이 허용하는 한계까지 운전하는 방법을 학습해 인간 플레이어의 능력을 넘어서는 액션을 완성했다고 할 수 있습니다. Jones에게 가장 깊은 인상을 준 것은 GT Sophy가 회전하는 방식이었습니다. 더 일찍 제동하여 더 좁은 라우팅으로 코너에서 가속했습니다.

그녀는 "GT Sophy는 라인을 처리하는 이상한 방법을 가지고 있고 내가 전혀 생각지도 못했던 일을 합니다."라고 말했습니다. 예를 들어 GT Sophy는 종종 트랙 가장자리의 잔디 위로 타이어를 몰다가 코너로 진입하는 경우가 많습니다. . 대부분의 사람들은 실수하기가 너무 쉽기 때문에 그렇게 하지 않습니다. 그것은 당신이 충돌을 통제하는 것과 같습니다. 나에게 백 번 기회를 줘라, 나는 단 한 번만 성공할 수 있다. ”

GT Sophy는 게임의 물리학을 빠르게 파악했지만 더 큰 문제는 심판이었습니다. 프로 경기장에서 GT 경주는 위험 운전에 대해 감점 권한을 가진 인간 심판에 의해 감독됩니다. GT Sophy가 2021년 7월 첫 번째 라운드에서 패한 주요 이유는 몇 달 후 두 번째 라운드에서 페널티를 피하고 점수를 잃는 방법을 배웠기 때문입니다.

GT 소피에 수년을 투자한 그의 책상 뒤에는 두 대의 자동차가 서로 경쟁하고 있는 그림이 있습니다. "이것은 야마나카를 추월하는 GT 소피입니다." 그는 일본 최고의 GT 드라이버를 언급했습니다. 2021년에 GT Sophy와 경쟁하는 일본 프로 ​​시뮬레이션 레이서 4명 중 한 명인 Tomoaki Yamanaka.

이번 레이스가 무엇인지 기억하지 못했습니다. 2021년 10월 이벤트이고, Yamanaka는 강하지만 공정한 상대를 상대하기 때문에 아마도 이 경기를 즐길 것입니다. . 이것이 2022년 7월 이벤트라면 그는 아마도 이유 없이 컴퓨터를 저주했을 것입니다

Yamanaka. 팀원 Takuma Miyazono는 번역 소프트웨어를 통해 우리에게 2022년 7월 경주에 대해 간략하게 설명했습니다. 코너링 방식이 너무 공격적이어서 (GT Sophy)가 몇 번이나 시도했습니다. 인간 플레이어가 트랙에서 벗어나는 것을 피하기 위해 회전하는 동안 속도를 늦추기 때문에 이것은 우리를 화나게 했습니다. "

경쟁 우위를 잃지 않고 공정하게 경기하도록 AI를 훈련시키는 것은 매우 어렵다고 말했습니다. 인간 심판은 환경에 따라 주관적인 판단을 하기 때문에 이를 AI가 학습할 수 있는 것으로 번역하기가 어렵습니다.

소니 연구원들은 AI가 궤도를 벗어나거나 울타리에 부딪힐 때 작동하는 조합을 찾기 위해 AI를 호출하고 조정할 수 있는 다양한 신호를 제공하려고 노력합니다. 각 페널티의 강도를 조정하고 GT Sophy의 운전 스타일이 어떻게 변할지 확인했습니다.

Sony는 또한 GT Sophy가 훈련에서 직면하는 경쟁을 강화했습니다. 그 전에는 주로 이전 버전을 대상으로 훈련했습니다.

Sony는 최고를 초대합니다. 2021년 10월 재대결 전 매주 또는 2주마다 플레이어. GT 드라이버는 AI 테스트를 돕고 결과는 지속적으로 조정됩니다.

“이는 공격성과 양보 사이의 올바른 균형을 찾는 데 필요한 피드백을 제공합니다.”라고

말합니다. 몇 달 후 Miyazono가 GT Sophy와 경쟁했을 때 후자의 공격적인 행동은 사라졌습니다. 하지만 단순히 물러서지는 않았습니다. "두 차가 나란히 코너에 진입하면 GT Sophy는 사람을 위한 충분한 공간을 남겨둡니다. 공간을 확보하세요.”라고 그는 말했습니다. “다른 실제 사람과 경쟁하는 것처럼 느껴집니다.

그는 “라이더들은 이런 반응을 볼 때 색다른 열정과 재미를 느낀다. 이것은 정말 인상 깊었습니다. "

소니의 작업에 깊은 인상을 받았습니다. 그는 "우리는 로봇 기술의 진보를 측정하기 위해 인간의 능력을 사용합니다. 그러나 그의 동료 Elia Kaufman은 GT Sophy의 학습된 행동 훈련을 지배하는 것은 여전히 ​​인간 연구원이라고 지적합니다.

“좋은 트랙 에티켓은 인간이 인공 지능에게 가르칩니다. "이것이 가능하다면 정말 흥미로울 것입니다. 자동화된 방식으로"라고 말했다. "이러한 기계는 좋은 트랙 매너를 가질 뿐만 아니라 더 중요한 것은 트랙 매너가 무엇인지 이해하고 새로운 설정에 적응하기 위해 동작을 변경할 수 있다는 것입니다.

팀은 이제 GT 레이싱 연구를 현실에 적용하고 있습니다. 2022년 6월, 그들은 시뮬레이션된 데이터 대신 원시 비디오 입력을 사용하여 컴퓨터와 경쟁하기 위해 세계 챔피언십 수준의 드론 조종사 두 명을 초대했습니다. AI 경주를 본 후 그들의 얼굴 표정이 모든 것을 말해줍니다. 그들은 충격을 받았습니다. ”

그는 로봇 공학의 진정한 발전이 현실 세계로 확장되어야 한다고 믿습니다. "시뮬레이션과 실제 세계 사이에는 항상 불일치가 있을 것입니다. 사람들이 AI의 놀라운 발전에 대해 이야기할 때 그것은 잊혀지는 부분입니다. 전략적 측면에서는 그렇습니다. 그러나 실제 세계로의 배포 측면에서는 그렇습니다." 세상, 우리는 아직 멀었습니다.”

현재 소니는 여전히 이 기술을 게임에만 사용하겠다고 고집하고 있습니다. GT 게임의 향후 버전에서는 GT Sophy를 사용할 계획입니다. 회사의 전무이사인 Peter Stone은 "우리는 이것이 제품의 일부가 되기를 원합니다."라고 말했습니다. "Sony는 엔터테인먼트 회사이며 이를 통해 게임이 더욱 재미있어지기를 바랍니다."

Jones는 사람들이 운전석에서 GT Sophy를 시청할 기회를 갖게 되면 전체 시뮬레이션 레이싱 커뮤니티가 많은 것을 배울 수 있다고 믿습니다. "많은 트랙에서 우리는 수년 동안 사용되어 온 많은 운전 기술에 결함이 있고 실제로 더 빠른 방법이 있다는 것을 발견했습니다."

Miyazono는 이미 AI가 코너에서 정렬하는 방식을 복제하려고 노력하고 있습니다. 달성할 수 있음이 입증되었습니다. "기준이 바뀌면 모든 사람의 기술이 향상됩니다."라고 Jones는 말했습니다.

위 내용은 소니 AI, 인간을 1.5초 앞지르며 최고의 인간 레이서를 이겼습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제