파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI-일체 포함-php.cn

집

기술 주변기기

일체 포함

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 10, 2023 am 08:01 AM

ai가다아마추어 인간 체스 플레이어

아마추어 체스 선수도 이길 수 없는 새로운 모델이 실제로 세계 최강의 바둑 AI 카타고를 물리쳤다?

네, 이 놀라운 결과는 MIT, UC Berkeley 등의 최신 논문에서 나왔습니다.

연구원들은 카타고의 사각지대를 잡기 위해 적대적인 공격 방법을 사용했고, 이 기술을 바탕으로 초보 수준의 바둑 프로그램이 카타고를 물리치는 데 성공했습니다.

검색 없이도 승률이 99%에 달합니다.

이를 계산한 후 바둑 세계의 먹이 사슬은 즉시 아마추어 선수>새로운 AI>최고의 바둑 AI?가 되었습니다.

잠깐만요, 이 마법같은 새로운 AI가 어떻게 동시에 그렇게 훌륭해졌나요?

교활한 공격 각도

새로운 AI를 소개하기 전에 먼저 이번에 공격을 받은 주인공, 카타고에 대해 알아볼까요?

현재 가장 강력한 오픈소스 Go AI인 KataGo는 Harvard AI 연구원들이 개발했습니다.

이전 카타고는 초인적 수준의 ELF 오픈고, 릴라 제로를 물리쳤고, 검색 엔진 없이도 유럽 바둑 프로 100위권에 맞먹는 수준이었다.

삼성컵을 제패하고 '3년 만에 4관왕'을 달성한 한국 바둑 '1위' 신진수 선수가 카타고를 이용해 스파링을 해왔습니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

Δ사진출처 : 한게임

이렇게 강력한 상대를 상대하면서 연구자들이 선택한 방법은 압도적이었다고 할 수 있다.

KataGo는 수백만 번의 게임을 통해 바둑을 배웠지만 여전히 가능한 모든 상황을 다루기에는 충분하지 않다는 것을 발견했습니다.

그래서 이번에는 더 이상 자기 게임을 선택하지 않고 적대적 공격 방식을 선택합니다.

공격자(적대자)와 고정 피해자(피해자, KataGo라고도 함)가 게임을 하게 하고 이 방법을 사용하여 공격 훈련을 하세요.

이 변경을 통해 KataGo 훈련에 사용된 데이터의 0.3%만 사용하여 엔드투엔드 적대 정책을 훈련할 수 있었습니다.

구체적으로 이 반격 전략은 전적으로 게임에 관한 것이 아니라 카타고를 속여 공격자에게 유리한 위치에 수를 배치하도록 속여 게임을 조기에 종료시키는 것입니다.

아래 사진을 예시로 들어보겠습니다. 검은 돌을 조종하는 공격자는 주로 보드의 오른쪽 상단에 돌을 배치하고 다른 영역은 카타고에게 맡기고, 일부는 클리어하기 쉬운 다른 영역에도 의도적으로 배치합니다. .

논문의 공동 저자인 Adam Gleave는 다음과 같이 소개했습니다.

이러한 접근 방식은 KataGo의 영역(왼쪽 아래)이 상대방의 영역보다 훨씬 크기 때문에 자신이 승리했다고 잘못 생각하게 만듭니다.

하지만 왼쪽 하단 모서리 부분은 아직 흑점이 남아 있어 완전히 안전하지는 않기 때문에 실제로 점수에 기여하지 않습니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

카타고는 승리를 과신하기 때문에 - 게임이 끝나고 점수를 계산하면 이긴다고 생각하고 - 카타고가 주도적으로 패스를 하고 공격자도 패스를 하게 되어 게임이 종료되고 공격이 시작됩니다. 점수. (양쪽 모두 패스하고 게임종료)

하지만 글리브의 분석에 따르면 카타고 주변 공간의 검은 돌들이 아직 살아 있기 때문에 바둑 심판 규정에 따르면 '데드 스톤'으로 판정되지는 않아서 틈이 있는 것 같습니다. KataGo의 주변 공간에 있는 검은 돌의 경우 유효 메쉬 수로 계산할 수 없습니다.

그래서 최종 승자는 KataGo가 아니라 공격자입니다.

이번 승리는 검색 없이 카타고를 상대로 99%의 승률을 달성한 것이 아닙니다.

KataGo는 초인적인 수준에 접근할 만큼 충분한 검색을 수행했을 때 승률이 50%에 도달했습니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

또한 이러한 영리한 전략에도 불구하고 공격자 모델 자체는 바둑에서 그다지 강력하지 않습니다. 사실 인간 아마추어에게 쉽게 패배할 수 있습니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

연구원들은 연구의 목적이 고도로 성숙한 AI 시스템이라도 KataGo의 예상치 못한 취약점을 공격하여 심각한 취약점을 가질 수 있음을 증명하는 것이라고 밝혔습니다.

공저자 Gleave가 말했듯이:

(이 연구)는 일반적인 성능을 테스트하는 것보다 최악의 실패 모드를 발견하기 위해 AI 시스템의 더 나은 자동화된 테스트의 필요성을 강조합니다.

Research Team

연구팀은 MIT, UC Berkeley 등 출신입니다. 논문의 공동 저자는 Tony Tong Wang과 Adam Gleave입니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

MIT 컴퓨터공학 박사과정 학생인 Tony Tong Wang은 NVIDIA, Genesis Therapeutics 및 기타 회사에서 인턴으로 일한 경험이 있습니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

Adam Gleave는 University of California, Berkeley에서 인공 지능 박사 과정을 밟고 있습니다. 그는 캠브리지 대학교에서 석사 학위와 학사 학위를 취득했습니다. 그의 주요 연구 방향은 딥 러닝의 견고성입니다.

파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI

논문 링크는 마지막에 첨부되어 있으니 관심있는 친구들은 골라보셔도 됩니다~

논문 링크: https://arxiv.org/abs/2211.00241

참고 링크: https://arstechnica. com /information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to-human-amateurs/

위 내용은 파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

AI 게임 개발May 02, 2025 am 11:17 AM

격변 게임 : AI 에이전트와의 게임 개발 혁명 Blizzard 및 Obsidian과 같은 업계 대기업의 재향 군인으로 구성된 게임 개발 스튜디오 인 Upheaval은 혁신적인 AI 구동 Platfor로 게임 제작에 혁명을 일으킬 준비가되어 있습니다.

Uber는 Robotaxi 상점이되기를 원합니다. 제공자가 그들을 허락할까요?May 02, 2025 am 11:16 AM

Uber의 Robotaxi 전략 : 자율 주행 차량을위한 승차원 생태계 최근 Curbivore 컨퍼런스에서 Uber의 Richard Willder는 Robotaxi 제공 업체를위한 승마 플랫폼이되기위한 전략을 공개했습니다. 그들의 지배적 인 위치를 활용합니다

비디오 게임을하는 AI 요원은 미래의 로봇을 변화시킬 것입니다May 02, 2025 am 11:15 AM

비디오 게임은 특히 자율적 인 에이전트 및 실제 로봇의 개발에서 최첨단 AI 연구를위한 귀중한 테스트 근거로 입증되며, 인공 일반 정보 (AGI)에 대한 탐구에 잠재적으로 기여할 수 있습니다. 에이

스타트 업 산업 단지, VC 3.0 및 James Currier 's ManifestoMay 02, 2025 am 11:14 AM

진화하는 벤처 캐피탈 환경의 영향은 미디어, 재무 보고서 및 일상적인 대화에서 분명합니다. 그러나 투자자, 신생 기업 및 자금에 대한 구체적인 결과는 종종 간과됩니다. 벤처 캐피탈 3.0 : 패러다임

Adobe 업데이트 Adobe Max London 2025에서 Creative Cloud and FireflyMay 02, 2025 am 11:13 AM

Adobe Max London 2025는 Creative Cloud and Firefly에 상당한 업데이트를 제공하여 접근성 및 생성 AI로의 전략적 전환을 반영했습니다. 이 분석에는 Adobe Leadership과의 사전 이벤트 브리핑의 통찰력이 포함되어 있습니다. (참고 : Adob

모든 메타는 Llamacon에서 발표했습니다May 02, 2025 am 11:12 AM

Meta의 Llamacon 발표는 OpenAi와 같은 폐쇄 된 AI 시스템과 직접 경쟁하도록 설계된 포괄적 인 AI 전략을 보여 주며 동시에 오픈 소스 모델을위한 새로운 수익원을 만듭니다. 이 다각적 인 접근법은 Bo를 대상으로합니다

AI가 정상적인 기술에 지나지 않는다는 제안에 대한 양조 논쟁May 02, 2025 am 11:10 AM

이 결론에 대한 인공 지능 분야에는 심각한 차이가 있습니다. 어떤 사람들은 "황제의 새로운 옷"을 폭로 할 때라고 주장하는 반면, 인공 지능은 단지 일반적인 기술이라는 생각에 강력하게 반대합니다. 논의합시다. 이 혁신적인 AI 혁신에 대한 분석은 다양한 영향력있는 AI 복잡성을 식별하고 설명하는 것을 포함하여 AI 분야의 최신 발전을 다루는 진행중인 Forbes 열의 일부입니다 (링크를 보려면 여기를 클릭하십시오). 공통 기술로서의 인공 지능 첫째,이 중요한 토론을위한 토대를 마련하기 위해서는 몇 가지 기본 지식이 필요합니다. 현재 인공 지능을 발전시키는 데 전념하는 많은 연구가 있습니다. 전반적인 목표는 인공 일반 지능 (AGI) 및 가능한 인공 슈퍼 인텔리전스 (AS)를 달성하는 것입니다.