>  기사  >  기술 주변기기  >  인간의 90%를 격파한 메타 최초의 'AI 외교모델'이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

인간의 90%를 격파한 메타 최초의 'AI 외교모델'이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

WBOY
WBOY앞으로
2023-04-14 17:13:031021검색

수십년 동안 외교는 "AI가 절대 대신할 수 없는 직업"으로 여겨져 왔습니다.

플레이어는 다른 사람의 관점과 그 뒤에 있는 동기를 마스터하고 이해하고, 복잡한 계획을 세우고 적시에 조정한 다음, 언어를 사용하여 다른 사람과 협력하고, 마지막으로 파트너십과 동맹을 구축하도록 설득해야 하기 때문입니다. .

communication, trust배신에 중점을 두는 것은 외교를 바둑이나 체스와 같은 규칙 기반 "게임"과 매우 다르게 만듭니다.

그러나 Meta의 최신 연구에 따르면 AI는 외교관의 업무를 수행할 수 있을 가능성이 높습니다!

2022년 8월부터 10월까지 진행된 온라인 외교 게임 대회에서 CICERO가 전체 "플레이어" 중 상위 10%에 올랐습니다. 평균 점수 25.8%는 상대 82명의 평균 점수(12.4%)의 두 배 이상입니다.

더욱 언급할 만한 점은 실제 게임 중에 한 명의 플레이어가 아닌 인공지능이 게임을 하고 있다는 사실이 밝혀졌다는 것입니다!

이제 이 최신 결과는

Science에 논문 형태로도 게재되었습니다.

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

CICERO의 출시는 분명 자연어 처리 분야에서 큰 성과가 될 것입니다.

이는 인공지능이 "인간과 더 잘, 더 자연스럽게 협력"할 수 있는 잠재력을 갖고 있으며 인간을 위한 AGI를 향한 큰 진전을 의미하기 때문입니다.

90%의 인간을 물리쳤지만 AI 개입은 아무도 발견하지 못했습니다

"외교"는 보드 게임인 Risk와 카드 게임 포커, TV가 결합된 7인용 고전 전략 게임입니다. show Survivor는 1950년대 장난감 회사인 Hasbro가 개발한 유명한 미국 회사에 의해 만들어졌습니다.

20세기 초 유럽 7개국의 '롤플레잉'을 통해 플레이어는 신뢰를 쌓고 다른 플레이어와 협상, 협력하며 최대한 많은 영토를 차지해야 합니다.

상대의 반격을 막지 않기 위해 플레이어는 개인적으로 소통하고 잠재적인 조율 조치에 대해 논의한 다음 자신의 행동을 종이에 적고 다른 플레이어와의 약속을 지키거나 어깁니다.

이러한 속임수와 강력한 전술로 가득 찬 게임은 일부 플레이어에게 친구를 잃는 이상적인 방법으로 간주되기도 합니다.

위에서 언급한 것처럼 체스나 바둑 같은 게임과 달리 외교는

"규칙" 보다는 "사람" 에 더 중점을 둔 게임입니다.

모델이 누군가가 허세를 부리고 있다는 것을 인식하지 못하거나 다른 플레이어의 특정 동작의 공격성을 정확하게 식별할 수 없다면 분명히 게임에서 매우 빠르게 패배할 것입니다.

마찬가지로 실제 사람처럼 말하고, 공감하지 않고, 관계를 구축하고, 게임에 대해 이야기하지 않으면 다른 플레이어가 함께 작업할 의향이 없습니다.

지난 수십 년 동안 연구자들은 자연어 의사소통 능력을 갖춘 'AI 외교관'을 구축해 왔습니다. 그러나 이 주요 과제는 기존 AI의 능력을 훨씬 넘어서기 때문에 어떤 연구자도 성공한 적이 없습니다.

이 사실은 최근 CICERO의 등장에서야 완전히 뒤집혔습니다.

CICERO는 본질적으로 다른 외교 플레이어와 소통하여 게임에서 효과적인 조치를 취할 수 있는 "챗봇"입니다.

키케로는 기원전 106년 1월 3일에 태어난 고대 로마의 유명한 정치가, 철학자, 웅변가였습니다.

Meta는 이 AI 모델의 이름을 따서 명명될 예정이며, 그 의미는 자명합니다.

2022년 8월부터 10월까지 CICERO는 webDiplomacy가 주최한 온라인 '외교' 대회에 총 40개의 게임에 참가하여 5게임 이상 플레이 후 전체 참가자 중 상위 10%에 들었습니다. 여러 게임에 출전했고 Cicero는 2위를 차지했습니다.

40경기에서 시세로의 평균득점은 25.8%로 나머지 82명의 상대 평균득점(12.4%)의 2배가 넘는 수치였으며, 전략적인 대화와 게임능력을 유감없이 발휘했다.

이렇게 AI를 좋아하지 않을 사람이 있을까요?

CICERO는 인터넷의 텍스트로 사전 훈련되고 webDiplomacy.net에서 온라인으로 플레이되는 40,000개 이상의 외교 게임 데이터 세트로 보강된 27억 개의 매개변수 BART와 유사한 언어 모델을 기반으로 합니다.

데이터에는 플레이어가 서로 통신할 때 생성된 1,200만 개 이상의 메시지도 포함되어 있습니다.

CICERO의 모델은 주로 "전략적 추론" "자연어 처리" 두 부분으로 구성됩니다.

두 기술의 통합을 통해 CICERO는 플레이어 동기를 기반으로 전략을 추론하고 공식화한 다음 자연어를 사용하여 의사소통하고 합의에 도달하여 공통 목표를 달성하고 동맹을 형성하고 계획을 조정할 수 있으며 주로 "협력에 반영됩니다. " 세 가지 측면: , "협상""조율".

예를 들어, CICERO는 게임 후반부에 특정 플레이어의 지원이 필요할 것이라고 추론한 다음 해당 플레이어의 호의를 얻기 위한 전략을 개발할 수 있습니다. 심지어 해당 플레이어에 대한 위험과 기회도 식별할 수 있습니다.

대화 인식 전략 모듈은 CICERO가 과거 대화와 게임 보드 상태를 바탕으로 다른 플레이어가 취할 수 있는 조치와 다른 플레이어가 CICERO가 할 수 있다고 생각하는 것을 예측하는 데 도움이 됩니다.

따라서 CICERO는 이러한 예측을 바탕으로 CICERO와 다른 참가자를 위해 상호 이익이 되는 계획을 개발할 것입니다. 이러한 계획을 통해 CICERO는 상생 협력의 기회를 찾을 수 있을 뿐만 아니라 협력이 불가능할 경우 효과적인 조치를 찾는 데도 도움이 됩니다.

CICERO에는 대화 생성을 제어하는 ​​전략적 추론 알고리즘과 결합된 제어 가능한 대화 모델이 있습니다.

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

통제된 대화 모델을 사용하면 CICERO는 신중하게 선택한 계획, 일반적으로 CICERO와 다른 플레이어 모두에게 이익이 되는 계획 내에서 대화를 수행할 수 있습니다.

CICERO의 대화는 진행 중인 게임 내에서 생성되는 자유 형식의 대화에 깊이 뿌리를 두고 있습니다.

예를 들어, CICERO는 다른 플레이어와 전술 계획을 협상하고, 동맹국의 의도를 확인하고, 게임의 더 광범위한 전략적 역학을 논의하거나 심지어 인간 플레이어가 콘텐츠에 대해 논의할 수 있는 거의 모든 것을 포함하여 일상적인 잡담에 참여할 수도 있습니다. .

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

"Cicero는 자연어를 사용하여 외교관과 협상하는 데 매우 효과적이어서 그들은 종종 다른 인간 참여자보다 Cicero와 함께 일하는 것을 선호합니다."라고 Meta는 자체 트위터에서 말했습니다.

Meta AI 부사장 겸 최고 인공 지능 과학자 Yan Lecun은 "외교와 같이 전략적으로 매우 복잡한 게임에서 인간 수준의 성능을 수행할 수 있다는 것은 인간-인공 지능 협력의 큰 잠재력을 나타냅니다."라고 믿습니다.

CICERO는 외교만 할 수 있지만, 이 성과를 뒷받침하는 기술은 인간과 인공지능 모델 간의 의사소통 장벽을 완화할 수 있는 계획 및 RL을 통해 자연어 생성을 제어하는 ​​등 많은 실제 응용 프로그램과 밀접하게 관련되어 있습니다.

예를 들어 오늘날의 AI 비서는 오늘의 날씨를 알려주는 등 간단한 Q&A만 할 수 있지만, 장기적인 대화를 통해 새로운 기술을 가르쳐준다면 어떨까요?

또는 논플레이어 캐릭터(NPC)가 사람처럼 자유롭게 계획하고 대화할 수 있는 비디오 게임을 상상해 보세요. 동기를 이해하고 이에 따라 대화를 조정하여 도시 정복 퀘스트를 완료하는 데 도움이 됩니다.

물론 Meta 자체도 "CICERO는 아직 완벽하지 않다"는 점을 인정합니다. 게임의 특정 중요한 순간에 CICERO는 종종 매우 터무니없는 실수를 저지릅니다.

따라서 Meta는 AI 개발자 커뮤니티의 도움을 받아 CICERO의 코드를 더욱 개선하기 위해 CICERO의 코드를 오픈 소스로 공개하기로 결정했습니다.

네티즌: 샤오자를 법정에 세워주세요!

인간과 동등한 수준의 세계 최초 'AI 외교관'이 공개되면서 네티즌들 사이에서도 뜨거운 논의가 촉발됐다.

많은 네티즌들은

"이 연구의 다음 발전이 정말 기대됩니다."

"인간을 이기는 게임은 가장 인간적인 게임이라고 할 수 있습니다. 정말 매력적입니다. .. "

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

CICERO는 새로운 것이지만, 일부 사람들은 이 "AI 블랙 기술"의 실생활 응용 가능성을 기대했습니다.

"도움이 되는 버전을 구축할 수 있습니다. #COP28 같은 집단행동 챌린지인가요? “

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

네티즌이 언급한 'COP28'은 제28차 유엔 기후회의를 참고해야 합니다.

방금 끝난 제27차 기후회의에서 여러 나라의 대표자들은 며칠간의 치열한 협상 끝에 마침내 기후변화로 인한 손실과 피해를 보상하기 위한 기금 메커니즘을 마련하기로 합의했습니다.

또한 CICERO의 출시는 많은 네티즌들 사이에서 "이것은 연구자들이 속임수에 능숙한 모델을 구축하도록 직접적으로 장려할 것"이라는 우려를 불러일으키기도 했습니다.

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

"인간의 행동을 모방하여 외교 게임을 속이고 승리하는 것이 귀엽고 재미 있습니다."

"또 어떤 용도로 사용될 수 있는지 궁금합니다. 그런 도구의 개발에 경각심을 가져야 합니다." "

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

"인공지능은 예술 창작 등을 매우 잘합니다. 그런데 지금은 설득 능력이 '활성화'되어 있습니다."

"사람을 설득할 수 있으면 그 사람을 통제할 수 있습니다. 선택, 그리하여 그들의 삶을 통제한다"

"그래서 최종 결과는 - AI가 설득으로 인간을 노예로 만든다!"

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

마지막으로 많은 네티즌들은 농담을 했습니다:

"이거 믿을 수 있나요? 결국 시세로는 참수당했습니다!"

"샤오자를 헤이그(국제사법재판소)로 보내주세요!"

인간의 90%를 격파한 메타 최초의 AI 외교모델이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요

불과 이틀 전, Meta AI가 출시한 대규모 언어 모델 Galactica는 출시 3일 만에 거짓말을 사실로 진술했다는 이유로 급히 퇴출되었습니다. 요즘 CICERO의 출시는 AI 기술계에 또 한 번 파장을 일으켰다고 할 수 있다.

위 내용은 인간의 90%를 격파한 메타 최초의 'AI 외교모델'이 사이언스에 등장한다! 네티즌: 샤오자를 법정에 데려가세요의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제