>  기사  >  기술 주변기기  >  딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

WBOY
WBOY앞으로
2023-04-17 20:01:03916검색

인공지능(AI)이 인류 사회를 진정한 지능 시대로 밀어낼 수 있을까?

인공지능 산업은 60년 이상의 발전을 거쳐 비약적인 발전을 이루었고 경제, 사회 모든 측면에서 널리 활용되고 있음에도 불구하고 인간의 가치에 부합하는 인공지능 시스템을 구축하는 것은 여전히 ​​​​중요한 일입니다. 해결되지 않은 문제.

이제 영국 인공지능 회사 DeepMind의 최신 연구는 인공지능 업계 실무자들에게 이 문제를 해결하기 위한 새로운 사고 방식을 제공할 수 있습니다.

보도에 따르면 DeepMind의 인공지능 시스템은 4인 온라인 경제 게임에서 4,000명 이상의 사람들과 컴퓨터 시뮬레이션을 통해 학습하여 공공 자금을 재분배하는 방법에 대한 정책을 수립하는 방법을 학습했을 뿐만 아니라 다른 인간을 물리치는 등 매우 좋은 성능을 발휘했습니다. 플레이어.

이 게임에서는 플레이어가 금전적 기부를 유지할지, 공동의 이익을 위해 다른 사람과 공유할지 결정하게 됩니다.

"민주적 AI를 활용한 인간 중심 메커니즘 설계"라는 제목의 관련 연구 논문이 권위 있는 과학 저널인 Nature Human Behavior 7월 5일 온라인판에 게재되었습니다.

딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

출처: Nature Human Behavior

영국 요크 대학교 조교수 Annette Zimmermann은 이렇게 경고했습니다. “민주주의를 가장 환영받는 것을 추구하는 것과 협소하게 동일시하지 마십시오. 그녀는 또한 민주주의는 자신이 좋아하는 정책을 가장 잘 구현하는 것이 아니라 시민들이 평등할 수 있는 프로세스를 만드는 것이라고 말했습니다. 다른.

AI가 설계한 경제 메커니즘

인공지능 연구의 궁극적인 목표는 일상 업무를 완료하는 데 도움을 주는 것부터 사회가 직면한 주요 실존적 과제를 해결하는 것까지 인류에게 도움이 되는 기술을 구축하는 것입니다.

오늘날 기계 학습 시스템은 생물 의학의 주요 문제를 해결하고 인간이 환경 문제에 대처하는 데 도움을 주었습니다. 그러나 인간이 공정하고 번영하는 사회를 설계하는 데 인공지능을 활용하는 방법은 아직 개발되지 않았습니다.

경제학 및 게임 이론에서 메커니즘 설계라는 분야는 원하는 목표를 달성하기 위해 인센티브를 받은 행위자 간의 부, 정보 또는 권력의 흐름을 최적으로 제어하는 ​​방법을 연구합니다.

이 연구에서 연구팀은 심층 강화 학습(RL) 에이전트를 사용하여 의욕이 있는 인구의 선호도를 얻을 수 있는 경제 메커니즘을 설계할 수 있음을 증명하려고 했습니다.

이 게임에서 플레이어는 다양한 금액으로 시작하여 공공 자금 풀을 더 잘 개발하는 데 기여할 금액을 결정해야 하며 결국 그 대가로 일부를 받게 되며 금전적 기부를 유지할지 여부를 반복적으로 결정해야 합니다. 또는 잠재적인 공동 이익을 위해 다른 플레이어와 공유할 수도 있습니다.

연구팀은 부의 평등과 불평등 조건에서 플레이어에게 자금을 공유하는 재분배 메커니즘을 설계하기 위해 심층 강화 학습 에이전트를 훈련했습니다.

공유 수익은 인공 지능 시스템에 의해 설계된 것과 인간이 설계한 두 가지 재분배 메커니즘을 통해 플레이어에게 반환됩니다.

딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

그림│게임 디자인 (출처: Nature Human Behavior)

인공지능을 활용한 정책에서는 창업자본금 출자액에 따라 공적자금을 재분배하는 시스템 플레이어 간의 부의 격차를 줄이기 위해 각 플레이어가


"평등주의적" 접근 방식(각 플레이어의 기여도에 관계없이 자금을 균등하게 할당)과 "자유주의적" 접근 방식(각 플레이어의 공공 자금 기여 비율에 따라 자금을 할당)에 비해 이 정책은 인간 플레이어로부터 시작됩니다. 더 많은 표를 얻었습니다.


동시에 이 정책은 초기 부의 불균형을 바로잡고 플레이어의 '무임 승차' 행위를 중지합니다. 플레이어가 창업 자본의 절반 정도를 기부하지 않는 한, 그들은 대가로 거의 아무것도 받지 못할 것입니다.

그러나 연구팀은 또한 그들의 연구 결과가 "인공지능 거버넌스"(AI 정부)의 레시피를 나타내지 않으며 정책 결정을 위해 특별히 인공지능 기반 도구를 구축할 의도도 없다고 경고했습니다.

신뢰할 수 있는 걸까요?

연구 결과에 따르면 인센티브가 호환되는 경제 게임에서 인간이 크게 선호하는 메커니즘을 설계하면 인공 지능 시스템이 민주적 목표를 달성하도록 훈련될 수 있습니다.

이 작업에서 연구팀은 인공 지능 기술을 사용하여 재할당 계획을 처음부터 학습했습니다. 이는 편견을 갖거나 더 넓은 인구를 대표하지 않을 수 있는 인공 지능 연구자가 특정 분야를 선택하는 부담을 덜어주는 접근 방식입니다. 타겟 최적화.

이 연구 작업은 또한 몇 가지 질문을 제기하며 그 중 일부는 이론적으로 어렵습니다. 예를 들어, 가치 조정 방법으로 민주적 목표를 강조하는 것이 좋은 생각인지 물을 수 있습니다. AI 시스템은 “소수를 희생하여 다수에게 힘을 실어주는” 다른 민주적 방법의 경향을 물려받았을 수도 있습니다. 이는 AI가 사회의 기존 편견, 차별 또는 불평등을 악화시키는 방식으로 배치될 수 있다는 긴급한 우려를 고려할 때 특히 중요합니다.
딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널

출처: Pixabay

또 다른 열린 질문은 사람들이 인공 지능 시스템이 설계되는 메커니즘을 신뢰할 것인지 여부입니다. 심판의 신원을 미리 알 수 있다면 선수들은 AI 대리 심판보다 인간 심판을 더 선호할 수도 있다. 그러나 사람들은 작업이 인간에게 너무 복잡하다고 생각할 때 AI 시스템을 신뢰하는 경향이 있습니다.

또한 이러한 메커니즘을 경험을 통해 배우는 것이 아니라 말로 설명한다면 플레이어가 다르게 반응할까요? 많은 문헌에 따르면 메커니즘이 "경험을 기반으로"가 아니라 "설명을 기반으로" 설명될 때 특히 위험한 선택과 관련하여 사람들이 때때로 다르게 행동한다는 것을 보여줍니다. 그러나 AI가 설계한 메커니즘은 항상 말로 표현 가능한 것은 아니며, 이 경우 관찰된 행동은 전적으로 연구팀이 채택한 설명 선택에 달려 있을 가능성이 높습니다.

논문 끝부분에서 연구팀은 연구 결과를 강조하며 자율 에이전트가 인간의 개입 없이 정책 결정을 내리는 일종의 '인공지능 거버넌스'를 지지한다고 밝혔습니다.

그들은 이 방법의 추가 개발이 실제 문제를 진정으로 인간적인 방식으로 해결하는 데 도움이 되는 도구를 제공할 수 있기를 바라고 있습니다.

위 내용은 딥마인드의 최신 연구: AI가 인간을 물리치고 더 나은 경제 메커니즘을 설계한다│네이처 하위저널의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제