사회 활동에서 대규모 언어 모델은 파트너이자 멘토가 될 수 있습니다.
인간의 사회 활동에 있어서 일과 생활에서 타인과 더욱 효과적으로 소통하기 위해서는 갈등 해결과 같은 특정한 사회적 기술이 필요합니다. 그러나 사회적 기술을 연습할 수 있는 환경은 대부분의 사람들이 접근할 수 없는 경우가 많습니다. 특히 전문가에 의한 이러한 기술 교육은 시간이 많이 걸리고 비용이 많이 들고 가용성이 제한되는 경우가 많습니다. 기존 연습 및 피드백 메커니즘은 전문가 감독에 크게 의존하므로 교육 규모를 조정하기가 어렵습니다. 또한, 전문적으로 훈련된 코치가 부족하며, 맞춤형 피드백을 제공할 수 있는 코치 대부분은 도움이 필요한 많은 사람들에게 도움을 주지 못합니다. 최근 스탠포드 조교수 Yang Diyi가 공동 집필한 "Social Skill Training with Large Language Models" 논문에서 연구자들은 대규모 언어 모델의 도움으로 사회적 기술 훈련이 더 쉽고 효율적으로 이루어질 수 있다고 믿습니다. . 실제 가상 연습 공간에서 안전하고 더욱 매력적이며 맞춤형 피드백을 제공합니다.
논문 주소: https://arxiv.org/pdf/2404.04204.pdf특히 연구자들은 다음 두 가지 사회적 기술 훈련 프레임워크를 제안했습니다. 첫 번째 훈련 프레임워크는 AI Partner로, 시뮬레이션 연습을 통해 체험 훈련을 위한 확장 가능한 솔루션을 제공합니다. 이전 연구에서는 인간의 역할극이 의사소통, 협력 및 리더십 기술을 효과적으로 가르칠 수 있다는 것을 보여주었습니다. 시뮬레이션을 통해 학습자는 현장 교육보다 위험과 기회 비용을 줄일 수 있습니다. 그리고 시뮬레이션을 통해 AI Partner는 전문 분야에 진입하는 데 대한 사회 경제적 장벽을 낮출 것입니다. 두 번째 보완 교육 프레임워크는 AI Mentor로, 도메인 전문성과 사실적 지식을 바탕으로 맞춤형 피드백을 제공합니다. 두 교육 프레임워크(통칭 APAM)는 체험 학습과 실제 실습 및 맞춤형 피드백을 결합합니다. 연구자들은 APAM의 광범위한 영향을 다루기 위해 학제간 혁신을 요구합니다. 논문 작성자 Yang Diyi는 다음과 같이 말했습니다. "대부분의 사람들이 사회적 기술을 배우는 것은 불가능합니다. 어떻게 하면 사회적 기술 훈련을 더 쉽게 달성할 수 있을까요? 이를 바탕으로 우리는 LLM을 사용하는 APAM을 시작했습니다. 실생활 연습과 맞춤형 피드백을 통해 소셜 스킬 훈련을 제공합니다!”
그녀는 계속해서 이렇게 말했습니다. “APAM에서는 사용자가 새로운 소셜 스킬을 배우고 싶을 때 AI 파트너가 시뮬레이션 대화를 통과하여 관련 시나리오를 연습할 수 있도록 도와줍니다. AI 멘토는 시뮬레이션의 중요한 순간에 지식 기반 피드백을 제공할 수 있습니다.
이 연구는 특히 사회적 기술 훈련을 위한 일반적인 프레임워크를 제안합니다. 프레임워크에는 AI 파트너와 AI 멘토( 둘 다 APAM이라고 함), 이 두 가지는 매우 중요합니다. 사용자가 새로운 소셜 기술을 배우고 싶을 때 AI 파트너는 시뮬레이션된 대화를 통해 관련 시나리오를 연습하도록 도와줄 수 있습니다. AI 멘토는 시뮬레이션의 중요한 순간에 지식 기반 피드백을 제공할 수 있습니다.
그러나 AI 파트너를 구축하고 배포하는 것은 쉽지 않습니다. 예를 들어 시뮬레이션된 캐릭터의 스타일, 행동, 감정적 특성의 일관성을 유지하는 것은 어렵습니다. AI 멘토의 개발은 도메인 전문성, 상황 인식, 피드백 효율성과 같은 요소에 크게 의존합니다. 위 문제를 해결하기 위해 연구자들은 LLM을 통한 일반적인 사회적 기술 훈련 방법을 제안했는데, 이는 4단계로 완료됩니다.
-
- 학습자(예: 사용자)가 대상 프로세스에 노출되고 실습할 수 있도록 AI 파트너를 설계합니다.
- 피드백을 제공할 AI 멘토를 만듭니다. 사용자가 학습할 수 있도록 두 개의 에이전트를 시뮬레이션 환경에 추가합니다.
연구원들은 APAM 프레임워크의 이상적인 대상은 초보자이지만 숙련된 사람들도 APAM 시스템을 사용하여 지식을 새롭게 할 수 있다고 말합니다.
APAM은 다양한 영역에서 학습자의 기술을 향상시킬 수 있습니다. 표 1에는 듣는 방법, 정신 건강 상담 등과 같은 몇 가지 적용 시나리오가 나열되어 있습니다. 그러나 APAM 프레임워크는 이러한 일반적인 예에 국한되지 않으며 논문의 섹션 6에 더 많은 소개가 있습니다.
LLM은 일관되고 자연스러운 텍스트를 생성할 수 있기 때문에 사회적 기술 훈련 도구로서 큰 잠재력을 가지고 있습니다. 그러나 이러한 유연성에는 제한된 제어 가능성이 따르는 경우가 많습니다.
안전상의 이유로 APAM 프레임워크는 AI 적용 방법에 대한 일련의 조치를 제공합니다. 그들은 사용 프로세스를 연속체, 즉 AI 파트너 연속체와 AI 멘토 연속체로 분류합니다. 모델은 완성됩니다. (그림 1에 표시된 대로).
AI 파트너 및 AI 멘토 평가는 중요한 과제이며, APAM 기반 도구에는 복잡한 컴퓨팅 시스템과 다양한 요구 사항 및 배경을 가진 사용자와의 상호 작용이 포함됩니다.
이러한 훈련 도구를 하나의 분야로 개발하려면 평가 방법이 자연어 처리의 전통적인 측정 기준을 뛰어넘어 여러 관련 분야 및 이해관계자의 솔루션을 채택해야 합니다. 여러 학문 분야의 관점을 통합하면 경험적 성능, 사용자 관점의 유용성, 해당 시스템의 사용자 및 커뮤니티에 대한 장기적인 영향을 평가하는 데 도움이 됩니다.
현재 텍스트 생성에 대한 연구는 주로 내재적 평가, 즉 미리 정의된 규칙이나 상호 작용을 통해 출력의 품질을 평가하는 데 중점을 두고 있습니다.
아래 표 2에서 연구자는 크게 전자동 평가와 사용자 중심 평가로 구분됩니다. Perplexity 또는 Kullback-Leibler 발산과 같은 참조 기반 메트릭은 간단하고 데모를 통해 원하는 동작에 대한 풍부한 정의를 허용하므로 시스템 품질의 자동 평가에 일반적으로 사용됩니다.
표 2는 이전 작업에서 APAM 시스템에 적용된 내재적 및 외적 평가 절차를 자세히 설명합니다. 현재 자연어 처리 실무자들은 주로 시스템의 내재적 평가에 관심을 갖고 있습니다. 이 기사에서 연구자들은 APAM 시스템을 평가하기 위해 확립된 교육 결과 척도를 사용하는 것의 중요성을 강조합니다.
자세한 내용은 원문을 참고해주세요.
위 내용은 양디이(Yang Diyi)의 신작: 사회를 구할 수 있습니다. AI 대형 모델이 일대일 채팅을 통해 사람들이 전자인이 되도록 돕습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!