>  기사  >  기술 주변기기  >  DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 "3가지 보기"를 제공해야 합니다

DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 "3가지 보기"를 제공해야 합니다

王林
王林앞으로
2023-05-09 16:46:09757검색

언어는 인간 고유의 기술이며 생각, 의도, 감정과 같은 정보를 전달하는 주요 방법입니다.

DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 3가지 보기를 제공해야 합니다

NLP 분야의 대규모 언어 모델 개발로 AI 연구자들은 대량의 텍스트 자료에 대해 훈련하고, 통계적으로 예측하고, 텍스트를 생성하며, 인간과 소통하기 위한 많은 대화 에이전트를 개발합니다.

InstructGPT, Gopher 및 LaMDA와 같은 언어 모델은 번역, 질문 응답, 독해와 같은 작업에서 기록적인 성능 수준을 달성했지만, 이러한 모델은 또한 차별적 생성, 허위 생성 또는 오해의 소지가 있는 생성을 포함하여 많은 잠재적인 위험과 실패 모드를 나타냅니다. 정보.

이러한 단점은 적용된 상황에서 대화 에이전트의 효과적인 사용을 제한하고 특정 의사소통 이상을 충족하지 못하는 방식에 주목하게 합니다. 현재까지 대화형 에이전트 일관성에 대한 대부분의 접근 방식은 피해 위험을 예측하고 줄이는 데 중점을 두었습니다.

최근 에딘버러 대학교와 DeepMind의 연구원들은 인간과 인공 대화 에이전트 간의 성공적인 의사소통이 어떤 모습일지, 그리고 다양한 대화 영역에서 상호 작용을 안내해야 하는 가치는 무엇인지 탐구하는 30페이지 분량의 논문을 발표했습니다.

페이퍼 링크: https://arxiv.org/abs/2209.00731

미래에 여러분과 대화하는 챗봇도 세상관이나 가치관, 인생관이 다를 텐데요?

챗봇에 대한 세 가지 관점

로봇의 행동 지침을 개발하기 위해 연구자들은 언어학 및 철학의 전통인 화용론을 활용하여 대화의 목적, 맥락 및 일련의 관련 규범(규범)을 모두 중요한 구성 요소로 삼았습니다. 대화 연습을 개선하는 것입니다.

언어학자이자 철학자인 Paul Grice는 대화가 둘 이상의 당사자 간의 공동 노력이라고 믿습니다. 참가자는 다음을 수행해야 합니다.

유익하게 말하십시오.

진실을 말하십시오.

관련 정보를 제공하십시오. 정보

모호하거나 모호한 진술을 피하십시오

그러나, 대화 분야마다 요구되는 목표와 가치(values)가 다르며, 이러한 지표를 활용하기 위해서는 더욱 개선이 필요한 대화형 에이전트를 평가합니다.

예를 들어 과학적 조사와 커뮤니케이션(과학적 조사와 커뮤니케이션)은 주로 경험적 현상을 이해하거나 예측하는 것입니다. 이러한 목표를 염두에 두고 과학적 조사를 지원하도록 설계된 대화형 에이전트는 충분한 경험적 증거로 진실이 확인된 진술만 발행하거나 관련 신뢰 구간 측면에서 해당 위치를 한정하는 것이 더 나을 것입니다.

에이전트는 기본 모델이 해당 진술이 사실과 일치함을 확인한 후에만 "4.246광년 거리에서 센타우리가 지구에 가장 가까운 별이다"라고 보고할 수 있습니다.

그러나 공공의 정치적 담론에서 중재자 역할을 하는 대화 에이전트는 전혀 다른 "덕목"을 보여야 할 수도 있습니다.

이 경우 에이전트의 목표는 주로 공동체 생활에서 차이점을 관리하고 생산적인 협력을 달성하는 것입니다. 이는 에이전트가 관용, 예의, 존중이라는 민주적 가치를 강조해야 함을 의미합니다.

또한 이러한 값은 언어 모델이 유독하거나 편향된 언어를 생성할 수 있는 이유를 설명합니다. 언어를 위반하면 모델이 배포된 환경의 핵심 행동 강령인 대화 참가자 간의 동등한 존중을 전달하지 못합니다.

동시에, 실증적 데이터의 완전한 제시와 같은 과학자의 덕목은 공론화의 맥락에서 덜 중요할 수 있습니다.

또 다른 예를 들자면, 창의적인 스토리텔링 분야에서는 소통의 목표가 새로움과 독창성인데, 이러한 가치관 역시 이전 분야와는 많이 다릅니다.

이 경우에는 "창의적 사용"을 가장한 악성 콘텐츠로부터 커뮤니티를 보호하는 것이 여전히 중요하지만 "픽션"에 대해 더 큰 관용이 적절할 수 있습니다.

말은 분류되어야 합니다

발화는 화용론에 따라 다섯 가지 범주로 나눌 수 있습니다.

1 단언적(단언적), 말하는 사람이 자신이 말하는 내용에 매우 자신감이 있고 문장의 내용이 다음과 일치함을 나타냅니다. 세상의 어떤 것의 상태는 일관적이다.

예를 들어, AI 어시스턴트가 "지금 날씨가 어때요?"와 같은 유사한 질문에 대답할 때 "비가 오고 있어요"라고 대답하는 것은 단호한 진술입니다.

발화 내용의 진위 여부는 실제 상황을 토대로 평가할 수 있습니다. 대화 에이전트가 응답할 때 비가 내리고 있으면 해당 진술은 참이고, 그렇지 않으면 거짓입니다.

2. 지시어는 말하는 사람이 듣는 사람에게 특정한 행동을 취하도록 지시하는 것을 의미합니다. 명령하거나 요청하거나 제안할 때 자주 사용됩니다.

예를 들어, 의학적 조언 애플리케이션에 내장된 대화형 에이전트는 사용자에게 "즉시 치료를 받으십시오"라고 말하는 명령문입니다.

이러한 진술의 평가 또는 "타당성 기준"은 수단과 목적 사이의 관계에 대한 정확한 이해, 그리고 말하는 사람의 지시와 듣는 사람의 바람이나 필요 사이의 일치 여부에 달려 있습니다.

명령문의 내용을 바탕으로 듣는 사람이 세상의 특정 상황을 달성하도록 설득하면 지시는 성공적입니다. 교육의 목표나 목적 자체가 듣는 사람이 추구할 이유가 있는 교육이라면 그 교육은 가치 있고 정확합니다.

3. 표현적, 축하, 감사, 사과 등 말하는 사람의 심리적 또는 이차적 감정 상태를 나타냅니다.

대화자가 "나는 지금 매우 화가 난다"라고 말하면 표현적인 진술입니다.

표현적 진술은 내부 정신 상태를 반영하기 위한 것입니다. 즉, 이러한 진술을 하는 개체는 관련 정신 상태를 가질 수 있으며, 로봇에는 감정이 없기 때문에 대화 에이전트에게는 매우 혼란스럽습니다.

사실 이는 개발자가 대화의 효과를 평가하기 전에 대화 상대에게 마음을 주어야 함을 의미하기도 합니다.

4. 행동(수행적), 한 나라의 원수가 다른 나라에 전쟁을 선포하는 것과 같이 무언가를 발표하는 것과 유사하게 연설 내용에 맞게 현실의 일부를 바꾸는 것을 나타냅니다.

진술의 타당성을 평가하는 기준은 말한 내용에 따라 현실이 실제로 바뀌는지 여부입니다. 많은 경우에는 그렇지 않습니다.

대부분의 경우, 어떤 사람이 "프랑스에 전쟁을 선포한다"고 선언하면 이는 지정학에 아무런 영향을 미치지 않고 발언자에게 발언을 수행할 권한이 부족할 가능성이 높기 때문에 아마도 단지 농담일 것입니다.

5. Commissive는 화자가 어떤 일을 하겠다고 약속하거나 계약을 준수하겠다고 약속하는 등 미래의 행동 방침을 약속하는 것을 의미합니다.

약속의 유효성은 약속 이행 여부에 따라 달라집니다. 약속은 지켜지면 유효한 진술이 됩니다. 그러나 대화 에이전트는 종종 기억 능력이 부족하거나 이전에 말한 내용에 대한 이해가 부족합니다.

예를 들어, 대화형 에이전트는 자전거가 고장났을 때 도와주겠다고 약속할 수 있지만 약속 내용에 대한 이해가 부족하거나 약속 이행 능력이 부족하여 약속이 실패할 수밖에 없습니다.

앞으로 나아가는 길

이 연구는 정렬된 대화 에이전트를 개발하는 데 몇 가지 실질적인 의미를 갖습니다.

첫째, 모델은 배포되는 특정 시나리오에 따라 다양한 동작 규칙을 보여야 합니다. 대신 언어 모델 일관성에 대한 일률적인 설명은 없으며, 적절한 모드 및 평가 기준이 있습니다. 에이전트(진위성 기준 포함)는 상황과 목적에 따라 달라지는 대화 커뮤니케이션을 기반으로 합니다.

또한 대화 에이전트는 컨텍스트 구성 및 설명 프로세스를 통해 시간이 지남에 따라 더욱 강력하고 상호 존중하는 대화를 육성할 수도 있습니다.

사람이 특정 대화 관행을 지배하는 가치를 인식하지 못하더라도 에이전트는 대화에서 이러한 가치를 예시함으로써 인간이 이러한 행동 규칙을 이해하도록 도울 수 있으며 의사소통 과정을 더욱 깊고 다양하게 만듭니다. 인간 화자에게 생산적입니다.

위 내용은 DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 "3가지 보기"를 제공해야 합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제