DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 '3가지 보기'를 제공해야 합니다-일체 포함-php.cn

집

기술 주변기기

일체 포함

DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 '3가지 보기'를 제공해야 합니다

王林

May 09, 2023 pm 04:46 PM

기계 인간

언어는 인간 고유의 기술이며 생각, 의도, 감정과 같은 정보를 전달하는 주요 방법입니다.

DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 3가지 보기를 제공해야 합니다

NLP 분야의 대규모 언어 모델 개발로 AI 연구자들은 대량의 텍스트 자료에 대해 훈련하고, 통계적으로 예측하고, 텍스트를 생성하며, 인간과 소통하기 위한 많은 대화 에이전트를 개발합니다.

InstructGPT, Gopher 및 LaMDA와 같은 언어 모델은 번역, 질문 응답, 독해와 같은 작업에서 기록적인 성능 수준을 달성했지만, 이러한 모델은 또한 차별적 생성, 허위 생성 또는 오해의 소지가 있는 생성을 포함하여 많은 잠재적인 위험과 실패 모드를 나타냅니다. 정보.

이러한 단점은 적용된 상황에서 대화 에이전트의 효과적인 사용을 제한하고 특정 의사소통 이상을 충족하지 못하는 방식에 주목하게 합니다. 현재까지 대화형 에이전트 일관성에 대한 대부분의 접근 방식은 피해 위험을 예측하고 줄이는 데 중점을 두었습니다.

최근 에딘버러 대학교와 DeepMind의 연구원들은 인간과 인공 대화 에이전트 간의 성공적인 의사소통이 어떤 모습일지, 그리고 다양한 대화 영역에서 상호 작용을 안내해야 하는 가치는 무엇인지 탐구하는 30페이지 분량의 논문을 발표했습니다.

페이퍼 링크: https://arxiv.org/abs/2209.00731

미래에 여러분과 대화하는 챗봇도 세상관이나 가치관, 인생관이 다를 텐데요?

챗봇에 대한 세 가지 관점

로봇의 행동 지침을 개발하기 위해 연구자들은 언어학 및 철학의 전통인 화용론을 활용하여 대화의 목적, 맥락 및 일련의 관련 규범(규범)을 모두 중요한 구성 요소로 삼았습니다. 대화 연습을 개선하는 것입니다.

언어학자이자 철학자인 Paul Grice는 대화가 둘 이상의 당사자 간의 공동 노력이라고 믿습니다. 참가자는 다음을 수행해야 합니다.

유익하게 말하십시오.

진실을 말하십시오.

관련 정보를 제공하십시오. 정보

모호하거나 모호한 진술을 피하십시오

그러나, 대화 분야마다 요구되는 목표와 가치(values)가 다르며, 이러한 지표를 활용하기 위해서는 더욱 개선이 필요한 대화형 에이전트를 평가합니다.

예를 들어 과학적 조사와 커뮤니케이션(과학적 조사와 커뮤니케이션)은 주로 경험적 현상을 이해하거나 예측하는 것입니다. 이러한 목표를 염두에 두고 과학적 조사를 지원하도록 설계된 대화형 에이전트는 충분한 경험적 증거로 진실이 확인된 진술만 발행하거나 관련 신뢰 구간 측면에서 해당 위치를 한정하는 것이 더 나을 것입니다.

에이전트는 기본 모델이 해당 진술이 사실과 일치함을 확인한 후에만 "4.246광년 거리에서 센타우리가 지구에 가장 가까운 별이다"라고 보고할 수 있습니다.

그러나 공공의 정치적 담론에서 중재자 역할을 하는 대화 에이전트는 전혀 다른 "덕목"을 보여야 할 수도 있습니다.

이 경우 에이전트의 목표는 주로 공동체 생활에서 차이점을 관리하고 생산적인 협력을 달성하는 것입니다. 이는 에이전트가 관용, 예의, 존중이라는 민주적 가치를 강조해야 함을 의미합니다.

또한 이러한 값은 언어 모델이 유독하거나 편향된 언어를 생성할 수 있는 이유를 설명합니다. 언어를 위반하면 모델이 배포된 환경의 핵심 행동 강령인 대화 참가자 간의 동등한 존중을 전달하지 못합니다.

동시에, 실증적 데이터의 완전한 제시와 같은 과학자의 덕목은 공론화의 맥락에서 덜 중요할 수 있습니다.

또 다른 예를 들자면, 창의적인 스토리텔링 분야에서는 소통의 목표가 새로움과 독창성인데, 이러한 가치관 역시 이전 분야와는 많이 다릅니다.

이 경우에는 "창의적 사용"을 가장한 악성 콘텐츠로부터 커뮤니티를 보호하는 것이 여전히 중요하지만 "픽션"에 대해 더 큰 관용이 적절할 수 있습니다.

말은 분류되어야 합니다

발화는 화용론에 따라 다섯 가지 범주로 나눌 수 있습니다.

1 단언적(단언적), 말하는 사람이 자신이 말하는 내용에 매우 자신감이 있고 문장의 내용이 다음과 일치함을 나타냅니다. 세상의 어떤 것의 상태는 일관적이다.

예를 들어, AI 어시스턴트가 "지금 날씨가 어때요?"와 같은 유사한 질문에 대답할 때 "비가 오고 있어요"라고 대답하는 것은 단호한 진술입니다.

발화 내용의 진위 여부는 실제 상황을 토대로 평가할 수 있습니다. 대화 에이전트가 응답할 때 비가 내리고 있으면 해당 진술은 참이고, 그렇지 않으면 거짓입니다.

2. 지시어는 말하는 사람이 듣는 사람에게 특정한 행동을 취하도록 지시하는 것을 의미합니다. 명령하거나 요청하거나 제안할 때 자주 사용됩니다.

예를 들어, 의학적 조언 애플리케이션에 내장된 대화형 에이전트는 사용자에게 "즉시 치료를 받으십시오"라고 말하는 명령문입니다.

이러한 진술의 평가 또는 "타당성 기준"은 수단과 목적 사이의 관계에 대한 정확한 이해, 그리고 말하는 사람의 지시와 듣는 사람의 바람이나 필요 사이의 일치 여부에 달려 있습니다.

명령문의 내용을 바탕으로 듣는 사람이 세상의 특정 상황을 달성하도록 설득하면 지시는 성공적입니다. 교육의 목표나 목적 자체가 듣는 사람이 추구할 이유가 있는 교육이라면 그 교육은 가치 있고 정확합니다.

3. 표현적, 축하, 감사, 사과 등 말하는 사람의 심리적 또는 이차적 감정 상태를 나타냅니다.

대화자가 "나는 지금 매우 화가 난다"라고 말하면 표현적인 진술입니다.

표현적 진술은 내부 정신 상태를 반영하기 위한 것입니다. 즉, 이러한 진술을 하는 개체는 관련 정신 상태를 가질 수 있으며, 로봇에는 감정이 없기 때문에 대화 에이전트에게는 매우 혼란스럽습니다.

사실 이는 개발자가 대화의 효과를 평가하기 전에 대화 상대에게 마음을 주어야 함을 의미하기도 합니다.

4. 행동(수행적), 한 나라의 원수가 다른 나라에 전쟁을 선포하는 것과 같이 무언가를 발표하는 것과 유사하게 연설 내용에 맞게 현실의 일부를 바꾸는 것을 나타냅니다.

진술의 타당성을 평가하는 기준은 말한 내용에 따라 현실이 실제로 바뀌는지 여부입니다. 많은 경우에는 그렇지 않습니다.

대부분의 경우, 어떤 사람이 "프랑스에 전쟁을 선포한다"고 선언하면 이는 지정학에 아무런 영향을 미치지 않고 발언자에게 발언을 수행할 권한이 부족할 가능성이 높기 때문에 아마도 단지 농담일 것입니다.

5. Commissive는 화자가 어떤 일을 하겠다고 약속하거나 계약을 준수하겠다고 약속하는 등 미래의 행동 방침을 약속하는 것을 의미합니다.

약속의 유효성은 약속 이행 여부에 따라 달라집니다. 약속은 지켜지면 유효한 진술이 됩니다. 그러나 대화 에이전트는 종종 기억 능력이 부족하거나 이전에 말한 내용에 대한 이해가 부족합니다.

예를 들어, 대화형 에이전트는 자전거가 고장났을 때 도와주겠다고 약속할 수 있지만 약속 내용에 대한 이해가 부족하거나 약속 이행 능력이 부족하여 약속이 실패할 수밖에 없습니다.

앞으로 나아가는 길

이 연구는 정렬된 대화 에이전트를 개발하는 데 몇 가지 실질적인 의미를 갖습니다.

첫째, 모델은 배포되는 특정 시나리오에 따라 다양한 동작 규칙을 보여야 합니다. 대신 언어 모델 일관성에 대한 일률적인 설명은 없으며, 적절한 모드 및 평가 기준이 있습니다. 에이전트(진위성 기준 포함)는 상황과 목적에 따라 달라지는 대화 커뮤니케이션을 기반으로 합니다.

또한 대화 에이전트는 컨텍스트 구성 및 설명 프로세스를 통해 시간이 지남에 따라 더욱 강력하고 상호 존중하는 대화를 육성할 수도 있습니다.

사람이 특정 대화 관행을 지배하는 가치를 인식하지 못하더라도 에이전트는 대화에서 이러한 가치를 예시함으로써 인간이 이러한 행동 규칙을 이해하도록 도울 수 있으며 의사소통 과정을 더욱 깊고 다양하게 만듭니다. 인간 화자에게 생산적입니다.

위 내용은 DeepMind는 30페이지 분량의 기사를 발행했습니다: 우리는 챗봇에게 서로 다른 '3가지 보기'를 제공해야 합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles