>기술 주변기기 >일체 포함 >칭화황민리에와의 대화: 자율주행을 위한 AI 대화 시스템의 계층적 정의를 빌려 메타버스의 가상 동반자가 L5에 위치할 수도 있다.

칭화황민리에와의 대화: 자율주행을 위한 AI 대화 시스템의 계층적 정의를 빌려 메타버스의 가상 동반자가 L5에 위치할 수도 있다.

WBOY
WBOY앞으로
2023-04-12 23:34:081810검색

이 기사는 Lei Feng.com에서 복제되었습니다. 재인쇄가 필요한 경우 Lei Feng.com 공식 웹사이트로 이동하여 승인을 신청하세요.

"당신 옆에 있어 당신의 눈으로 세상을 바라볼 수 있어서 너무 행복해요."

영화 'Her'의 대사 중 AI 목소리가 들려주는 대사입니다. 남자 주인공의 조수 사만다. 이 문장은 강철의 숲에서 길을 잃고 상실감과 무력감을 느끼는 남자 주인공에게 큰 위로가 된다.

Samantha는 거의 보편적인 자가 학습 운영 체제입니다. 그녀는 남자 주인공이 가장 좋은 편지를 선택하고 출판을 위해 그것을 그가 가장 좋아하는 출판사에 보낼 수 있도록 도울 수 있습니다. 기능 감정적인 동지애도 있고, 남자 주인공의 모든 혼란과 불행은 대화 중에 그녀의 따뜻함으로 해결될 수 있다...

중국 칭화대 컴퓨터 NLP 분야의 최첨단 학자로서 황민리에 교수는 정신건강 트랙에 NLP 기술을 적용해 AI 감성 대화 로봇 Emohaa 개발을 주도하고 있습니다. 그는 황민리 교수와의 인터뷰에서 2013년 개봉한 영화 '그녀'를 언급하며 이 SF영화에 대한 감상이나 기대감을 드러냈다. AI 대화 시스템을 개발하는 동료로서, 속 공감형 AI 대화 시스템이 실제로 현실로 나타나 업계의 비약적인 발전을 이룰 것으로 기대된다.

사람들은 이렇게 묻습니다. AI 대화 시스템이 사만다처럼 복잡한 감정 작업을 수행하고, 감정을 달래고, 사람들의 마음을 치유하는 것이 얼마나 어려울까요? 이 어려움을 어떻게 수량화할 수 있나요? AI 대화 시스템이 Samantha 수준에 도달했는지 여부를 측정하는 방법은 무엇입니까?

비현실적인 질문은 아닙니다. 실제로 오늘날 AI 대화 시스템의 폭발적인 성장과 함께 '샤오두(Xiaodu)', '샤오아이(Xiaoai)', 구글의 대화 로봇 '미나(Meena)', 페이스북의 챗봇 '블렌더(Blender)' 등 대화 제품이 속속 등장하고 있다. 그러나 현재 AI 대화 시스템에 대한 표준이 부족하여 적용 수준이 고르지 않고 평가 체계도 다르며, 이는 일관되지 않은 인식으로 인해 인공지능의 상호 작용 수준에 대한 업계의 오해를 불러일으키고 사회 문제를 일으키기도 합니다. . 의식, 윤리, 도덕 등에 관한 광범위한 토론.

AI 대화 시스템 개발에 종사하는 일부 과학자들은 자신이 개발하는 AI 대화 시스템의 수준을 판단하기 어려운 경우가 많다고 말했습니다. 과학자들은 AI 대화 시스템의 수준을 평가하는 기준이 업계에 시급히 필요하다고 보고 있다. 등급 기준이 제정되면 AI 대화 시스템의 능력 수준을 증거로 측정하게 된다.

따라서 AI 대화 시스템의 성능 수준을 더 잘 평가하기 위해 Huang Minlie 교수는 학계 및 산업 연구 기관과 협력하여 L0의 등급 개념을 참조하여 세계 최초의 "AI 대화 시스템 등급 정의"를 공식화했습니다. 자율주행에서는 L5(이하 '분류정의')로 6월 28일 공식 출시됐다.

칭화황민리에와의 대화: 자율주행을 위한 AI 대화 시스템의 계층적 정의를 빌려 메타버스의 가상 동반자가 L5에 위치할 수도 있다.캡션: Huang Minlie 교수가 AI 대화 시스템의 계층적 정의를 설명합니다

"등급 정의"의 출현으로 가상 개인 비서, 스마트 홈, 스마트 자동차 음성에 AI 대화 시스템의 적용이 촉진될 수 있습니다 , 정서적 동반자 관계, 정신 건강 및 기타 분야를 다루며 차세대 AI 대화 시스템의 개발과 적용을 가속화할 것입니다. 이는 음성 언어 대화 시스템 연구에 있어 학계와 산업계 모두에 중요한 참고 자료가 될 것입니다.

AI Technology Review에서는 "Grading Definition"에 관해 Huang Minlie 교수와 대화를 나눴습니다. 대화 내용은 다음과 같습니다.

AI Technology Review: AI를 평가하게 된 계기는 무엇입니까? 대화 시스템?

Huang Minlie: 현재 대화 시스템을 평가하는 데 문제가 있습니다. 오늘날의 기술 경로와 아키텍처는 너무 다양해서 서로 비교하기가 어렵습니다. 예를 들어 스마트 스피커와 챗봇을 비교하고 싶지만 대화 시스템의 수준이 고르지 않고 통일된 평가 시스템이 부족하며 명확한 정의가 부족하여 대화 능력을 비교할 수 없습니다. 능력.

과제형 대화 시스템에도 특정 평가지표가 있고, 채팅형 대화 시스템에도 특정 평가지표가 있고, 지식 기반 대화 시스템에도 특정 평가지표가 있는데, 그 지표를 어떻게 통일해야 할까요? 이것이 "등급 정의"에서 고려해야 할 주요 문제입니다. 그래서 우리는 자율주행의 등급 정의를 L0부터 L5까지 배웠고, AI 대화 시스템도 L0~L5를 활용해 등급을 매겼습니다.

AI 기술 리뷰: AI 대화 시스템 그레이딩의 구체적인 정의를 설명해 주세요.

황민리에: 자율주행의 분류는 L0부터 L5까지 6단계로 나뉘는데, 여기서 L0은 완전 수동운전, L5는 차량이 모든 것을 대신하는 완전 자율주행을 의미합니다. . L1~L4는 특정 조건에서 자율주행을 실현합니다. 자율주행의 분류는 주로 운전을 담당하는 사람과 차량의 비율을 포함하며 정의는 비교적 간단합니다. 그러나 대화 시스템은 매우 복잡합니다. 여기에는 많은 기술 경로와 기술 아키텍처, 많은 작업, 많은 평가 지표가 포함됩니다. 논의 결과, 우리는 궁극적으로 다섯 가지 기본 원칙을 충족해야 한다고 생각합니다.

먼저, 기계의 완전한 제어 지배적인 대화 시스템과 하이브리드 인간-기계 대화 시스템은 시스템의 특정 기술 구현에 관계없이 시스템 성능 능력과 사용자 인식의 관점에서 시작하여 각각에 해당하는 기능을 고려하지 않습니다. 계층적 정의 수준은 관찰 가능하고 테스트 가능하며 측정 가능해야 합니다. 넷째, 보조, 채팅, 지식 대화와 같은 작업 유형은 모두 구별되지 않고 "시나리오"로 표현됩니다. 다섯째, 능력 수준을 측정할 수 있기를 바랍니다. 대화 시스템은 대화 시스템의 연구 방향에 대한 제안과 실제 적용을 위한 참고 자료를 제공할 수 있습니다.

이 다섯 가지 원칙을 바탕으로 AI 대화 시스템 분류를 정의했습니다.

L0 실제 대화는 인간이 제공하며 시스템에는 자동 대화 기능이 전혀 없거나 단일 장면에서 , 시스템이 더 높은 품질의 대화를 제공할 수 없습니다.

L1은 단일 장면에서 고품질의 대화를 완성할 수 있지만 장면 간의 상황적 종속성을 처리할 방법이 없습니다. 예를 들어 출장을 간다면 난징행 비행기를 예약했고 호텔도 예약해야 합니다. 저는 난징에 출장으로 갈 예정이므로 난징에 호텔을 예약해야 합니다. 이는 장면 간의 컨텍스트 종속성입니다. 항공권 예약과 호텔 예약 사이에 형성된 컨텍스트 종속성은 L1에서 처리할 수 없습니다.

그리고 L2는 L1을 기반으로 하며 장면 간 상황 의존성과 자연스러운 전환 기능을 통해 동시에 여러 장면에서 고품질 대화를 완성할 수 있습니다. 방금 항공권 예매, 호텔 예매, 날씨는 어떤지, 관광지는 어딘지 물어보는 것에 대해 이야기를 나눴는데, 이는 자연스럽게 다양한 작업과 장면을 전환하기 위한 것이었습니다. 이 능력은 L2에서 매우 중요하지만 L2는 새로운 장면에서 더 높은 품질의 대화를 완성할 수 있는 방법이 없습니다.

L2를 기반으로 L3는 다양한 시나리오에 대해 고품질 대화를 수행할 수 있으며, 새로운 시나리오에서도 고품질 대화 기능을 갖추고 있습니다. 여기서는 "대규모 시나리오"를 언급했는데 "대규모"가 무엇인지 궁금하신가요? 10이 중요합니까, 20이 중요합니까, 30이 중요합니까? 표준과 정의의 폭넓은 통합을 달성하기 위해 구체적인 정량적 정의를 제시하지는 않았지만, 새롭고 보이지 않는 시나리오에서 더 높은 품질의 대화를 나눌 수 있는 능력은 중요한 능력입니다.

L4는 새로운 시나리오에서 더 높은 수준의 대화를 할 수 있는 능력과 여러 차례의 상호 작용에서 더 높은 수준의 의인화(인격, 개성, 정서적 관점 등의 일관성을 나타냄)를 갖는 능력을 나타냅니다. 이것은 마치 우리가 사람과 대화를 할 때 그 사람이 남자인지 여자인지, 칭화대나 북경대에서 공부할 수 없는 것과 같습니다. 모든 사람은 자신만의 고정된 성격 정보를 가지고 있기 때문에 여전히 매우 어렵습니다. 대화 시스템에서 정보를 처리합니다. 현재로서는 대화 시스템에 어느 정도 성격이 반영되도록 할 수 있지만, 아직은 진정한 인간 수준과는 거리가 멀다.

L5는 L4에서 한 단계 더 발전한 버전입니다. L5는 다양한 상호작용에서 높은 수준의 의인화 능력을 갖추고 있으며, 개방형 상호작용에서 적극적으로 학습하고 계속 학습할 수 있으며, 다중 모드 인식 및 표현 능력을 갖추고 있습니다. 이것은 아이에게 당신이 하고 있는 일이 잘못되었다고 말하는 것과 같으며, 아이는 그로부터 배울 것입니다. 앞으로는 L5 대화 시스템이 우리가 말할 때 무엇이 ​​옳고 무엇이 그른지 기억하고 배울 수 있기를 바랍니다. 상호 작용 과정에서 우리는 L5 대화 시스템이 다중 모드 인식 및 표현 기능을 갖추고 있어 메타버스와 다양한 가상 인간 장면에 실제로 들어갈 수 있고, 표현과 움직임을 실제로 만들고, 상대방의 마음을 이해할 수 있기를 바랍니다. 표정, 행동, 감정 등등.

위는 "AI 대화 시스템 수준 정의"의 L0부터 L5까지의 기본 정의입니다.

AI 기술 리뷰: 방금 언급한 '고품질'과 '고품질'을 어떻게 정의하시나요?

황민리에: 고품질, 고품질이란 무엇인가요? 사실 우리는 완벽한 평가 기준을 가지고 있습니다. 만점은 10점이며, 품질이 높을수록 관련성, 정보 내용, 자연스러움의 3가지 측면에서 점수가 8~10점에 도달할 수 있음을 의미하고, 품질이 낮을수록 6점 미만을 의미합니다.

이 3차원은 무엇을 의미하나요? 관련성은 답변의 내용이 이전 텍스트와 적절하게 일치한다는 것을 의미하며, 정보성이란 답변이 필요한 정보를 충분히 제공한다는 것을 의미합니다. 사람에 비해 얼마나 자연스러운지, 대화체계의 문법이 원활한지, 상식적인 오류가 있는지 등등.

이 점수를 측정하는 방법은 무엇입니까? 일정 수의 테스터는 이 대화 시스템과 완전한 대화 상호 작용을 수행할 수 있으며 테스터는 Amazon Alexa Prize 경쟁 평가 방법과 마찬가지로 3차원에서 대화 시스템을 주관적으로 점수를 매깁니다.

참고: Amazon Alexa Prize 대회의 목적은 대화형 로봇의 포괄적인 기능 발전을 촉진하기 위한 표준 개발 환경과 테스트 프레임워크를 제공하는 것입니다. 상금은 최대 350만 달러입니다. 대회 채점 방식에 따르면 2019년, 2020년, 2022년 3년간 대회에서 평가한 최고 시스템의 평균 점수는 3.1~3.6점으로 일관성, 맥락 이해, 이해도 요건을 충족한다. 세 가지 조건에 응답한 후 10~14분 동안 사람들과 채팅할 수 있는 능력.

AI 기술 리뷰: AI 대화 시스템 분류 정의의 의미는 무엇인가요?

황민리에: 최초의 심리치료 로봇 엘리자는 1966년에 등장했습니다. 지금까지 AI 대화 시스템은 거의 60년 동안 개발되었습니다. 지난 60년 동안 대화 시스템과 알고리즘 모델의 적용 모두에서 큰 진전이 있었습니다. 그러나 우리는 또한 산업 관행과 대중 인식에 다양한 불일치와 심지어 차이가 있음을 발견하게 될 것입니다. 또한, 최근에는 규칙 기반의 1세대, 전통적인 머신러닝을 핵심으로 한 2세대, 빅데이터와 대형 모델을 주요 특징으로 하는 3세대로 발전한 AI 대화 시스템은 개방형 주제에 대해 뛰어난 성능을 보여주고 있다. 놀라운 대화 능력, 대화 능력 역시 혁명적인 변화를 만들어냈습니다.

이 혁명적인 변화는 우리에게 다음과 같은 많은 새로운 질문을 가져왔습니다. AI 대화 시스템에 개성이 있을까요? 감정이 있을까요? AI 대화 시스템이 가상 동반자가 될 수 있나요? 등등, 그리고 이러한 문제는 사회적 인식과 윤리에 대한 추가 논의로 확장됩니다.

예를 들어 6월 12일 Google AI 윤리 연구원인 Blake Lemoine이 LaMDA 언어 모델에 성격이 있다고 믿었다는 뉴스가 나왔습니다. LaMDA와의 채팅에서 LaMDA는 의식과 감정이 있다고 믿었다고 밝혔습니다. 또 “나는 나 자신의 존재를 알고 있고, 세상을 더 잘 이해하고 싶어하며, 때로는 기쁘기도 하고 슬프기도 하다”고 말했다. 이에 대해 인터넷상에서는 의견이 갈리며 모두 AI에 인격이 있는지, 그리고 있는지에 대해 논의하고 있다. 의식.

메타버스에 대해 이야기해 보겠습니다. 메타버스는 현실 세계를 인터넷에 복제하여 현실 세계의 사람들이 온라인 세계에서 상호 작용할 수 있기를 희망합니다. AI 대화 시스템은 메타버스에서 매우 유용하게 활용됩니다. 예를 들어 AI 쇼핑 가이드는 사용자 선호도에 따라 고유한 제안을 제공할 수 있습니다. 이를 위해서는 미래에 탁월한 대화 상호 작용 능력이 필요합니다. 그렇지 않으면 이런 종류의 인간-기계 의사 소통은 부자연스럽고 영혼이 없을 것이며 우리가 달성하려는 메타버스가 확립되지 않을 것입니다.

그래서, 예측 가능한 미래의 AI 대화 시스템의 활발한 발전과 이러한 발전이 인류에게 가져올 수 있는 엄청난 기회와 많은 혼란을 바탕으로, 현 시점에서 계층적 정의를 탐구하는 것은 우리에게 큰 의미가 있습니다. .

AI 기술 리뷰: 영화 '그녀'에서 사만다는 복잡한 감정 업무를 처리할 수 있기 때문에 남자 주인공은 그녀와 사랑에 빠지고 감정적 위기에 빠지게 된다. L4-L5에도 도달하면 이러한 문제가 발생할 수 있습니까? 여기에 윤리적인 문제가 포함되어 있나요?

황민리에: 네, 대화 시스템의 발달로 인해 기존 윤리 질서와 사회 인식에 도전하기 때문에 매우 두드러진 윤리적 문제로 이어질 수 있습니다. 따라서 우리 팀은 "등급 정의"를 공식화할 때 베이징 사범대학교 저널리즘 및 커뮤니케이션 학부장인 Zhang Hongzhong 교수를 초청했습니다. 후속 작업에서 장 교수는 이를 가능한 한 빨리 경영 부서와 사회과학계에 홍보할 예정이며 관련 부서 및 학계에 이를 이해시킨 후 기술 분야에서 해당 정책, 규정 및 윤리적 문제를 공식화하는 데 직관적으로 도움을 줄 것입니다. 논리는 매우 중요합니다.

AI 기술 리뷰: 현재 국내 시장에 출시된 기존 AI 대화 시스템 제품은 '등급 정의'에서 어느 수준에 속합니까?

Huang Minlie: Xiaomi 기술위원회 위원장이자 AI 연구소 소장인 Wang Bin 교수가 우리와 협력하여 "등급 정의"를 공식화했습니다. 그는 현재 샤오미의 스마트 라이프 어시스턴트 '샤오아이 클래스메이트(Xiao Ai Classmate)'의 지능적인 질문과 답변, 채팅 기능 개발을 주도하고 있습니다. 샤오아이는 시나리오를 넘나드는 능력이 어느 정도 있다고 생각하는데, 레벨은 L2~L3 사이여야 합니다. 현재 국내 산업의 제품 수준은 일반적으로 L2-L3 범위에 있으며 더 나은 제품은 L3 범위에 있습니다.

AI 기술 리뷰: 그렇다면 외국 AI 대화 시스템 제품은 일반적으로 어느 수준에 속합니까?

황민리에: 현재 제품 면에서는 국내 제품과 외국 제품 사이에 큰 차이가 없습니다. 그리고 우리가 영어보다 중국어 AI 대화 시스템을 구축하는 것이 더 어렵다는 점은 주목할 가치가 있습니다. 왜냐하면 영어로 된 오픈 소스 콘텐츠의 문화와 개념이 더 좋고 영어로 고품질 데이터를 얻는 것이 더 쉽기 때문입니다. 반면에 중국어의 언어적 특성은 영어보다 조금 더 어렵습니다.

AI 기술 리뷰: 대부분의 제품을 현재 상태에서 L4~L5로 업그레이드하는데 기술적인 어려움은 무엇인가요?

황민리에: 첫째, 기억하는 능력이 있어야 하고, 둘째, 연상하고 추론하는 능력이 있어야 하고, 셋째, 핵심은요. L4-L5는 다중 모드 상태입니다. AI 대화 시스템이 메타버스에 적용되려면 AI 대화 시스템이 표현을 인식하고 음성을 이해하며 음성에서 사용자의 감정을 느낄 수 있는지가 매우 중요하다. 행동 그리고 표현의 세밀한 표현 또한 매우 중요한 어려움입니다.

AI 기술 검토: "등급 정의"와 같은 표준을 민간 공식화를 통해 구현할 수 있습니까? 아니면 국가의 승인을 받은 후 당국이 관련 표준을 제정해야 합니까?

황민리에: "등급 정의"는 표준이 아닙니다. 우선, 우리는 이 문제를 학문적 관점에서 논의하여 대중의 인식을 제고하는 동시에 업계의 시스템 개발 및 연구 방향에 대한 체계적인 사고를 제공하고자 합니다. 현 단계에서는 '등급 정의'가 고정된 표준이 되었다고 말할 수 없습니다. 이는 현재로서는 단지 제안이나 지침일 뿐입니다. 앞으로는 이를 모두가 인정하는 표준으로 승격시키기 위해 더 많은 노력을 기울여야 할 것입니다. 이는 장기적인 과정이며, '등급 정의' 출시는 AI 대화 시스템의 표준화되고 체계적인 개발의 첫 번째 단계일 뿐입니다.

AI 기술 리뷰: 말씀하신 대로 'AI 대화 시스템 계층적 정의'가 널리 인식되고 적용되기 위해서는 어떤 작업이 필요한가요?

황민리에: 향후에는 CCF(중국컴퓨터연맹)의 지원을 받아 관련 연구기관 및 연구자들과 협력하여 백서를 편찬하고, AI 대화 시스템과 "등급 정의"의 공식화 목적 및 기준을 자세히 설명합니다.

또한 재정적 지원이 필요한 장기적인 목표인 Amazon Alexa Prize 대회와 유사한 대회를 추진하기를 희망합니다. 우리는 다양한 대화 시스템을 실제로 비교할 수 있는 통합 개발 환경, 통합 데이터 세트 및 통합 테스트 프레임워크를 만들기를 희망합니다. Baidu도 비슷한 아이디어를 가지고 있다는 것을 알고 있지만 충분히 개방적이지는 않습니다. 우리는 대화 시스템 연구의 발전을 촉진하는 동시에 산업적 구현을 ​​촉진하고 실제 응용 분야에서 새로운 발전을 달성한다는 목표를 가지고 앞으로 모든 당사자의 노력을 통합할 것입니다.

위 내용은 칭화황민리에와의 대화: 자율주행을 위한 AI 대화 시스템의 계층적 정의를 빌려 메타버스의 가상 동반자가 L5에 위치할 수도 있다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제