다음은 Heart of Machine AI Technology Annual Conference에서 Zhou Bowen이 연설한 내용입니다. Heart of Machine이 원래 의미를 바꾸지 않고 편집하고 정리했습니다.
초대해주신 Heart of Machine I에게 감사드립니다. 저는 칭화대학교의 Zhou Bowen입니다. 이제 음력이 끝나고 양력이 시작됩니다. 지난 기간의 인공 지능 개발 동향에 대한 요약과 이에 대한 몇 가지 생각을 여러분과 공유할 수 있는 초대를 받게 되어 매우 기쁩니다. 미래.
먼저 핵심 아이디어를 공유하세요. 전체 연설을 듣고 세 가지 사항만 기억하시면 다음 세 가지 사항을 기억해 주세요.
먼저, 인공 지능의 다음 혁신이 시작됩니다. Pure 가상 존재는 사람들이 물리적, 생물학적, 정보 세계에서 더 효율적인 통찰력을 얻고 새로운 지식을 형성하고 작업을 완료하며 더 높은 가치의 시나리오를 만들 수 있도록 도와줍니다.
둘째, 차세대 인공지능에서는 지식(암흑지식 포함), 계산, 추론 능력의 결합을 강화하는 것이 시급합니다. 이러한 조합능력은 매우 중요하지만, 우리는 인공지능과 사람, 환경 사이의 효율적인 상호작용+협업이 이러한 능력을 조합하는 핵심이라고 믿습니다.
두 가지 이유가 있습니다. 첫째, AI와 사람 간의 협업이 없으면 AI는 이러한 고부가가치 시나리오를 독립적으로 완료할 수 없기 때문에 사람 및 환경과의 협업 및 상호 작용이 필요합니다. 이러한 종류의 협업과 상호작용은 AI의 지식, 컴퓨팅, 추론 및 결합 능력을 향상시키는 효과적인 방법이기도 합니다. AI는 컴퓨팅 분야에서 큰 발전을 이루었지만 지식과 추론, 효과적인 모듈 조합 사이에는 여전히 큰 병목 현상이 존재합니다. 사람과 환경 사이에 협업과 상호 작용을 추가하면 이러한 영역에서 AI의 병목 현상을 일부 보완하는 데 도움이 될 수 있습니다.
셋째, 다중 양식에 대한 세 가지 판단이 있습니다. 첫째, 다중 모드 이해와 생성은 협업과 상호 작용의 중요한 초석입니다. 둘째, 지난 2년 동안 서로 다른 양식 간의 표현 학습이 매우 통합되는 경향이 있습니다. 좋은 기본 조건, 셋째, 최근 인기를 끌고 있는 ChatGPT는 인간과 기계의 공동 창작 및 상호 작용을 위한 미래 패러다임의 프로토타입으로서 미래에는 확실히 다중 모드로 발전할 것이며 다중 모드 학습을 위한 새로운 기회를 가져올 것입니다. 아직은 순진한 측면이 많지만, 이 패러다임의 제시는 우리에게 미래의 방향을 제시합니다.
위 내용이 핵심입니다. 오늘 보고서에서는 협업형 대화형 지능과 다중 모드 학습에 대해 이야기하고 최신 진행 상황과 기회를 검토하겠습니다.
1부, 전통적인 대화형 지능의 관점에서 우리는 먼 길을 왔습니다. 우선, 오늘 우리가 말하는 협업과 상호작용은 원래의 대화형 지능과는 전혀 다르다는 점을 강조하고 싶습니다. 역사 속 상호작용은 훈련된 시스템을 제공하고 ELIZA, IBM Watson, Microsoft Xiaoice, Siri에서 JD.com의 지능형 고객 서비스에 이르기까지 상호작용을 작업으로 완료하는 것에 관한 것입니다. 오늘 우리가 이야기하는 협업과 상호 작용은 상호 작용을 학습 방법으로 사용하고 협업을 AI와 인간 간의 노동 분업으로 사용하여 인간-기계 협업의 통합을 더 잘 완성하여 통찰력을 얻고 새로운 지식을 형성하며 작업을 완료하는 것입니다. 이것이 전체적으로 대화형 지능의 역사적 관점이다. 발전을 이끄는 것은 초기 규칙 템플릿에서 프레임 기반 작업 기반 대화, 통계 언어 모델 생성, Seq2seq 모델 및 초대형 사전 학습 모델을 포함하는 기술적 관점의 변화임을 알 수 있습니다. .
이러한 변화와 관련하여 우리는 AI의 새로운 혁신이 확실히 생산성 환경의 진화를 가져올 것이라고 판단합니다. 몇 년 전만 해도 모든 사람들은 지능형 품질 검사, 고객 서비스 등의 영역에 초점을 맞춰 인공 지능 애플리케이션 시나리오에 대해 더 많이 이야기했습니다. 그러나 이제 우리는 AI 혁신 시나리오가 예술적 콘텐츠 제작, 약물 발견, 새로운 지식 발견을 포함하기 시작하면서 점점 더 복잡해지고 있음을 알 수 있습니다. 2002년 노벨 경제학상 수상자인 대니얼 카너먼(Daniel Kahneman)의 베스트셀러 『생각하기 빠르게 그리고 느리게』(Thinking Fast And Slow)에서는 사람의 사고 방식에는 두 가지 유형이 있다고 제안했습니다. 시스템 1은 직관과 무의식이 특징이고, 시스템 1은 다음과 같은 특징이 있습니다. 2 그 안에는 언어, 알고리즘, 계산, 논리가 있습니다.
지난 몇 년 동안 인공 지능은 시스템 1 시나리오에서 더 많이 사용되었지만, 현재 일어나고 있는 일을 포함하여 미래에는 인공 지능이 실제로 더 많은 시스템 2 작업을 수행하는 데 더 적합하고 더 적합합니다. 인간-기계 협업. 시스템 1은 사람에게 더 효율적이기 때문에 뇌 소모가 적고 인지 부하가 낮은 작업인 반면, 시스템 2는 사람에게 인지 부하가 매우 높습니다. 단지 과거에는 인공지능의 기술적 진보가 시스템 1만 잘 할 수 있었고 시스템 2는 잘 할 수 없었을 뿐입니다. 현재의 추세는 AI가 시스템 2에 가까워지고 있다는 것입니다.
산업 폐쇄 루프 관점에서 AI 시나리오는 생산직 및 반복 노동(품질 검사, 고객 서비스 등)에서 사무직 및 지식 혁신 응용 분야로 변경되었습니다. . 이것이 더 큰 가치 공간과 더 많은 플라이휠 효과를 가져올 것이라는 데는 의심의 여지가 없습니다. 플라이휠 효과란 무엇인가? 즉, AI는 사무직 근로자와 지식 근로자가 더 잘 이해하고, 통찰력을 얻고, 새로운 지식을 형성하도록 도울 수 있습니다. 새로운 지식은 더 나은 AI를 설계하는 데 도움이 되며, 더 나은 AI는 더 많은 새로운 지식을 생성할 수 있습니다.
이러한 추세 속에서 우리는 AI와 인간이 협업하는 방식이 바뀌어야 한다는 점을 분명히 깨달아야 합니다. 왜냐하면 AI는 더 이상 원래의 시스템 1 AI가 아니라 시스템 2 AI가 되기 때문입니다. 이 경우 AI가 어떻게 협업하고 상호작용해야 하는지는 고려해야 할 최첨단 문제이다.
AI는 왜 지식, 계산, 추론을 결합하는 능력이 필요하다고 할까요? 다음은 참고할 수 있는 다중 모드 계산의 몇 가지 예입니다.
예를 들어, 왼쪽 첫 번째 그림에서 빨간색 재킷을 입은 사람에게 마지막에 어떤 순위를 얻을 가능성이 가장 높은지 물어보세요. 정답은 4위입니다. 이러한 질문에 답하기 위해서는 매우 정확한 이미지 분할과 의미론적 분할 외에도 많은 상식적 추론과 이산적 추론도 필요합니다. 이것은 현재의 AI 시스템이 매우 부족한 것입니다.
두 번째 예를 들어, 이 의자를 들고 다니기 쉬운 이유는 무엇인가요? 정답은 '접이식'이다. 거기에는 논리적인 추론도 있습니다. 이와 같은 시스템 2 과제에는 실제로 인공 지능의 더 많은 반복과 진화가 필요합니다.
현재 모두가 알고 있는 발전은 사전 훈련된 대규모 언어 모델의 획기적인 발전입니다. 따라서 자연스러운 질문은 우리가 이 패러다임을 계속 따르면 고부가가치 애플리케이션 시나리오와 지식, 계산 및 추론의 효과적인 통합을 해결할 수 있는가 하는 것입니다.
GPT-3을 예로 들면, 1,750억 개의 매개변수가 있다는 것은 누구나 알고 있습니다. 매개변수와 모델 아키텍처 내에서 정보를 인코딩하여 계산을 강조하고 지식과 추론을 약화시킵니다. 한편으로는 "스케일링 법칙"의 지원으로 점점 더 많은 데이터가 있고 모델 기능이 점점 더 강력해지고 있는 반면, NYU의 여러 학자들은 모두를 위한 "역 스케일링"이라는 과제를 제기했습니다. 일부 응용 프로그램 시나리오를 찾으려면 모델이 클수록 매개 변수가 클수록 성능이 저하됩니다.
위 그림에는 두 가지 예가 있습니다. 하나는 부정의 부정인 Negation QA라고 하며, 이중 부정을 사용하여 사전 훈련된 모델의 이해 및 추론 능력을 테스트합니다. 다른 하나는 수학 재정의(Redefine Math)입니다. 이 작업은 기존 수학적 계산 문제에 대한 수학 상수를 재정의하여 언어 모델이 그 의미를 이해하고 올바르게 계산할 수 있는지 테스트합니다(). 오른쪽 두 그림에서 볼 수 있듯이 이러한 작업의 경우 모델 매개변수가 클수록 정확도가 낮아집니다.
이 예들은 실제로 기본 모델이 미래 대화형 지능의 초석이 될 수 있음을 지적합니다. 저는 개인적으로 "대형 모델"보다 더 중요한 단어라고 생각합니다. 매우 중요한 점은 기본 모델이 최종 형태가 아니라는 점입니다. 직면한 문제를 해결하려면 더 나은 시각화가 필요합니다. 따라서 지식과 계산, 추론의 효과적인 결합이 앞으로 연구되어야 할 방향이라고 제안한다. 이 조합의 중요한 측면은 인간의 협력과 상호 작용이 이러한 기본 모델의 업그레이드를 촉진할 수 있다는 것입니다.
비교를 위해 GPT3 모델 "InstructGPT"를 기반으로 한 또 다른 예를 사용합니다.
일부 질문의 경우 GPT-3는 프롬프트에 따라 매우 잘 대답하는 방법을 배울 수 있습니다. 하지만 6세 아이에게 달 착륙에 대해 설명하라고 하면 GPT3의 기본 모델 역량 측면에서 이 질문에 답하는 각도가 다양하다. 이면에 수많은 수치가 담겨 있기 때문이다. 예를 들어, 중력의 물리적 원리에서 시작하여 첫 번째는 역사적 배경의 관점에서 미국과 소련 사이의 냉전 중에 달 착륙이 발생하여 냉전이 어떻게 진행되었는지 설명합니다. 세 번째는 천문학적 관점에서 보면 달은 지구의 행성이라는 것이다. 네 번째 유형은 인간의 관점에서 시작됩니다. 예를 들어, 인간은 항상 달에 착륙하기를 원했습니다. 중국에는 창어에 관한 아름다운 전설이 많이 있으며 서양에서도 마찬가지입니다.
그러나 현재 GPT3 모델은 6세 어린이에게 그러한 것을 설명하는 데 어떤 방법이 적합한지 판단하기가 더 어렵습니다. Wikipedia 페이지에 따르면 달 착륙 및 달 착륙 프로젝트가 무엇인지는 분명히 맥락에 잘 부합하지 않습니다. 따라서 InstructGPT는 이러한 기반을 바탕으로 사용자가 a, b, c, d의 네 가지 유형의 답변을 선택하고 점수를 매길 수 있도록 합니다. 순위가 부여된 후 이 피드백을 다시 가져와 GPT3 모델을 미세 조정할 수 있습니다. 이런 식으로 다음에 "개구리 이야기 쓰기"와 같은 새로운 질문이 있으면 이 모델의 시작 부분은 "옛날 옛적에"가 되어 아이들이 이야기 듣기를 시작하는 데 매우 적합한 방법이 됩니다.
첫 번째 요점은 모델이 의심할 여지 없이 더 효율적이라는 점이고, 다른 점은 모델 매개변수를 줄이는 데 도움이 된다는 것입니다. InstructGPT에는 GPT3 모델에 비해 수백 배 압축된 13억 개의 모델 매개변수만 있지만 특정 시나리오에서는 사람들에게 더 나은 서비스를 제공할 수 있습니다. 협업적 상호작용은 AI의 폐쇄 루프 컴퓨팅 지식, 계산 및 추론 능력을 향상시키는 데 필요한 조건입니다.
우리는 지능이 지식, 계산, 추론이라는 세 가지 기본 능력을 포함한다고 믿습니다. 현재 컴퓨팅이 매우 빠르게 발전하고 있음을 알 수 있습니다. 물론 컴퓨팅 역시 컴퓨팅 능력과 데이터 측면에서 어려움을 겪고 있지만 지식과 추론의 부족이 특히 두드러집니다.
여기에 질문이 있습니다. 세 가지 사이에서 폐쇄 루프를 달성하는 방법은 무엇입니까? AI, 사람, 환경 간의 적극적인 협업 상호 작용을 강화하면 AI가 세 가지 사이에서 폐쇄 루프를 달성하는 데 더 도움이 될 수 있습니까? 우리의 학문적 관점은 AI, 사람, 환경 간의 협업과 상호작용을 도입해야 한다는 것입니다. 한편으로는 각 모듈의 역량을 향상시킬 수도 있고, 다른 한편으로는 모듈을 결합하여 협업을 형성할 수도 있습니다. 상호 작용.
시작점을 반영하여 차세대 AI 혁신은 가상 존재에서 사람들이 물리적, 생물학적 및 정보 세계에서 새로운 지식에 대한 통찰력을 더 효율적으로 얻고 작업을 완료하도록 돕는 것으로 전환될 것입니다.
칭화대학교 협동지능연구센터에서는 주로 다음과 같은 학문적 이슈를 제안하고 연구하고 있습니다. 즉, 우리 연구에서는 AI가 시스템 2에 더 많은 책임을 갖고, 사람들이 시스템 1에 더 많은 책임을 지게 만듭니다. 이것이 가져오는 첫 번째 과제는 AI 자체가 단순히 시스템 1의 패턴 인식 및 직관 작업을 수행하는 대신 논리적 추론, 높은 계산, 높은 복잡성과 같은 작업으로 더 많이 전환해야 한다는 것입니다. 두 번째 과제는 이 새로운 노동 분업 하에서 인간과 AI가 어떻게 협력할 수 있는지입니다. 이는 두 가지 연구방향이다.
두 번째는 AI와 인간의 협력으로, AI가 루프에서 인간의 강화 학습을 더 잘 학습할 수 있도록 합니다. 우리는 더 나은 AI 연속 학습을 연구하고 AI, 환경 및 사람 간의 협력에서 다중 모드 표현 개선 작업을 많이 수행해야 합니다. 다중 양식은 협업을 위한 중요한 채널인 동시에 대화 상호 작용을 위한 향상 메커니즘을 강화해야 합니다.
AI와 환경의 시너지 효과도 매우 중요합니다. AI는 다양한 환경에 적응해야 합니다. 이러한 환경 적응은 클라우드에서 엣지까지의 적응과 엣지에서 클라우드까지의 자체 진화라는 한 문장으로 요약할 수 있습니다. 클라우드에서 엣지까지의 자체 적응을 이해하는 것은 쉽습니다. 다양한 컴퓨팅 성능 및 통신 조건에서 이러한 기본 모델을 이러한 환경에 더 잘 적응시키는 방법은 실제로 인텔리전스를 허용합니다. 기본 모델이 더 잘 반복되도록 가장자리에 있습니다. 즉, 소형모델과 대형모델의 협업이자 상호작용인 셈이다. 그러나 우리는 이러한 협력과 상호작용이 일방적이라고 생각하지 않습니다. 이는 지식 증류와 가지치기를 통해 작은 모델을 얻는 큰 모델일 수밖에 없습니다. 우리는 작은 모델의 반복과 상호작용이 기본 모델로 가는 더 효과적인 경로를 가져야 한다고 믿습니다.
위의 세 가지 기술 경로가 매우 중요하다고 생각합니다. 아래에 최저 수준의 지원이 있을 것입니다. 아마도 우리의 현재 연구는 신뢰할 수 있는 인공 지능에 대한 몇 가지 기본적인 이론적 돌파구를 가져올 것입니다. 왜냐하면 지식, 계산 및 추론의 더 나은 조합을 통해 원래 지식으로 인해 발생한 문제를 더 잘 해결할 수 있기 때문입니다. 계산과 추론의 융합으로 탄생한 블랙박스의 해석성, 견고성, 일반화 문제. 우리는 분할 가능하고 구성 가능한 방식으로 신뢰할 수 있는 인공 지능에서 이러한 발전을 더 잘 달성할 수 있기를 바랍니다. 인공지능의 추론 과정을 사람이 투명하게 볼 수 없다면 인공지능의 시스템 2의 결과를 신뢰하기는 사실상 어렵다.
이 문제를 다른 각도에서 살펴보세요. 최근 ChatGPT가 매우 인기가 있다는 것은 모두가 알고 있으므로 ChatGPT를 피하기 위해 많은 노력을 기울였습니다. 물론 여기에는 AI를 사용하여 과학 논문 작성을 돕기 위해 얼마 전 Facebook이 제안한 시스템인 Galactica도 포함됩니다. 우리는 장면을 만들기 위해서는 사람과 환경의 협력이 필요하다는 사실을 발견했습니다. 이러한 가치 시나리오는 이전에는 실제로 존재하지 않았지만 이제는 가능해지기 시작했습니다. 그러나 이러한 가능성이 인간의 협력 및 상호 작용과 분리되면 우리는 이러한 AI 시스템이 부족하다는 것을 즉시 알게 될 것입니다.
매우 명확한 논문을 작성할 수 있는 Galactica를 포함하지만 많은 기본 사실과 참고 자료가 잘못되었습니다. 예를 들어 저자 이름은 사실이지만 제목의 일부는 사실이고 일부는 거짓이거나, 여러 논문이 합쳐진 경우 등이 있습니다. 제가 강조하고 싶은 점은 현재의 AI는 지식, 계산, 추론의 완전한 폐쇄 루프를 완성할 수 있는 능력이 없기 때문에 인간이 참여해야 한다는 것입니다.
Galactica는 곧 오프라인이 될 예정이지만, 그 목적은 모든 사람이 이를 사용하여 논문과 과학 연구를 독립적으로 완료하도록 하는 것이 아니라 사람들을 더 잘 돕는 것이므로 사람들은 폐쇄 루프에 있어야 합니다. 이는 인간의 협력과 상호작용이 매우 중요한 기본조건임을 강조하는 또 다른 관점이다.
다음으로, 협업적 상호작용의 맥락에서 다중 모드 학습의 진행 상황과 새로운 기회를 어떻게 보는지에 대해 이야기해 보겠습니다. 우선, 최근 멀티모달리티(multi-modality)가 매우 빠르게 발전하고 있으며 몇 가지 명백한 추세를 가져오기 시작했다고 생각합니다.
첫째, 구조 모델링 및 특성화 차원에서 다중 양식 간의 수렴이 있습니다. 예를 들어 과거에는 텍스트가 시퀀스 모델이고 대부분 RNN과 LSTM을 사용했기 때문에 이미지와 비디오에서는 모두 CNN을 사용했지만 이제는 양식이 무엇이든 모든 토큰화된 입력을 하나의 시퀀스로 처리할 수 있습니다. 또는 그래프 모델은 self-attention과 다중 헤드 메커니즘을 사용하여 처리됩니다. 최근 인기 있는 Transformer 아키텍처는 기본적으로 모든 모델의 구조를 수렴하게 만들었습니다.
그러나 깊은 질문은 왜 이 Transformer의 아키텍처가 모든 모달 표현에 이점을 갖는가 하는 것입니다. 우리는 또한 몇 가지 생각을 갖고 있으며 결론은 Transformer가 보다 보편적인 기하학적 토폴로지 공간에서 다양한 모드를 모델링하여 다중 양식 간의 모델링 장벽을 더욱 줄일 수 있다는 것입니다. 따라서 Transformer의 이러한 장점은 다중 모드 방향의 아키텍처 융합을 위한 토대를 마련할 뿐입니다.
두 번째로, 다중 양식의 사전 훈련 차원도 수렴되고 있음을 발견했습니다. 최초의 Bert는 자연어 분야에서 제안되었으며 이 마스크 모드는 사전 학습 모델을 폭발시켰습니다. He Kaiming의 MAE 작업을 포함한 최근 작업은 연설 분야의 작업을 포함하여 유사한 아이디어를 계속해서 사용하고 있습니다. 이 마스크 방법을 통해 서로 다른 양식 간에 수렴된 사전 훈련된 모델 아키텍처가 형성됩니다. 이제 양식 간의 사전 훈련 장벽이 무너지고 사전 훈련된 모델의 차원이 더욱 수렴되었습니다. 예를 들어 MAE는 비전, 이미지, 음성 등 다양한 양식에 BERT의 사전 학습 방법을 도입합니다. 따라서 마스크 메커니즘은 다양한 양식에서 보편성을 보여줍니다.
세 번째 트렌드는 사전 아키텍처 매개변수와 사전 학습 목표의 통합입니다. 현재 Transformer 아키텍처는 텍스트, 이미지 및 오디오를 모델링하는 데 사용되며 매개변수는 여러 작업 간에 공유될 수 있습니다.
구체적으로 현재 다중 모드 사전 훈련 모델은 주로 단일 스트림 모델과 이중 스트림 모델로 구분됩니다. 단일 스트림 아키텍처에서는 두 모델 간의 기본 상관 관계 및 정렬이 상대적으로 간단하다고 가정합니다. 듀얼 스트림 아키텍처는 더 나은 다중 모드 표현을 얻고 다양한 모드 정보를 인코딩하고 융합할 수 있도록 모드 내 모드 클래스의 상호 작용과 교차 모드 간의 상호 작용을 분리해야 한다고 가정합니다.
문제는 이러한 아이디어를 통합하는 더 좋은 방법이 있는지 여부입니다. 현재 추세는 희박성과 모듈성이 보다 강력한 다중 모드, 다중 작업 사이의 두 가지 주요 속성일 수 있다는 것입니다. 희소 전문가 모델은 단일 스트림과 이중 스트림 간의 균형 잡힌 희소 전문가 모델 시스템으로 볼 수 있으며, 이는 다양한 전문가, 다양한 양식 및 작업을 처리할 수 있습니다.
우리가 제기한 한 가지 질문은 협업 상호 작용 모델을 사용하여 이러한 특정 작업에 대해 Google Pathway 모델을 100배 압축하면서도 이 희박하고 모듈화된 구조를 유지할 수 있느냐는 것입니다. 이러한 유형의 작업은 후속 연구의 가치가 충분히 있습니다.
대화적 협업적 상호작용 측면으로 돌아가서, ChatGPT는 현재 매우 중요한 작업이라고 생각합니다. 그 핵심 가치는 협업적 상호작용의 방향에 새로운 이정표를 밝히는 것입니다. 학술적 글쓰기, 코드에 사용될 수 있습니다. 생성, 백과사전 Q&A, 명령어 이해 등 사전 학습된 기본 모델은 대화형 지능형 질의응답, 글쓰기, 코드 생성 등 다양한 기능을 제공할 수 있습니다. ChatGPT의 핵심 기능 개선은 GPT 3에 인간 참여형(Human-In-The-Loop) 강화 학습을 추가하고 다양한 답변의 인간 선택 및 순위 지정을 추가하는 것입니다.
ChatGPT의 현재 프레젠테이션 형식은 자연어를 기본 전달자로 사용하지만 전체 상호 작용 양식은 확실히 이 다중 양식으로 확장될 것입니다. 다중 모드 시나리오에서 인간의 협업과 상호 작용은 실제로 더 효율적이고 더 많은 정보를 가져오며 다양한 양식의 지식 통합을 가져올 것입니다.
이러한 Human-In-The-Loop 협업 상호 작용 기능과 AI 생성 기능이 통합되면 많은 작업을 수행할 수 있습니다. 예를 들어 협업 상호 작용 ChatGPT 모델과 확산 모델은 제품 혁신과 디자인 혁신을 위해 통합됩니다. 협업적 상호 작용 과정에서 ChatGPT와 같은 모델은 소비자 시나리오의 정서적 경험에 대한 통찰력, 디자인 트렌드 및 기술 트렌드에 대한 판단을 통해 현재 디자인의 주류 트렌드와 특정 소비자의 선호도를 지속적으로 찾습니다. 사진 분석은 디자이너 또는 전문 제품 관리자와의 여러 차례의 협업 상호 작용을 통해 공동 창작을 달성할 수 있습니다.
매우 상세한 일부 시나리오에서는 실제로 많은 사람들이 스마트 홈 분야와 같은 사전 지식이 없지만 사람들은 여러 차례의 인간-컴퓨터 협업 상호 작용을 통해 이러한 창의적인 디자인을 생성한 다음 안정 확산 모델을 통해 생성할 수 있습니다. 인간 창의성의 핵심 키워드 장면 경험을 충실도가 높은 복원된 원본 디자인 이미지로 변환합니다. 협업적 상호 작용은 사람들이 보다 효율적인 제품 혁신과 디자인 혁신을 수행하는 데 도움이 될 수 있으며, 이것이 우리 Xianyuan Technology가 하고 있는 일입니다.
다중 모드 작업이 점점 더 중요해지고 있기 때문에 우리 센터는 여러 분야(예: 컴퓨터 비전, 자연어 처리, 기계 학습) 학습, 딥 러닝, 스마트 헬스케어, 생물정보학, 인지 과학), 딥 러닝 시대의 다중 모드 학습 분야에서 뛰어난 과제를 해결할 수 있는 중요한 과학적 질문을 제기하고 연구 기회를 발굴하고 빅 데이터.
위 내용은 Tsinghua University의 Zhou Bowen: ChatGPT의 인기는 차세대 협업 및 대화형 지능의 중요성을 보여줍니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!