ChatGPT로 대표되는 트렌드가 AIGC의 일부라고 생각한다면, 이 트렌드에 대한 큰 오해가 될 것입니다.
ChatGPT는 제품으로서 AI 생성 텍스트의 능력이 특히 인상적인 LLM(대형 언어 모델)의 가능한 응용 시나리오를 보여줍니다. 이러한 향상으로 인해 이 능력에 대한 모든 사람의 열광은 AI가 생성한 이미지, 비디오, 음악 및 기타 콘텐츠로 일반화되었으며 AIGC라는 일반적인 이름을 부여했습니다. 여기에는 ChatGPT와 같은 제품뿐만 아니라 MidJourney 및 Stable Diffusion 도구 시리즈와 같은 뛰어난 이미지 생성도 포함됩니다. 영상, 음악 등의 경우 그다지 인기가 없지만 포함되어 있습니다.
일반적인 논리에 따르면 AIGC의 범위가 ChatGPT보다 크다면 AIGC는 ChatGPT가 나타내는 불분명한 기능의 상위 집합인가요?
내 대답은 '아니오'입니다.
ChatGPT 이런 종류의 LLM은 AIGC의 문을 여는 것이 아니라 자연어 사용자 인터페이스(LUI, Language User Interface)의 문을 엽니다. LUI는 AIGC보다 몇 배 더 큰 세계입니다. 루이의 바다에 비하면 AIGC는 작은 연못이다.
인간과 기계 사이의 인터페이스는 비교적 안정적이며 수십 년에 한 번만 변경됩니다. 그리고 각각의 변화가 가져오는 변화는 심오합니다. 현대의 우리와 가전 제품 간의 인터페이스를 예로 들어 보겠습니다.
은 원래 BUI(버튼 사용자 인터페이스)이었습니다. 찾아볼 필요도 없이 제가 이 단어를 만들어냈습니다. 이는 버튼, 손잡이, 스위치 등을 인터페이스로 사용한다는 의미입니다. 하지만 이 인터페이스의 표현력이 너무 약해서 루프, 분기 등을 전혀 표현할 수 없습니다.
그런 다음 명령줄에 명령을 입력하면 컴퓨터가 명령을 실행하는 TUI(텍스트 사용자 인터페이스)를 입력합니다. Unix와 DOS가 이 세대입니다.
뒤에는 GUI(그래픽 사용자 인터페이스)이 옵니다. Xerox에서 탄생하여 Apple의 Macintosh에서 사용되고 Microsoft의 Windows에서 개발된 이 방법은 갑자기 1980년대부터 현재까지 컴퓨터, 휴대폰, 태블릿에 이르기까지 모든 사용자 인터페이스를 지배하게 되었습니다.
브라우저는 GIUI(Graphic Internet User Interface)로서 인터넷에 날개를 달고 시대를 직접 열었습니다.
대규모 언어 모델의 출현으로 사람들은 마침내 GUI 대신 자연어를 사용하여 기계와 직접 상호 작용할 수 있게 되었습니다. 그렇다면 왜 모두가 언어를 직접 사용하는 대신 GUI를 사용하는 것을 선호했을까요? 기술이 따라가지 못하기 때문이죠. 이전 단락의 음성 인식 정확도는 이제 막 테스트를 통과했습니다. 의미론적 의미를 이해하고 심지어 완벽한 답변을 제공할 수 있는 능력도 이 수준에 도달하지 못했습니다.
이제 ChatGPT 및 Baihuahuazheng의 대형 모델이 등장하여 이미 우리와 컴퓨터에 편리한 그래픽 인터페이스를 기반으로 사용 임계 값을 더욱 낮출 것입니다. 이미 매우 간단한 것을 단순화하는 것은 복잡한 것의 문턱을 낮추는 것보다 훨씬 더 많은 사람들에게 도움이 될 수 있습니다. (대부분의 사람들은 작동하기가 3배나 덜 어렵다면 보잉 737을 운전할 수 없을 것입니다.) 이러한 변화는 인간 사회의 모든 것과 인간-컴퓨터의 모든 상호작용과 관련될 것이며 모든 산업과 모든 사람들의 삶을 변화시킬 것입니다.
AIGC와 비교하면 흥미로운 발전이 많지만 이는 기술 개발 역사상 부분적인 진전입니다. 부분적인 분야인 콘텐츠 제작 분야에만 적용됩니다. 개발에는 여전히 더 오랜 기간의 탐색이 필요합니다. 대규모 언어 모델의 경로가 이미지, 비디오, 사운드 및 기타 분야에 적용될 수 있는지 여부는 아직 알려지지 않았으며 다음 주요 돌파구가 어디인지 명확하지 않습니다. 그러므로 AIGC는 본질보다 개념이 더 중요하고 LLM이나 LUI와는 다르다고 생각합니다.
위 내용은 ChatGPT는 AIGC보다 훨씬 더 큰 LUI를 제공합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!