AIGC 업계의 두 가지 가장 큰 경쟁자: ChatGPT vs Google Bard 이 기사에서는 이 두 인공 지능 엔진의 기술적 차이점을 소개합니다.
번역가 | Cui Hao
Reviewer | Sun Shujuan
AIGC 업계의 두 가지 가장 큰 경쟁자: ChatGPT와 Google Bard 이 기사에서는 이 두 인공 지능 엔진의 기술적 차이점을 소개합니다.
지금까지 Google Bard와 ChatGPT의 가장 큰 차이점은 Bard는 ChatGPT에 대해 알고 있지만 ChatGPT는 Bard에 대해 무지하다는 것입니다. ChatGPT를 가지고 놀 수는 있지만 Bard는 여전히 우리 대부분의 손에 닿지 않습니다.
ChatGPT와 Google Bard는 모두 인공지능 챗봇입니다. 인공 지능의 단순화된 버전은 이미 휴대폰에서 사용할 수 있습니다. "좋음"을 입력하면 휴대폰은 다음 단어가 "아침"이 될 것이라고 예측할 수 있습니다.
ChatGPT는 원래 OpenAI에서 개발되었으며 이후 Microsoft에서 눈에 띄는 100억 달러(초기 10억 달러 투자에 추가)의 자금을 지원했습니다. Google은 검색 독점이 끝날 수도 있다는 사실에 약간 당황하여 Bard를 출시했지만 이 버전에는 여전히 몇 가지 결함이 있었습니다. Bard는 첫 번째 라이브 시연에서 Google을 당황하게 만드는 몇 가지 사실적 오류를 범했습니다.
ChatGPT와 Google Bard는 스마트폰의 텍스트 예측 기능보다 더 복잡합니다. 이 두 지능형 로봇의 차이점을 이해하고 싶다면 다음 콘텐츠를 놓칠 수 없습니다.
여기에서는 두 인공지능 엔진의 기술적 차이점을 심층적으로 설명하겠습니다.
다음 표를 통해 이들 간의 기술적 차이점을 빠르게 이해할 수 있으며, 이를 통해 많은 세부 정보를 볼 수 있습니다.
ChatGPT |
B ard |
|
모델 |
GPT-3.5 |
LaMDA, 대화형 애플리케이션을 위한 언어 모델 |
신경망 구조 |
Transformer |
Transformer |
Training data |
주로 "commoncrawl"이라고 불리는 데이터 세트인 웹 텍스트는 2021년 중반에 출시될 예정입니다. |
156만 단어의 공개 대화 데이터와 네트워크 텍스트 |
목적 |
다용도 텍스트 생성 챗봇이 되자 |
검색 보조에 특화된 |
매개변수 |
1,750억 개의 매개변수 |
1,370억 개의 매개변수 |
Creator |
OpenAI |
Google |
장점 |
- 누구나 사용할 수 있음 - 더 유연하고 개방형 텍스트를 처리할 수 있음 - 2021년 기준 학습 데이터 |
- 현재 훈련 데이터 - 대화를 위해 특별히 훈련되어 대화할 때 더 사람처럼 들립니다. 단점 |
위 표를 통해 둘의 차이점을 이해했으니, 이제 다른 지표에 대해 좀 더 자세히 살펴보겠습니다. ChatGPT란 무엇인가요?ChatGPT가 2022년 11월 30일 갑자기 무대에 등장했습니다. 2022년 12월 4일 현재 이 서비스의 일일 사용자 수는 100만 명이 넘습니다. 2023년 1월에는 이 숫자가 1억 명 이상으로 늘어났습니다. 갑자기 인기를 얻는 기본적인 이유는 거의 인간적인 방식으로 많은 주제에 대한 신뢰할 수 있는 답변을 제공하고 인터넷에 연결된 사람이라면 누구나 사용할 수 있다는 것입니다. ChatGPT는 친숙한 인공 지능 솔루션을 만드는 데 주력하는 샌프란시스코에 위치한 인공 지능 연구소인 OpenAI에서 만들었습니다. 챗봇은 텍스트가 제공되면 요청자에게 지속적으로 응답할 수 있는 대규모 언어 모델인 GPT-3.5를 기반으로 개발되었습니다. ChatGPT는 이를 바탕으로 몇 가지 추가 교육을 추가합니다. 인간 트레이너는 모델과의 상호 작용을 통해 모델을 개선하고 "보상"을 통해 모델에 고품질 답변을 제공할 수 있는 기능을 제공합니다. Training DataGPT-3.5는 Common Crawl이라는 인기 있는 데이터세트를 포함하여 대규모 웹 텍스트 데이터세트에 대해 교육되었습니다. Common Crawl에는 원시 웹페이지 데이터, 메타데이터 추출, 텍스트 추출을 비롯한 페타바이트 규모의 웹 데이터가 포함되어 있습니다. 예를 들어 StrataScratch의 URL 컬렉션이 포함되어 있습니다. ChatGPT가 ChatGPT에 대한 네티즌의 입력에서 얻은 훈련 데이터를 사용한다고 생각하는 것이 이상하지 않나요? Common Crawl은 훈련 데이터의 60%를 담당하지만 GPT-3.5에는 다른 데이터 소스도 있습니다. 구글 바드란?Google Bard는 ChatGPT가 큰 인기를 끌었을 때 Google에서 출시한 지능형 채팅 로봇입니다. ChatGPT와 달리 Bard는 Google의 자체 모델인 LaMDA를 기반으로 합니다. LaMDA는 Language Model for Conversational Application의 약어입니다. ChatGPT와 달리 아직 대부분의 사람들이 액세스할 수 없다는 단순한 이유 때문에 그렇게 놀라운 것은 아닙니다. Google은 2월 초에 어색한 Bard 데모를 선보였지만 현재 Bard는 선택된 소수에게만 제공됩니다. Google Bard의 가장 큰 장점은 인터넷에 개방되어 있다는 것입니다. ChatGPT에 "지금 대통령이 누구입니까?"라고 물어보세요. 2021년 중반쯤 훈련 데이터가 끊어졌기 때문이다. 반면에 Bard는 오늘날 인터넷에서 얻을 수 있는 정보를 활용했습니다. 이론적으로 Bard는 오늘날 인터넷의 데이터를 가져와 현재 누가 대통령인지 알려줄 수 있어야 합니다. Bard가 몇 가지 주요 측면에서 ChatGPT보다 뛰어난지 쉽게 확인할 수 있습니다. Training data우선, LaMDA는 GPT-n 모델처럼 단순히 텍스트를 생성하는 것이 아닌 대화, 특히 대화를 위한 훈련을 받았습니다. ChatGPT는 교육 데이터에 대해 당당하지만 Bard가 교육받은 데이터에 대해 많이 알지 못하며 LaMDA의 연구 논문을 보고 추론할 수 있습니다. 구글 연구원들은 훈련 데이터의 12.5%가 GPT-n 모델과 같은 Common Crawl에서 나온다고 말합니다. 또 다른 12.5%는 Wikipedia에서 나옵니다. 연구 논문에 따르면, 그들은 '공개 대화 데이터와 네트워크 텍스트' 중 1조 5600억 단어를 사용했습니다. 전체 분석은 다음과 같습니다.
위 정보를 통해 두 사람이 공동으로 사용하는 데이터를 알 수 있는데 당연히 위키피디아가 있습니다. 나머지 데이터는 아마도 Bard(및 LaMDA)가 모방되지 않도록 보호하기 위해 Google이 의도적으로 숨겼습니다. LaMDA는 원래 Google에서 개발한 오픈 소스 신경망 아키텍처인 Transformer의 신경 언어 모델을 미세 조정하여 형성되었습니다. (GPT도 Transformer를 기반으로 합니다.) ChatGPT에는 짜증나거나 말도 안되는 말을 하는 것을 방지하기 위한 몇 가지 장벽이 있지만 Google은 Bard를 더 좋고 안전한 챗봇으로 만들기 위해 품질을 보장하는 방법을 강조합니다. Bard는 "고품질, 기반 및 안전성"을 갖도록 미세 조정되었습니다. Google에서는 이에 대해 할 말이 많기 때문에 관련 블로그 게시물을 읽어 보시기를 권장하지만, 시간이 부족하다면 기본적으로 다음과 같은 측면으로 나눌 수 있습니다.
우리 모두 알고 있듯이 Google이 잘못된 출시로 인해 완전히 실패한 것은 아닙니다. 근본적인 요구 사항을 파악하십시오. 그러나 Google은 디자인 요구 사항에 대해 매우 명확하지만 ChatGPT는 적어도 현재로서는 명확하지 않다는 점은 주목할 가치가 있습니다. ChatGPT vs. Google Bard: 모델 매개변수가 왜 중요한가요?ChatGPT는 Bard보다 모델 매개변수가 더 많습니다(1,750억 대 1,370억). 매개변수는 모델이 훈련된 데이터에 맞게 조정하는 손잡이나 레버로 생각할 수 있습니다. 매개변수가 많을수록 일반적으로 모델이 언어의 복잡한 관계를 포착하는 능력이 더 뛰어나다는 것을 의미하지만 과적합의 위험도 있습니다. Google Bard는 ChatGPT보다 유연성이 떨어질 수 있지만 새로운 언어 사용 사례로 인해 더욱 강력할 수도 있습니다. ChatGPT와 Google Bard: 공통점은 무엇인가요?Bard 및 ChatGPT(각각 LaMDA 및 GPT-3.5)의 모델이 Transformer 기반 딥 러닝 신경망을 기반으로 한다는 점을 강조할 가치가 있습니다. 예를 들어 Transformer는 훈련된 모델이 문장이나 단락을 읽고 해당 단어 간의 관계를 기록한 다음 다음에 올 것이라고 생각하는 단어를 예측할 수 있도록 지원합니다. 이는 앞서 언급한 스마트폰 예측 텍스트 기능과 유사합니다. 여기서 논의에 들어가지는 않겠지만, 여러분이 알아야 할 것은 이것이 핵심적으로 Bard와 ChatGPT가 서로 크게 다르지 않다는 것을 의미한다는 것입니다. ChatGPT 대 Google Bard: 소유권소유권은 엄밀히 말하면 기술적인 차이는 아니지만 기억해 둘 가치가 있습니다. Google Bard는 Google이 만든 LaMDA 외에 Google이 만들고 완전히 소유합니다. ChatGPT는 샌프란시스코에 위치한 인공지능 연구소인 OpenAI에서 개발했습니다. OpenAI는 원래 비영리였지만 2019년에 영리 자회사를 만들었습니다. OpenAI는 또한 여러분이 사용해 보신 인공지능 텍스트-이미지 생성 기술인 Dall-E의 배후이기도 합니다. Microsoft는 OpenAI에 막대한 투자를 했지만 현재로서는 독립적인 연구 기관입니다. ChatGPT와 Google Bard 중 어느 것이 더 좋나요?둘 사이에는 유사점이 많지만 차이점도 있기 때문에 이 질문에 대해 공정한 대답을 하기는 어렵습니다. 첫째, 현재 Google Bard에 액세스할 수 있는 사람은 거의 없습니다. 게다가 ChatGPT의 훈련 데이터는 거의 2년 전에 중단되었습니다. 둘 다 텍스트 생성기입니다. 프롬프트를 제공하면 Google Bard와 ChatGPT가 이에 응답할 수 있습니다. 둘 다 모델을 미세 조정하기 위한 수십억 개의 매개변수를 가지고 있습니다. 둘 다 훈련 데이터 소스가 겹치고 동일한 신경망 모델인 Transformer를 기반으로 구축되었습니다. 또한 다양한 목적으로 설계되었으며 Bard는 Google 검색을 탐색하는 데 도움을 주며 대화형으로 설계되었습니다. ChatGPT는 전체 블로그 게시물을 생성할 수 있습니다. 의미 있는 텍스트를 출력하도록 설계되었습니다. ChatGPT와 Google Bard의 차이점을 이야기해도 인공지능 기반 텍스트 생성 기술이 어디까지 왔는지 입증할 뿐입니다. 둘 다 갈 길이 멀고 저작권과 윤리적 논란에 직면해 있지만 두 생성기 모두 현대 AI 모델 개발에 대한 강력한 증거입니다. 번역가 소개Cui Hao, 51CTO 커뮤니티 편집자, 선임 설계자는 18년의 소프트웨어 개발 및 아키텍처 경험과 10년의 분산 아키텍처 경험을 보유하고 있습니다. 원제: ChatGPT vs Google Bard: A Comparison of the Technical Differences, 저자: Nate Rosidi |
위 내용은 ChatGPT와 Google Bard: 어느 것이 더 좋고 어느 것이 더 나쁜가요? 차이점을 총정리해 보세요!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!