>기술 주변기기 >일체 포함 >Llama 3 대 GPT-4: 어느 것이 더 낫습니까?

Llama 3 대 GPT-4: 어느 것이 더 낫습니까?

William Shakespeare
William Shakespeare원래의
2024-12-13 16:24:00799검색

빠른 링크

Llama 3과 GPT-4는 대중이 사용할 수 있는 가장 진보된 LLM(대형 언어 모델) 중 두 가지입니다. 다중 양식, 컨텍스트 길이, 성능 및 비용 측면에서 두 모델을 비교하여 어떤 LLM이 더 나은지 살펴보겠습니다.

GPT-4란 무엇인가요?

Asking GPT-4o using ChatGPT

GPT-4는 OpenAI가 개발한 최신 LLM(대형 언어 모델)입니다. 훨씬 더 큰 데이터 세트를 사용하여 다양한 훈련 기술과 최적화를 사용하면서 이전 GPT-3 모델의 기초를 기반으로 구축되었습니다. 이로 인해 GPT-4의 매개변수 크기가 크게 늘어났으며, 소규모 전문가 모델의 매개변수를 합하면 총 1조 7천억 개의 매개변수가 있다는 소문이 있습니다. 새로운 교육, 최적화 및 더 많은 수의 매개변수를 통해 GPT-4는 추론, 문제 해결, 상황 이해 및 미묘한 지침 처리 개선을 제공합니다.

현재 이 모델에는 세 가지 변형이 있습니다.

  • GPT-4: 속도, 정확성 및 지식 기반이 크게 개선된 GPT-3의 진화입니다.
  • GPT-4 Turbo: 운영 비용을 줄이면서 더 빠른 성능을 제공하도록 설계된 GPT-4의 최적화된 버전입니다.
  • GPT-4o(Omni): 텍스트, 비전, 오디오를 포함한 다중 모드 입력 및 출력을 통합하여 GPT-4의 기능을 확장합니다.

이제 OpenAI의 API 서비스를 구독하거나 ChatGPT와 상호 작용하거나 Descript, Perplexity AI 및 Microsoft의 다양한 부조종사.

라마 3가 무엇인가요?

Asking Llama 3 using chat

Llama 3은 Meta AI(Facebook, Instagram, WhatsApp의 모회사)가 개발한 오픈 소스 LLM으로, 감독된 미세 조정, 거부 샘플링 및 정책 최적화의 조합을 사용하여 수백만 개의 데이터 세트를 포함한 다양한 데이터 세트를 사용하여 훈련되었습니다. 사람이 주석을 추가한 예시. 다재다능하고 유능한 AI 모델을 만드는 것을 목표로 고품질 프롬프트와 선호도 순위에 초점을 맞춘 교육입니다.

현재 대중에게 공개되는 Llama 3 모델은 Llama 3 8B와 Llama 3 70B의 두 가지입니다. "B"는 Billion을 나타내며 모델의 매개변수 크기를 나타냅니다. Meta는 또한 2024년 말 출시 예정인 Llama 3 400B 모델을 훈련하고 있습니다.

Llama 3는 생성 AI 챗봇인 Meta AI를 통해 액세스할 수 있습니다. 또는 Llama 3 모델을 다운로드하고 Ollama, Open WebUI 또는 LM Studio를 통해 로드하여 컴퓨터에서 로컬로 LLM을 실행할 수 있습니다.

Multimodality

GPT-4o의 출시로 마침내 다중 모드 기능을 갖춘 GPT-4의 초기 마케팅이 이루어졌습니다. 이제 GPT-4o 모델을 사용하여 ChatGPT와 상호 작용하여 이러한 다중 모드 기능에 액세스할 수 있습니다. 2024년 6월 현재 GPT-4o에는 비디오 및 오디오를 생성하는 통합 방법이 없습니다. 그러나 비디오 및 오디오 입력을 기반으로 텍스트와 이미지를 생성하는 기능이 있습니다.

Llama 3는 곧 출시될 Llama 3 400B에 다중 모드 모델도 제공할 계획입니다. CLIP(Contrast Language-Imager Pre-Training)과 유사한 기술을 통합하여 제로샷 학습 기술을 사용하여 이미지를 생성할 가능성이 높습니다. 그러나 Llama 400B는 아직 훈련 중이므로 8B 및 70B 모델이 이미지를 생성하는 유일한 방법은 LLaVa, Visual-LLaMA 및 LLaMA-VID와 같은 확장 프로그램을 사용하는 것입니다. 현재 Llama 3는 텍스트 생성을 위한 입력으로 텍스트, 이미지 및 오디오를 사용할 수 있는 순전히 언어 기반 모델입니다.

컨텍스트 길이

컨텍스트 길이는 모델이 한 번에 처리할 수 있는 텍스트의 양을 나타냅니다. 이는 사용자와 상호 작용할 때 모델이 작업할 수 있는 컨텍스트의 양을 결정하므로 LLM의 기능을 고려할 때 중요한 요소입니다. 일반적으로 컨텍스트 길이가 길수록 더 높은 수준의 일관성과 연속성을 제공하고 상호 작용 중 오류 반복을 줄일 수 있으므로 LLM이 더 좋습니다.

Model

Training Data Description

Params

Context Length

GQA

Token Count

Knowledge Cutoff

Llama 3

Mix of publicly available online data

8B

8k

Yes

15T

March, 2023

Llama 3

Mix of publicly available online data

70B

8k

Yes

15T

December, 2023

모델
훈련 데이터 설명 매개변수 컨텍스트 길이 GQA 토큰 개수 지식 단절
라마 3 공개적으로 사용 가능한 온라인 데이터 혼합 8B 8k 15T 2023년 3월
라마 3 공개적으로 사용 가능한 온라인 데이터의 혼합 70B 8k 15T 2023년 12월

Llama 3 모델의 컨텍스트 길이는 사실상 8,000개 토큰(약 6,400단어)입니다. 즉, Llama 3 모델은 상호 작용 내에서 약 6,400단어의 컨텍스트 메모리를 갖게 됩니다. 8,000개 토큰 제한을 초과하는 모든 단어는 잊혀지고 상호작용 중에 더 이상 컨텍스트를 제공하지 않습니다.

GPT-4 Turbo보다 ​​저렴하고 빠른 멀티모달 플래그십 모델입니다.

Model

Description

Context Window

Training Data

GPT-4o

Multimodal flagship model, cheaper and faster than GPT-4 Turbo.

128,000 tokens (API)

Up to Oct 2023

GPT-4-Turbo

Streamlined GPT-4 Turbo model with vision capabilities.

128,000 tokens (API)

Up to Dec 2023

GPT-4

First GPT-4 model

8,192 tokens

Up to Sep 2021

모델
설명 컨텍스트 창 훈련 데이터
GPT-4o 128,000개 토큰(API) 2023년 10월까지
GPT- 4터보 간소화된 GPT-4 터보 비전 기능을 갖춘 모델. 128,000개 토큰(API) 2023년 12월까지
GPT-4 첫 번째 GPT-4 모델 8,192개 토큰 2021년 9월까지

반면, GPT-4는 이제 ChatGPT 사용자의 경우 32,000개 토큰(약 25,600단어), API 엔드포인트를 사용하는 경우 128,000개 토큰(약 102,400단어)이라는 훨씬 더 긴 컨텍스트 길이를 지원합니다. 이를 통해 GPT-4 모델은 광범위한 대화를 관리하고 긴 문서를 읽거나 책 전체를 읽을 수 있는 능력을 갖추게 됩니다.

성능

2024년 4월 18일자 Llama 3 벤치마크 보고서2024년 5월 14일자 GPT-4 GitHub 보고서를 보고 성능을 비교해 보겠습니다. OpenAI. 결과는 다음과 같습니다.

Model

MMLU

GPQA

MATH

HumanEval

DROP

GPT-4o

88.7

53.6

76.6

90.2

83.4

GPT-4 Turbo

86.5

49.1

72.2

87.6

85.4

Llama3 8B

68.4

34.2

30.0

62.2

58.4

Llama3 70B

82.0

39.5

50.4

81.7

79.7

Llama3 400B

86.1

48.0

57.8

84.1

83.5

Model
MMLU GPQA 수학 HumanEval DROP
GPT-4o 88.7 53.6 76.6 90.2 83.4
GPT-4 터보 86.5 49.1 72.2 87.6 85.4
Llama3 8B 68.4 34.2 30.0 62.2 58.4
라마3 70B 82.0 39.5 50.4 81.7 79.7
Llama3 400B 86.1 48.0 57.8 84.1 83.5

각 기준이 평가하는 내용은 다음과 같습니다.

  • MMLU(대규모 다중 작업 언어 이해): 다양한 학문 전반에 걸쳐 질문을 이해하고 응답하는 모델의 능력을 평가합니다. 과목.
  • GPTQA(General Purpose Question Answering): 개방형 사실 질문에 답변하는 모델의 기술을 평가합니다.
  • MATH: 모델의 능력을 테스트합니다. 수학 문제를 해결합니다.
  • HumanEval: 인간이 제공한 프로그래밍 프롬프트를 기반으로 올바른 코드를 생성하는 모델의 능력을 측정합니다.
  • DROP(단락에 대한 이산 추론): 이산 추론을 수행하고 텍스트 구절을 기반으로 질문에 답하는 모델의 능력을 평가합니다.

최근 벤치마크에서는 GPT-4와 Llama 3 모델의 성능 차이가 강조되었습니다. Llama 3 8B 모델은 상당히 뒤처져 있는 것처럼 보이지만 70B 및 400B 모델은 학술 및 일반 지식, 읽기 및 이해, 추론 및 논리, 코딩. 그러나 아직 순수 수학 측면에서 GPT-4의 성능에 근접한 Llama 3 모델은 없습니다.

비용

비용이 중요합니다. 많은 사용자에게 중요한 요소입니다. OpenAI의 GPT-4o 모델은 3시간마다 16개 메시지 제한으로 모든 ChatGPT 사용자에게 무료로 제공됩니다. 더 필요한 경우 ChatGPT Plus를 구독해야 합니다. 이 서비스는 월 $20 USD로 GPT-4o의 메시지 제한을 80개로 확장하는 동시에 다른 GPT-4 모델에도 액세스할 수 있습니다.

켜기 반면 Llama 3 8B 및 70B 모델은 모두 무료이며 오픈 소스이므로 성능 저하 없이 비용 효율적인 솔루션을 찾는 개발자와 연구자에게 상당한 이점이 될 수 있습니다. 공연.

접근성

GPT-4 모델은 OpenAI의 ChatGPT 생성 AI 챗봇과 해당 API를 통해 널리 액세스할 수 있습니다. GPT-4를 무료로 사용할 수 있는 한 가지 방법인 Microsoft Copilot에서도 GPT-4를 사용할 수 있습니다. 이러한 광범위한 가용성을 통해 사용자는 다양한 사용 사례에서 해당 기능을 쉽게 활용할 수 있습니다. 이와 대조적으로 Llama 3은 모델 유연성을 제공하고 AI 커뮤니티 내에서 더 광범위한 실험과 협업을 장려하는 오픈 소스 프로젝트입니다. 이러한 개방형 접근 방식은 AI 기술을 민주화하여 훨씬 더 많은 사람들이 사용할 수 있도록 할 수 있습니다.

두 모델 모두 쉽게 사용할 수 있지만 GPT-4는 널리 사용되는 생산성 도구 및 서비스에 통합되어 있기 때문에 사용하기가 훨씬 쉽습니다. . 반면 Llama 3는 주로 Amazon Bedrock, Ollama 및 DataBricks(Meta AI 채팅 지원 제외)와 같은 연구 및 비즈니스 플랫폼에 통합되어 있어 기술 지식이 없는 사용자의 더 큰 시장에는 매력적이지 않습니다.

GPT-4 대 ​​Llama 3: 어느 것이 더 낫나요?

그럼 어떤 LLM이 좋을까요? GPT-4가 더 나은 LLM이라고 말하고 싶습니다. GPT-4는 텍스트, 이미지 및 오디오 입력을 처리하는 고급 기능을 통해 다중 모드에 탁월하며 Llama 3의 유사한 기능은 아직 개발 중입니다. GPT-4는 또한 훨씬 더 긴 컨텍스트 길이와 더 나은 성능을 제공하며 인기 있는 도구와 서비스를 통해 널리 액세스할 수 있어 더욱 사용자 친화적입니다.

그러나 Llama 3 모델이 예외적으로 뛰어난 성능을 발휘했다는 점을 강조하는 것이 중요합니다. 무료 오픈 소스 프로젝트를 위해. 결과적으로 Llama 3는 인상적인 성능, 유연성 및 안정적인 개인 정보 보호 기능을 제공하는 동시에 비용이 들지 않는 오픈 소스 특성으로 인해 연구원과 기업이 선호하는 뛰어난 LLM으로 남아 있습니다. 일반 소비자는 Llama 3를 즉시 사용하지 못할 수도 있지만 많은 연구원과 기업에게는 여전히 가장 실행 가능한 옵션으로 남아 있습니다.

결론적으로 GPT-4는 고급 다중 모드 기능, 더 긴 컨텍스트 길이 및 널리 사용되는 도구와 원활하게 통합되는 Llama 3는 오픈 소스 특성을 갖춘 귀중한 대안을 제공하므로 더 큰 사용자 정의 및 비용 절감이 가능합니다. 따라서 애플리케이션 측면에서 GPT-4는 사용 편의성과 모델의 포괄적인 기능을 원하는 사람들에게 이상적인 반면, Llama 3는 유연성과 적응성을 원하는 개발자와 연구원에게 매우 적합합니다.

위 내용은 Llama 3 대 GPT-4: 어느 것이 더 낫습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.