찾다
기술 주변기기일체 포함ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

1.LLaMA

LLaMA 프로젝트에는 70억에서 650억 개의 매개변수 크기를 가진 기본 언어 모델 세트가 포함되어 있습니다. 이러한 모델은 수백만 개의 토큰에 대해 훈련되었으며 공개적으로 사용 가능한 데이터 세트에 대해 완전히 훈련되었습니다. 그 결과 LLaMA-13B는 GPT-3(175B)을 능가했고, LLaMA-65B는 Chinchilla-70B, PaLM-540B 등 최고 모델과 비슷한 성능을 보였다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

이미지 출처: LLaMA

출처:

  • 연구 논문: "LLaMA: 개방적이고 효율적인 기초 언어 모델(arxiv.org)" [https://arxiv.org/abs/2302.13971]
  • GitHub: facebookresearch/llama [https://github.com/facebookresearch/llama]
  • Demo: Baize Lora 7B [https://huggingface.co/spaces/project-baize/Baize-7B]

2.Alpaca

스탠포드 대학교의 Alpaca는 ChatGPT와 경쟁할 수 있으며 누구나 $600 미만의 가격으로 복사할 수 있다고 주장합니다. Alpaca 7B는 52K 지침에 따른 데모를 통해 LLaMA 7B 모델에서 미세 조정되었습니다.

교육 내용|스탠포드 대학교 CRFM 사진

자료:

  • 블로그: 스탠포드 대학교 CRFM. [https://crfm.stanford.edu/2023/03/13/alpaca.html]
  • GitHub: tatsu-lab/stanford_alpaca [https://github.com/tatsu-lab/stanford_alpaca]
  • 데모: Alpaca - LoRA (공식 데모는 없어졌습니다. 알파카 모델의 변형입니다) [https://huggingface.co/spaces/tloen/alpaca-lora]

3.Vicuna

Vicuna는 ShareGPT에서 수집된 공유된 사용자 대화를 기반으로 LLaMA 모델을 미세 조정합니다. Vicuna-13B 모델은 OpenAI ChatGPT 및 Google Bard 품질의 90% 이상에 도달했습니다. 또한 LLaMA 및 Stanford Alpaca 모델보다 90% 더 나은 성능을 보였습니다. 비쿠나를 훈련시키는 데 드는 비용은 약 $300입니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

Vicuna의 이미지

출처:

  • 블로그 게시물: "Vicuna: 90%* ChatGPT 품질로 GPT-4를 감동시키는 오픈 소스 챗봇" [https://vicuna.lmsys.org/]
  • GitHub: lm-sys/FastChat [https://github.com/lm-sys/FastChat#fine-tuning]
  • 데모: FastChat(lmsys.org) [https://chat.lmsys.org/]

4.OpenChatKit

OpenChatKit: ChatGPT의 오픈 소스 대안으로, 챗봇 생성을 위한 완벽한 툴킷입니다. 이는 사용자 자신의 지침 조정을 교육하기 위한 대규모 언어 모델, 미세 조정된 모델, 봇 응답 업데이트를 위한 확장 가능한 검색 시스템 및 질문에 대한 봇 검토 필터링을 위한 지침을 제공합니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

Pictures from TOGETHER

GPT-NeoXT-Chat-Base-20B 모델은 질문과 답변, 추출 및 분류 작업에서 기본 모드인 GPT-NoeX보다 성능이 더 우수하다는 것을 알 수 있습니다.

리소스:

  • 블로그 게시물: "OpenChatKit 발표" - TOGETHER [https://www.together.xyz/blog/openchatkit]
  • GitHub: togethercomputer/OpenChatKit [https://github.com/togethercomputer/OpenChatKit ]
  • 데모: OpenChatKit [https://huggingface.co/spaces/togethercomputer/OpenChatKit]
  • 모델 카드: togethercomputer/GPT-NeoXT-Chat-Base-20B [https://huggingface.co/togethercomputer/GPT- NeoXT-Chat-Base-20B]

5.GPT4ALL

GPT4ALL은 커뮤니티 중심 프로젝트이며 코드, 스토리, 설명 및 여러 라운드 대화를 포함한 대규모 보조 상호 작용 코퍼스에 대해 훈련되었습니다. 팀은 오픈 소스를 활성화하기 위해 데이터 세트, 모델 가중치, 데이터 관리 프로세스 및 훈련 코드를 제공했습니다. 또한 노트북에서 실행할 수 있는 모델의 양자화된 4비트 버전도 출시했습니다. Python 클라이언트를 사용하여 모델 추론을 실행할 수도 있습니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

GPT4ALL의 사진

출처:

  • 기술 보고서: GPT4All [https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf]
  • GitHub: nomic-ai/gpt4al [https://github.com/nomic-ai /gpt4all]
  • 데모: GPT4All(비공식). [https://huggingface.co/spaces/rishiraj/GPT4All]
  • 모델 카드: nomic-ai/gpt4all-lora · 허깅 페이스 [https://huggingface.co/nomic-ai/gpt4all-lora]

6.Raven RWKV

Raven RWKV 7B는 RWKV 언어 모델로 구동되는 오픈 소스 챗봇이며 ChatGPT와 유사한 결과를 생성합니다. 이 모델은 품질과 확장성 측면에서 변환기와 일치할 수 있는 RNN을 사용하는 동시에 더 빠르고 VRAM을 절약합니다. Raven은 Stanford Alpaca, code-alpaca 및 기타 데이터 세트에서 미세 조정되었습니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

이미지 출처: Raven RWKV 7B

출처:

  • GitHub: BlinkDL/ChatRWKV [https://github.com/BlinkDL/ChatRWKV]
  • Demo: Raven RWKV 7B [https://huggingface.co /spaces/BlinkDL/Raven-RWKV-7B]
  • 모델 카드: BlinkDL/rwkv-4-raven [https://huggingface.co/BlinkDL/rwkv-4-raven]

7.OPT

OPT: Open Pre-trained Transformer 언어 모델은 ChatGPT만큼 강력하지는 않지만 제로샷 및 퓨샷 학습과 고정관념 편향 분석에서 탁월한 기능을 보여줍니다. 더 나은 결과를 위해 Alpa, Colossal-AI, CTranslate2 및 FasterTransformer와 통합할 수도 있습니다. 참고: 이 목록에 오른 이유는 텍스트 생성 카테고리에서 월간 다운로드가 624,710회에 달하는 인기 때문입니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

이미지 출처(arxiv.org)

리소스:

  • 연구 논문: "OPT: Open Pre-trained Transformer Language Models(arxiv.org)" [https://arxiv.org/abs/2205.01068 ]
  • GitHub: facebookresearch/metaseq [https://github.com/facebookresearch/metaseq]
  • 데모: LLM용 워터마크 [https://huggingface.co/spaces/tomg-group-umd/lm-watermarking]
  • 모델 카드: facebook/opt-1.3b [https://huggingface.co/facebook/opt-1.3b]

8.Flan-T5-XXL

Flan-T5-XXL The T5 모델은 명령어 형태로 표현된 데이터 세트에 대해 미세 조정됩니다. 지침을 미세 조정하면 PaLM, T5 및 U-PaLM과 같은 다양한 모델 클래스의 성능이 크게 향상되었습니다. Flan-T5-XXL 모델은 더 많은 언어를 포괄하는 1000개 이상의 추가 작업에 대해 미세 조정되었습니다.

ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.

Flan-T5-XXL

이미지 출처:

  • 연구 논문: "Scaling Instruction-Fine Tuned Language Models" [https://arxiv.org/pdf/2210.11416.pdf]
  • GitHub: google-research/t5x [https://github.com/google-research/t5x]
  • 데모: 채팅 Llm 스트리밍 [https://huggingface.co/spaces/olivierdehaene/chat-llm-streaming]
  • 모델 카드 :google/flan-t5-xxl [https://huggingface.co/google/flan-t5-xxl?text=Q%3A+%28+False+or+not+False+or+False+%29+is%3F +A%3A+Let%27s+think+step+by+step]

Summary

선택할 수 있는 오픈 소스 대형 모델이 많이 있습니다. 이 기사에는 가장 인기 있는 대형 모델 8개가 포함되어 있습니다.

위 내용은 ChatGPT와 Bard는 너무 비싸기 때문에 8가지 무료 오픈 소스 대형 모델 솔루션을 소개합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다.10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다.Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - ’

요리 혁신 요리 : 인공 지능이 식품 서비스를 변화시키는 방법요리 혁신 요리 : 인공 지능이 식품 서비스를 변화시키는 방법Apr 12, 2025 pm 12:09 PM

AI 식품 준비 여전히 초기 사용 중이지만 AI 시스템은 음식 준비에 점점 더 많이 사용되고 있습니다. AI 구동 로봇은 부엌에서 햄버거를 뒤집기, 피자 만들기 또는 SA 조립과 같은 음식 준비 작업을 자동화하는 데 사용됩니다

파이썬 네임 스페이스 및 가변 범위에 대한 포괄적 인 안내서파이썬 네임 스페이스 및 가변 범위에 대한 포괄적 인 안내서Apr 12, 2025 pm 12:00 PM

소개 파이썬 기능에서 변수의 네임 스페이스, 범위 및 동작을 이해하는 것은 효율적으로 작성하고 런타임 오류 또는 예외를 피하는 데 중요합니다. 이 기사에서는 다양한 ASP를 탐구 할 것입니다

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

Mediatek은 Kompanio Ultra 및 Dimensity 9400으로 프리미엄 라인업을 향상시킵니다.Mediatek은 Kompanio Ultra 및 Dimensity 9400으로 프리미엄 라인업을 향상시킵니다.Apr 12, 2025 am 11:52 AM

제품 케이던스를 계속하면서 이번 달 Mediatek은 새로운 Kompanio Ultra and Dimensity 9400을 포함한 일련의 발표를했습니다. 이 제품은 스마트 폰 용 칩을 포함하여 Mediatek 비즈니스의 전통적인 부분을 채우고 있습니다.

이번 주 AI : Walmart는 패션 트렌드를 설정하기 전에 패션 트렌드를 설정합니다.이번 주 AI : Walmart는 패션 트렌드를 설정하기 전에 패션 트렌드를 설정합니다.Apr 12, 2025 am 11:51 AM

#1 Google은 Agent2agent를 시작했습니다 이야기 : 월요일 아침입니다. AI 기반 채용 담당자로서 당신은 더 똑똑하지 않고 더 똑똑하지 않습니다. 휴대 전화에서 회사의 대시 보드에 로그인합니다. 세 가지 중요한 역할이 공급되고, 검증되며, 예정된 FO가 있음을 알려줍니다.

생성 AI는 사이코브블을 만난다생성 AI는 사이코브블을 만난다Apr 12, 2025 am 11:50 AM

나는 당신이되어야한다고 생각합니다. 우리 모두는 Psychobabble이 다양한 심리적 용어를 혼합하고 종종 이해할 수 없거나 완전히 무의미한 모듬 채터로 구성되어 있다는 것을 알고 있습니다. 당신이 fo를 뿌리기 위해해야 ​​할 일

프로토 타입 : 과학자들은 종이를 플라스틱으로 바꿉니다프로토 타입 : 과학자들은 종이를 플라스틱으로 바꿉니다Apr 12, 2025 am 11:49 AM

이번 주 발표 된 새로운 연구에 따르면 2022 년에 제조 된 플라스틱의 9.5%만이 재활용 재료로 만들어졌습니다. 한편, 플라스틱은 계속해서 매립지와 생태계에 전 세계에 쌓이고 있습니다. 그러나 도움이 진행 중입니다. 엥인 팀

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구