130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시-일체 포함-php.cn

집

기술 주변기기

일체 포함

130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시

PHPz

Apr 07, 2023 pm 03:12 PM

모델기차

Meta가 LLaMA 시리즈 모델을 출시하고 오픈소스화한 이후 Stanford University, UC Berkeley 및 기타 기관의 연구자들은 LLaMA를 기반으로 한 "두 번째 생성"을 수행했으며 Alpaca, Vicuna 등 여러 "alpaca" 모델을 연달아 출시했습니다. . 모델.

Alpaca는 오픈 소스 커뮤니티의 새로운 최고 플레이어가 되었습니다. '2차 창조물'이 풍부하기 때문에 생물학적 알파카속을 가리키는 영어 단어는 거의 사용되지 않지만, 다른 동물의 이름을 따서 대형 모델에 이름을 붙이는 것도 가능하다.

최근 UC Berkeley의 Berkeley Artificial Intelligence Institute(BAIR)에서는 소비자급 GPU에서 실행할 수 있는 대화 모델 Koala(문자 그대로 Koala로 번역됨)를 출시했습니다. Koala는 웹에서 수집한 대화 데이터를 사용하여 LLaMA 모델을 미세 조정합니다.

130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시

프로젝트 주소: https://bair.berkeley.edu/blog/2023/04/03/koala/

Koala가 온라인 테스트 데모를 시작했습니다:

130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시

데모 주소: https://chat.lmsys.org/?model=koala-13b
오픈 소스 주소: https://github.com/young-geng/EasyLM

Koala 개요

Vicuna와 마찬가지로 Koala는 웹에서 수집한 대화 데이터를 사용하여 LLaMA 모델을 미세 조정하며 ChatGPT와 같은 비공개 소스 대형 모델을 사용한 대화에 대한 공개 데이터에 중점을 둡니다.

연구팀은 Koala 모델이 JAX/Flax를 사용하여 EasyLM에서 구현되었으며 Koala 모델은 8개의 A100 GPU가 장착된 단일 Nvidia DGX 서버에서 훈련되었다고 밝혔습니다. 2개의 학습 에포크를 완료하는 데 6시간이 소요됩니다. 이러한 교육 비용은 일반적으로 공용 클라우드 컴퓨팅 플랫폼에서 100달러 미만입니다.

연구팀은 Koala를 ChatGPT 및 Stanford University의 Alpaca와 실험적으로 비교한 결과 다음과 같이 나타났습니다. 130억 개의 매개변수를 갖춘 Koala-13B는 다양한 사용자 쿼리에 효과적으로 응답할 수 있으며 생성된 응답은 일반적으로 Alpaca보다 우수하며 성능도 뛰어납니다. 절반 이상의 경우에서 ChatGPT와 유사합니다.

코알라의 가장 중요한 의미는 고품질의 데이터 세트로 훈련할 때 로컬에서 실행할 수 있을 만큼 작은 모델도 대형 모델과 유사한 우수한 성능을 얻을 수 있음을 보여준다는 것입니다. 이는 오픈 소스 커뮤니티가 고품질 데이터 세트를 선별하기 위해 더 열심히 노력해야 함을 의미합니다. 이는 단순히 기존 시스템의 크기를 늘리는 것보다 더 안전하고 현실적이며 강력한 모델로 이어질 수 있기 때문입니다. 이러한 관점에서 Koala는 ChatGPT에 대한 작지만 세련된 대안입니다.

그러나 코알라는 아직 연구용 프로토타입일 뿐이고 내용, 보안, 신뢰성에 큰 결함이 있어 연구 이외의 목적으로 사용해서는 안 됩니다.

데이터 세트 및 훈련

대화 모델 구축의 주요 장애물은 훈련 데이터를 관리하는 것입니다. ChatGPT, Bard, Bing Chat 및 Claude와 같은 대규모 대화 모델은 모두 광범위한 사람 주석이 포함된 독점 데이터 세트를 사용합니다. Koala의 훈련 데이터 세트를 구축하기 위해 연구팀은 ChatGPT와 같은 대규모 언어 모델을 사용하는 사용자가 공개적으로 공유하는 데이터가 포함된 웹 및 공개 데이터 세트에서 대화 데이터를 수집하고 선별했습니다.

데이터세트를 최대화하기 위해 최대한 많은 웹 데이터를 크롤링하는 다른 모델과 달리 Koala는 공개 데이터세트의 Q&A 섹션, 인간 피드백(긍정적 및 부정적), 기존 사용자와의 대화 등 소규모 고품질 데이터세트 수집에 중점을 둡니다. 언어 모델. 특히 Koala의 훈련 데이터 세트에는 다음 부분이 포함됩니다.

ChatGPT 증류 데이터:

ChatGPT(ShareGPT)를 통해 공개적으로 사용 가능한 대화 데이터
Human ChatGPT 비교 코퍼스(HC3); HC3 데이터 세트의 인간 및 ChatGPT 응답이 사용됩니다.

오픈 소스 데이터:

OIG(Open Instruction Generalist);
Stanford Alpaca 모델에서 사용되는 데이터 세트
OpenAI WebGPT; .
실험 및 평가
본 연구에서는 Koala-Distill, Alpaca 및 ChatGPT와 Koala-All의 생성 결과를 비교하기 위해 수동 평가를 수행했습니다. 결과는 아래 그림과 같습니다. 그 중 두 개의 서로 다른 데이터 세트가 테스트에 사용되는데, 하나는 180개의 테스트 쿼리가 포함된 Stanford의 Alpaca 테스트 세트(Alpaca 테스트 세트)이고, 다른 하나는 Koala 테스트 세트입니다.

전반적으로 Koala 모델은 LLM의 많은 기능을 보여주기에 충분하면서도 제한된 컴퓨팅 리소스로 미세 조정 또는 사용이 용이할 만큼 작습니다. 연구팀은 Koala 모델이 대규모 언어 모델에 대한 향후 학술 연구에 유용한 플랫폼이 되기를 바라고 있습니다. 잠재적인 연구 적용 방향은 다음과 같습니다.

130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시 안전성 및 정렬: Koala는 언어 모델의 보안에 대한 추가 연구를 허용합니다. 인간의 의도에 더 잘 부합하고 일관성을 유지합니다.

모델 편향: Koala를 사용하면 대규모 언어 모델의 편향을 더 잘 이해하고 대화 데이터 세트의 품질 문제를 조사하며 궁극적으로 대규모 언어 모델의 성능을 향상시키는 데 도움이 됩니다.

대규모 언어 모델 이해: Koala 모델은 상대적으로 저렴한 소비자급 GPU에서 실행되고 다양한 작업을 수행할 수 있기 때문에 Koala를 사용하면 대화형 언어 모델의 내부 구조를 더 잘 검사하고 이해할 수 있어 언어 모델을 더 설명하기 쉽게 만들 수 있습니다.

위 내용은 130억 개의 매개변수, 8개의 A100 트레이닝, UC 버클리, 대화 모델 코알라 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

LM Studio를 사용하여 LLM을 로컬로 운영하는 방법은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:38 AM

집에서 쉽게 대형 언어 모델 실행 : LM Studio User Guide 최근 몇 년 동안 소프트웨어 및 하드웨어의 발전으로 개인용 컴퓨터에서 LLM (Large Language Model)을 실행할 수있었습니다. LM Studio는이 프로세스를 쉽고 편리하게 만드는 훌륭한 도구입니다. 이 기사는 LM Studio를 사용하여 LLM을 로컬로 운영하는 방법, 주요 단계, 잠재적 문제 및 LLM의 이점을 현지에서 사용하는 방법에 따라 다릅니다. 당신이 기술 애호가이거나 최신 AI 기술에 대해 궁금하든이 가이드는 귀중한 통찰력과 실용적인 팁을 제공합니다. 시작합시다! 개요 LLM을 로컬로 실행하기위한 기본 요구 사항을 이해하십시오. 컴퓨터에 LM Studi를 설정하십시오

Guy Peri는 데이터 변환을 통해 McCormick의 미래를 도와줍니다Apr 19, 2025 am 11:35 AM

Guy Peri는 McCormick의 최고 정보 및 디지털 책임자입니다. Peri는 그의 역할에 7 개월 만에 회사의 디지털 기능에 대한 포괄적 인 변화를 빠르게 발전시키고 있습니다. 데이터 및 분석에 대한 그의 경력에 중점을 둡니다

신속한 엔지니어링에서 감정의 사슬은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:33 AM

소개 인공 지능 (AI)은 인간의 손길로 반응하는 단어뿐만 아니라 감정을 이해하기 위해 진화하고 있습니다. 이 정교한 상호 작용은 빠르게 발전하는 AI 및 자연어 처리 분야에서 중요합니다. th

12 데이터 과학 워크 플로우를위한 최고의 AI 도구 - 분석 VidhyaApr 19, 2025 am 11:31 AM

소개 오늘날의 데이터 중심 세계에서 고급 AI 기술을 활용하는 것은 경쟁 우위와 효율성을 높이는 비즈니스에 중요합니다. 다양한 강력한 도구는 데이터 과학자, 분석가 및 개발자가 구축, Depl을 구축 할 수 있도록 힘을 실어줍니다.

AV 바이트 : OpenAi의 GPT-4O 미니 및 기타 AI 혁신Apr 19, 2025 am 11:30 AM

이번 주 AI 환경은 Openai, Mistral AI, Nvidia, Deepseek 및 Hugging Face와 같은 업계 대기업의 획기적인 릴리스로 폭발했습니다. 이 새로운 모델은 TR의 발전으로 인해 증가 된 전력, 경제성 및 접근성을 약속합니다.

Perplexity의 Android 앱은 보안 결함에 감염되어 있으며 보고서는Apr 19, 2025 am 11:24 AM

그러나 검색 기능뿐만 아니라 AI 보조원 역할을하는 회사의 Android 앱은 사용자에게 데이터 도난, 인수 및 악의적 인 공격에 노출 될 수있는 다양한 보안 문제로 가득 차 있습니다.

모두가 AI 사용에 더 나아지고 있습니다 : Vibe 코딩에 대한 생각Apr 19, 2025 am 11:17 AM

컨퍼런스와 전시회에서 무슨 일이 일어나고 있는지 볼 수 있습니다. 엔지니어에게 자신이하고있는 일을 물어 보거나 CEO와 상담 할 수 있습니다. 당신이 보는 곳마다, 상황은 졸린 속도로 변화하고 있습니다. 엔지니어 및 비 엔지니어 차이점은 무엇입니까?

Rocketpy -Analytics Vidhya를 사용한 로켓 런칭 시뮬레이션 및 분석Apr 19, 2025 am 11:12 AM

Rocketpy : 포괄적 인 가이드로 로켓 발사 시뮬레이션 이 기사는 강력한 파이썬 라이브러리 인 Rocketpy를 사용하여 고출력 로켓 런칭을 시뮬레이션하는 것을 안내합니다. 로켓 구성 요소 정의에서 Simula 분석에 이르기까지 모든 것을 다룰 것입니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.