집 >기술 주변기기 >일체 포함 >최소한의 계산 및 메모리 리소스로 실행할 수 있는 소형 Llama 대형 모델

최소한의 계산 및 메모리 리소스로 실행할 수 있는 소형 Llama 대형 모델

PHPz앞으로: 2024-03-04 14:30:041055검색

배경 소개

폭발적인 정보화 시대에 언어 모델의 훈련은 점점 복잡해지고 어려워지고 있습니다. 효율적인 언어 모델을 훈련하려면 많은 컴퓨팅 리소스와 시간이 필요하지만 이는 많은 사람들에게 비현실적입니다. 동시에 우리는 제한된 메모리와 컴퓨팅 리소스, 특히 엣지 디바이스에서 대규모 언어 모델을 적용하는 방법에 대한 과제에 직면해 있습니다.

오늘 저는 GitHub 오픈 소스 프로젝트 jzhang38/TinyLlama를 추천하고 싶습니다. 이 프로젝트는 GitHub에 4300개가 넘는 별이 있습니다. 이 프로젝트를 한 문장으로 소개하면 "TinyLlama 프로젝트는 3조 토큰에 대한 11억 라마 모델.”

只需少量计算和内存资源即可运行的小型 Llama 大模型

프로젝트 소개

TinyLlama의 목표는 3조 토큰으로 11억 개의 Llama 모델을 사전 훈련하는 것입니다. 적절한 최적화를 통해 16개의 A100-40G GPU를 사용하여 단 90일 만에 이를 달성할 수 있습니다. 이 프로젝트는 Llama 2와 정확히 동일한 아키텍처 및 토크나이저를 사용합니다. 이는 TinyLlama를 쉽게 내장하고 많은 Llama 기반 오픈 소스 프로젝트에 사용할 수 있음을 의미합니다. 또한 TinyLlama는 매개변수가 1.1B에 불과하여 매우 컴팩트합니다. 이러한 컴팩트함은 제한된 컴퓨팅 및 메모리 공간이 필요한 많은 애플리케이션 시나리오에 적합합니다.

只需少量计算和内存资源即可运行的小型 Llama 大模型