首頁 >科技週邊 >人工智慧 >只需少量計算和記憶體資源即可運行的小型 Llama 大模型

只需少量計算和記憶體資源即可運行的小型 Llama 大模型

PHPz轉載: 2024-03-04 14:30:041087瀏覽

背景介紹

在當前資訊量爆炸的時代，語言模型的訓練日益變得複雜和困難。為了培訓一個高效率的語言模型，我們需要大量的運算資源和時間，這對許多人來說是不切實際的。同時，我們也面臨著如何在有限的記憶體和運算資源下運用大型語言模型的挑戰，尤其是在邊緣設備上。

今天要給大家推薦一個GitHub 開源專案jzhang38/TinyLlama，該專案在GitHub 有超過4.3k Star，用一句話介紹這個專案就是：「The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.」。

只需少量计算和内存资源即可运行的小型 Llama 大模型

專案介紹

TinyLlama的目標是在3兆個token上預訓練一個1.1B Llama模型。透過適當的優化，我們可以在短短90天內使用16個A100-40G GPUs來實現這一目標。該專案採用了與Llama 2完全相同的架構和tokenizer，這意味著TinyLlama可以輕鬆嵌入並在許多基於Llama的開源專案中使用。此外，TinyLlama非常緊湊，只有1.1B個參數。這種緊湊性使其能夠滿足許多需要限制計算和記憶體佔用的應用場景。

只需少量计算和内存资源即可运行的小型 Llama 大模型