微調Google Gemma：使用自定義說明增強LLM-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

微調Google Gemma：使用自定義說明增強LLM

Lisa Kudrow

Mar 07, 2025 am 10:01 AM

Google Deepmind的Gemma：深入研究開源LLMS

> AI景觀正在嗡嗡作響，尤其是關於開源大語模型（LLM）的活動。諸如Google，Meta和Twitter之類的科技巨頭越來越擁抱開源開發。 Google DeepMind最近揭露了Gemma，這是一個使用與Google的Gemini Models相同的基礎研究和技術建造的輕巧的開源LLM家族。本文探討了Gemma模型，通過Cloud GPU和TPU的可訪問性，並提供了一個逐步指南，以在角色扮演數據集上微調Gemma 7b-it模型。

了解Google的Gemma

gemma（拉丁語中的“珍貴石頭”）是一個主要由Google DeepMind開發的僅是解碼的，文本到文本開放的模型。受雙子座模型的啟發，Gemma設計用於輕巧的操作和廣泛的框架兼容性。 Google已發布了兩個Gemma尺寸的模型權重：2B和7B，每個型號都有預訓練和指導調節的變體（例如Gemma 2b-it和Gemma 7b-it）。 Gemma的性能與其他開放模型相媲美，特別是在各種LLM基準測試中勝過Meta的Llama-2。

Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions 圖像源

Gemma的多功能性擴展到對多個框架（Keras 3.0，Pytorch，Jax，Hugging Face Transformers）和多樣的硬件（筆記本電腦，台式機，物聯網設備，移動和雲）的支持。使用流行的機器學習框架可以在自由雲TPU上進行推理和監督微調（SFT）。此外，Google與Gemma一起提供了一個負責任的生成AI工具包，為開發人員提供了創建更安全的AI應用程序的指導和工具。鼓勵AI和LLM的初學者探索基礎知識的AI基礎知識技能。

>訪問Google的Gemma模型

訪問Gemma很簡單。可以通過Huggingchat和Poe獲得免費訪問。通過從擁抱面孔下載模型權重並利用GPT4ALL或LMSTUDIO來下載模型權重，也可以使用本地用法。本指南重點是使用Kaggle的Free GPU和TPU進行推理。

>在TPU上運行Gemma推斷

>使用keras在TPU上運行gemma推斷，請按照以下步驟：：

>導航到keras/gemma，選擇“ gemma_instruct_2b_en”模型變體，然後單擊“新筆記本”。
>

!pip install -q tensorflow-cpu
!pip install -q -U keras-nlp tensorflow-hub
!pip install -q -U keras>=3
!pip install -q -U tensorflow-text

> jax.devices()驗證tpu可用性
作為keras後端：jaxos.environ["KERAS_BACKEND"] = "jax">
加載模型，並使用keras_nlp>函數生成文本。 generate>

Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions 圖像源

在GPU上運行Gemma推斷

用於使用變壓器的GPU推斷，請按照以下步驟：：

>導航到Google/gemma，選擇“變形金剛”，選擇“ 7b-it”變體，然後創建一個新筆記本。

選擇GPT T4 X2作為加速器。
>安裝所需軟件包：

%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U accelerate

>使用用於VRAM管理的bitsandbytes使用4位量化的模型。 >

圖像源

Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions >微調Google的Gemma：逐步指南>

本節使用Kaggle P100 GPU。

>設置

hieunguyenminh/roleplay安裝必要的軟件包：

導入所需的庫。

>定義基本模型，數據集和微調模型名稱的變量。

%%capture 
%pip install -U bitsandbytes 
%pip install -U transformers 
%pip install -U peft 
%pip install -U accelerate 
%pip install -U trl
%pip install -U datasets

加載數據集

>加載角色扮演數據集的前1000行。

加載模型和令牌

>使用帶有bitsandbytes的4位精度加載Gemma 7b-It模型。加載令牌儀並配置墊子令牌。

添加適配器層

>添加一個Lora適配器層以有效微調模型。

訓練模型

定義培訓參數（超參數）並創建一個sfttrainer。使用

。

訓練模型

保存模型

>在本地保存微調模型，然後將其推到擁抱的臉上輪轂。

模型推理

使用微調模型生成響應。 .train()

gemma 7b與角色扮演適配器的推斷

本節演示瞭如何加載基本模型和訓練有素的適配器，將其合併並生成響應。

最終想法

Google發布的Gemma的發布表示向AI開源協作的轉變。本教程提供了使用和微調Gemma模型的綜合指南，突出了開源開發和雲計算資源的力量。下一步是使用Langchain等框架構建您自己的基於LLM的應用程序。

以上是微調Google Gemma：使用自定義說明增強LLM的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

7強大的AI提示每個項目經理現在需要掌握May 08, 2025 am 11:39 AM

聊天機器人像Chatgpt這樣的聊天機器人舉例說明了生成的AI，為項目經理提供了功能強大的工具來簡化工作流程並確保項目按計劃和預算範圍內保持。但是，在製作正確的提示時有效使用鉸鏈。精確，細節

通過AI本身的有益協助，定義難以捉摸的AGI的含義不明的含義May 08, 2025 am 11:37 AM

定義人工智能（AGI）的挑戰是重大的。 AGI進步的主張通常缺乏明確的基準，其定義是針對預定的研究方向而定制的。本文探討了一種新穎的定義方法

IBM認為2025展示watsonx.data在生成AI中的作用May 08, 2025 am 11:32 AM

IBM WATSONX.DATA：簡化企業AI數據堆棧 IBM將WATSONX.DATA定位為企業的關鍵平台，旨在加速精確而可擴展的生成AI解決方案。這是通過簡化投訴來實現的

人形機器人機器的崛起即將到來。May 08, 2025 am 11:29 AM

在AI和材料科學領域的突破所推動的機器人技術的快速進步已準備好迎來人類機器人的新時代。多年來，工業自動化一直是主要重點，但是機器人的功能迅速exp

Netflix重新修改界面 - 首次亮相AI搜索工具和類似Tiktok的設計May 08, 2025 am 11:25 AM

Netflix 界面十年來最大更新：更智能、更個性化，擁抱多元內容 Netflix 週三宣布對其用戶界面進行十年來最大規模的改版，不僅外觀煥然一新，還增加了更多關於每個節目的信息，並引入了更智能的 AI 搜索工具，能夠理解模糊的概念（例如“氛圍”），以及更靈活的結構，以便更好地展示公司在新興的視頻遊戲、直播活動、體育賽事和其他新型內容方面的興趣。為了緊跟潮流，新的移動端豎屏視頻組件將使粉絲更容易滾動瀏覽預告片和片段，觀看完整節目或與他人分享內容。這讓人聯想起無限滾動且非常成功的短視頻網站 Ti

在AGI之前很久：三個AI里程碑會挑戰您May 08, 2025 am 11:24 AM

人工智能通用智能（AGI）的討論日益增多，促使許多人思考當人工智能超越人類智能時會發生什麼。這個時刻是近在咫尺還是遙遙無期，取決於你問誰，但我認為這並非我們應該關注的最重要的里程碑。哪些更早的人工智能里程碑會影響到每個人？哪些里程碑已經實現？以下是我認為已經發生的三件事。人工智能超越人類弱點在2022年的電影《社交困境》中，人文科技中心（Center for Humane Technology）的崔斯坦·哈里斯指出，人工智能已經超越了人類的弱點。這是什麼意思？這意味著人工智能已經能夠運用人類