Google Deepmind的Gemma:深入研究開源LLMS
> AI景觀正在嗡嗡作響,尤其是關於開源大語模型(LLM)的活動。 諸如Google,Meta和Twitter之類的科技巨頭越來越擁抱開源開發。 Google DeepMind最近揭露了Gemma,這是一個使用與Google的Gemini Models相同的基礎研究和技術建造的輕巧的開源LLM家族。本文探討了Gemma模型,通過Cloud GPU和TPU的可訪問性,並提供了一個逐步指南,以在角色扮演數據集上微調Gemma 7b-it模型。
>了解Google的Gemma
gemma(拉丁語中的“珍貴石頭”)是一個主要由Google DeepMind開發的僅是解碼的,文本到文本開放的模型。 受雙子座模型的啟發,Gemma設計用於輕巧的操作和廣泛的框架兼容性。 Google已發布了兩個Gemma尺寸的模型權重:2B和7B,每個型號都有預訓練和指導調節的變體(例如Gemma 2b-it和Gemma 7b-it)。 Gemma的性能與其他開放模型相媲美,特別是在各種LLM基準測試中勝過Meta的Llama-2。
圖像源
>訪問Google的Gemma模型
訪問Gemma很簡單。 可以通過Huggingchat和Poe獲得免費訪問。 通過從擁抱面孔下載模型權重並利用GPT4ALL或LMSTUDIO來下載模型權重,也可以使用本地用法。 本指南重點是使用Kaggle的Free GPU和TPU進行推理。
>在TPU上運行Gemma推斷>使用keras在TPU上運行gemma推斷,請按照以下步驟:
- >導航到keras/gemma,選擇“ gemma_instruct_2b_en”模型變體,然後單擊“新筆記本”。 在右面板中,選擇“ TPU VM VM V3-8”作為加速器。
- > 安裝必要的python庫:
!pip install -q tensorflow-cpu !pip install -q -U keras-nlp tensorflow-hub !pip install -q -U keras>=3 !pip install -q -U tensorflow-text
- 使用
- >
jax.devices()
驗證tpu可用性 set - 作為keras後端:
jax
os.environ["KERAS_BACKEND"] = "jax"
> >使用 - 加載模型,並使用
keras_nlp
>函數生成文本。generate
>
圖像源
用於使用變壓器的GPU推斷,請按照以下步驟:
>導航到Google/gemma,選擇“變形金剛”,選擇“ 7b-it”變體,然後創建一個新筆記本。
- 選擇GPT T4 X2作為加速器。 >
- >安裝所需軟件包:
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U accelerate>使用用於VRAM管理的bitsandbytes使用4位量化的模型。
- 加載令牌。
- >創建一個提示,將其傳遞給模型,解碼輸出並顯示結果。
- 。
>微調Google的Gemma:逐步指南>
>設置
hieunguyenminh/roleplay
安裝必要的軟件包:
- 導入所需的庫。
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U peft %pip install -U accelerate %pip install -U trl %pip install -U datasets
- >使用您的API鍵登錄以擁抱Face CLI。
- > 初始化重量和偏見(W&B)工作區。
- 加載數據集
- >加載角色扮演數據集的前1000行。
- 加載模型和令牌
添加適配器層
>添加一個Lora適配器層以有效微調模型。
訓練模型
定義培訓參數(超參數)並創建一個sfttrainer。 使用
。訓練模型
保存模型>在本地保存微調模型,然後將其推到擁抱的臉上輪轂。
模型推理
使用微調模型生成響應。 .train()
本節演示瞭如何加載基本模型和訓練有素的適配器,將其合併並生成響應。
最終想法
Google發布的Gemma的發布表示向AI開源協作的轉變。 本教程提供了使用和微調Gemma模型的綜合指南,突出了開源開發和雲計算資源的力量。 下一步是使用Langchain等框架構建您自己的基於LLM的應用程序。>
以上是微調Google Gemma:使用自定義說明增強LLM的詳細內容。更多資訊請關注PHP中文網其他相關文章!

聊天機器人像Chatgpt這樣的聊天機器人舉例說明了生成的AI,為項目經理提供了功能強大的工具來簡化工作流程並確保項目按計劃和預算範圍內保持。 但是,在製作正確的提示時有效使用鉸鏈。 精確,細節

定義人工智能(AGI)的挑戰是重大的。 AGI進步的主張通常缺乏明確的基準,其定義是針對預定的研究方向而定制的。本文探討了一種新穎的定義方法

IBM WATSONX.DATA:簡化企業AI數據堆棧 IBM將WATSONX.DATA定位為企業的關鍵平台,旨在加速精確而可擴展的生成AI解決方案。 這是通過簡化投訴來實現的

在AI和材料科學領域的突破所推動的機器人技術的快速進步已準備好迎來人類機器人的新時代。 多年來,工業自動化一直是主要重點,但是機器人的功能迅速exp

Netflix 界面十年來最大更新:更智能、更個性化,擁抱多元內容 Netflix 週三宣布對其用戶界面進行十年來最大規模的改版,不僅外觀煥然一新,還增加了更多關於每個節目的信息,並引入了更智能的 AI 搜索工具,能夠理解模糊的概念(例如“氛圍”),以及更靈活的結構,以便更好地展示公司在新興的視頻遊戲、直播活動、體育賽事和其他新型內容方面的興趣。 為了緊跟潮流,新的移動端豎屏視頻組件將使粉絲更容易滾動瀏覽預告片和片段,觀看完整節目或與他人分享內容。這讓人聯想起無限滾動且非常成功的短視頻網站 Ti

人工智能通用智能(AGI)的討論日益增多,促使許多人思考當人工智能超越人類智能時會發生什麼。這個時刻是近在咫尺還是遙遙無期,取決於你問誰,但我認為這並非我們應該關注的最重要的里程碑。哪些更早的人工智能里程碑會影響到每個人?哪些里程碑已經實現?以下是我認為已經發生的三件事。 人工智能超越人類弱點 在2022年的電影《社交困境》中,人文科技中心(Center for Humane Technology)的崔斯坦·哈里斯指出,人工智能已經超越了人類的弱點。這是什麼意思?這意味著人工智能已經能夠運用人類

Transunion的首席技術官Ranganath Achanta在2021年末加入公司後加入公司以來,率先進行了重大的技術轉變。

建立信任至關重要,對於成功採用業務的AI是至關重要的。 考慮到業務流程中的人類因素,這尤其如此。 像其他任何人一樣,員工對AI及其實施引起了人們的關注。 德勤研究人員是SC


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

Dreamweaver Mac版
視覺化網頁開發工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。