微調整Google Gemma：カスタマイズされた手順でLLMを強化します-AI-php.cn

ホームページ

テクノロジー周辺機器

微調整Google Gemma：カスタマイズされた手順でLLMを強化します

Lisa Kudrow

Mar 07, 2025 am 10:01 AM

Google Deepmind's Gemma：オープンソースLLMS

に深く潜ります

AIの風景は、特にオープンソースの大手言語モデル（LLMS）に関して、アクティビティで賑わっています。 Google、Meta、Twitterなどのハイテク大手は、オープンソースの開発をますます受け入れています。 Google Deepmindは最近、GoogleのGeminiモデルと同じ基礎的な研究と技術を使用して構築された軽量でオープンソースLLMのファミリーであるGemmaを発表しました。この記事では、クラウドGPUとTPUを介したアクセシビリティをGemmaモデルで説明し、ロールプレイングデータセットでGemma 7B-ITモデルを微調整するための段階的なガイドを提供します。

GoogleのGemmaを理解してください

gemma（ラテン語の「貴重な石」を意味する）は、主にGoogle Deepmindによって開発されたデコーダーのみのテキストからテキストのオープンモデルのファミリーです。 Geminiモデルに触発されたGemmaは、軽量操作と幅広いフレームワークの互換性のために設計されています。 Googleは、2つのGemmaサイズのモデル重量をリリースしました：2Bと7Bは、それぞれが事前に訓練された命令チューニングされたバリアント（Gemma 2B-ITおよびGemma 7B-ITなど）で利用できます。 Gemmaのパフォーマンスは他のオープンモデルに匹敵します。

画像ソース Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions Gemmaの汎用性は、複数のフレームワーク（Keras 3.0、Pytorch、Jax、Hugging Face Transformers）および多様なハードウェア（ラップトップ、デスクトップ、IoTデバイス、モバイル、クラウド）のサポートにまで及びます。人気のある機械学習フレームワークを使用して、推論と監視付き微調整（SFT）は、無料のクラウドTPUで可能です。さらに、GoogleはGemmaと一緒に責任ある生成AIツールキットを提供し、開発者がより安全なAIアプリケーションを作成するためのガイダンスとツールを提供します。 AIおよびLLMSの初心者は、基礎知識のためにAIの基礎スキルトラックを探ることをお勧めします。 GoogleのGemmaモデルへのアクセス

ジェマへのアクセスは簡単です。無料アクセスは、HuggingchatとPoeから入手できます。また、顔を抱きしめ、GPT4allまたはLMStudioを利用してモデルの重みをダウンロードすることで、ローカルの使用も可能です。このガイドは、推論のためにKaggleの無料GPUとTPUを使用することに焦点を当てています。 tpusでgemmaの推論を実行している

Kerasを使用してTPUでGemma推論を実行するには、次の手順に従ってください。

keras/gemmaに移動し、「gemma_instruct_2b_en」モデルバリアントを選択し、「新しいノート」をクリックします。
必要なPythonライブラリをインストールする：

!pip install -q tensorflow-cpu
!pip install -q -U keras-nlp tensorflow-hub
!pip install -q -U keras>=3
!pip install -q -U tensorflow-text

を使用してTPUの可用性を確認します jax.devices()kerasバックエンドとして
jax os.environ["KERAS_BACKEND"] = "jax"
関数を使用してテキストを生成します。keras_nlp generate

画像ソース Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions GPUでgemma推論を実行している

変圧器を使用したGPU推論については、次の手順に従います

Google/Gemmaに移動し、「トランス」を選択し、「7B-IT」バリアントを選択し、新しいノートを作成します。

AcceleratorとしてGPT T4 X2を選択します

必要なパッケージをインストールする：

VRAM管理用のbitsandBytesを使用して4ビット量子化を使用してモデルをロードします。

%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U accelerate

画像ソース
このセクションでは、Kaggle P100 GPUを使用して、

セットアップ

Fine Tuning Google Gemma: Enhancing LLMs with Customized Instructions 必要なパッケージをインストール：

必要なライブラリをインポートします。

hieunguyenminh/roleplayベースモデル、データセット、および微調整されたモデル名の変数を定義します。

APIキーを使用してFace CLIを抱き締めるためにログインします。

ウェイトとバイアス（W＆B）ワークスペースを初期化します。

データセットの読み込み

ロールプレイングデータセットの最初の1000行をロードします。

%%capture 
%pip install -U bitsandbytes 
%pip install -U transformers 
%pip install -U peft 
%pip install -U accelerate 
%pip install -U trl
%pip install -U datasets

アダプターレイヤーの追加
ロラアダプターレイヤーを追加して、モデルを効率的に微調整します。

。

を使用してモデルをトレーニングします

モデルの保存

微調整されたモデルをローカルに保存し、抱きしめる顔のハブに押し込みます。

モデル推論

微調整されたモデルを使用して応答を生成しますロールプレイアダプターを備えた

gemma 7b推論

このセクションでは、ベースモデルと訓練されたアダプターをロードし、それらをマージし、応答を生成する方法を示しています。

最終的な考え

GoogleのGemmaのリリースは、AIでのオープンソースコラボレーションへのシフトを意味します。このチュートリアルは、オープンソースの開発とクラウドコンピューティングリソースの力を強調した、Gemmaモデルを使用および微調整するための包括的なガイドを提供しました。次のステップは、Langchainなどのフレームワークを使用して独自のLLMベースのアプリケーションを構築することです。

以上が微調整Google Gemma：カスタマイズされた手順でLLMを強化しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

7強力なAIは、すべてのプロジェクトマネージャーが今習得する必要があるプロンプトをプロンプトしますMay 08, 2025 am 11:39 AM

ChatGptのようなチャットボットによって例示される生成AIは、プロジェクトマネージャーにワークフローを合理化し、プロジェクトが予定外で予算内に留まることを保証する強力なツールを提供します。ただし、正しいプロンプトを作成するのに効果的な使用のヒンジ。正確、詳細

AI自体の有益な支援を介して、とらえどころのないAGIの不明確な意味を定義するMay 08, 2025 am 11:37 AM

人工一般情報（AGI）を定義するという課題は重要です。 AGIの進捗状況の主張は、しばしば明確なベンチマークを欠いており、定義は事前に決定された研究の方向に合うように調整されています。この記事では、定義への新しいアプローチを探ります

IBMは、2025が生成AIにおけるWatsonx.dataの役割を紹介していると考えていますMay 08, 2025 am 11:32 AM

IBM WATSONX.DATA：エンタープライズAIデータスタックの合理化 IBMは、Watsonx.Dataを、正確でスケーラブルな生成AIソリューションの提供を加速することを目的とした企業向けの重要なプラットフォームとして位置付けています。これは、Complを簡素化することによって達成されます

ヒューマノイドロボットマシンの台頭が近づいています。May 08, 2025 am 11:29 AM

AIおよび材料科学のブレークスルーに促進されたロボット工学の急速な進歩は、ヒューマノイドロボットの新しい時代を導く態勢が整っています。何年もの間、産業自動化が主な焦点でしたが、ロボットの能力は急速に経験しています

Netflix Revamps Interface - AI検索ツールとTiktokのようなデザインのデビューMay 08, 2025 am 11:25 AM

10年以内のNetflixインターフェイスの最大のアップデート：よりスマートでパーソナライズされた、採用される多様なコンテンツ Netflixは、10年でユーザーインターフェイスの最大の改良を発表しました。新しい外観だけでなく、各ショーに関する情報をさらに追加し、「アンビエント」やより柔軟な構造を理解するための曖昧な概念を理解できるよりスマートなAI検索ツールを紹介し、新興ビデオゲーム、ライブイベント、スポーツイベント、その他の新しいタイプのコンテンツにおいてよりよく示すことができます。トレンドに対応するために、モバイルの新しい垂直ビデオコンポーネントにより、ファンはトレーラーやクリップをスクロールしたり、完全なショーを見たり、他の人とコンテンツを共有したりすることが容易になります。これは、無限のスクロールと非常に成功した短いビデオWebサイトTIを思い出させます

AGIのずっと前：あなたに挑戦する3つのAIマイルストーンMay 08, 2025 am 11:24 AM

人工知能における一般的な知能（AGI）の議論の高まりにより、人工知能が人間の知能を上回ると何が起こるかについて多くの人が考えるようになりました。この瞬間が近いか遠いかは、あなたが尋ねる人に依存しますが、私たちが焦点を当てるべき最も重要なマイルストーンであるとは思いません。どの以前のAIマイルストーンがすべての人に影響を与えますか？どんなマイルストーンが達成されましたか？ここに私が起こったと思う3つのことがあります。人工知能は人間の弱点を上回ります 2022年の映画「社会的ジレンマ」で、人道技術センターのトリスタン・ハリスは、人工知能が人間の弱点を上回っていることを指摘しました。これはどういう意味ですか？これは、人工知能が人間を使用することができたことを意味します