検索
ホームページテクノロジー周辺機器AIChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています

Meta モデルに基づく ChatGPT の軽量バージョンはここにありますか?

Meta が LLaMA の立ち上げを発表してからわずか 3 日後、LLaMA を ChatGPT に変換したオープンソースのトレーニング手法が業界に登場し、トレーニング速度が ChatGPT よりも最大 15 倍速いと主張しました。

LLaMA は Meta 社が開発した超高速かつ超小型の GPT-3 で、パラメータ数は後者の 10% に過ぎず、実行に必要な GPU は 1 つだけです。

これを ChatGPT に変換する手法は ChatLLaMA と呼ばれ、RLHF (ヒューマン フィードバックに基づく強化学習) に基づいてトレーニングされ、インターネットで急速に普及しました。

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています

Meta の ChatGPT のオープンソース バージョンは本当に登場するのでしょうか?

ちょっと待ってください、物事はそれほど単純ではありません。

LLaMA を ChatGPT の「オープンソース メソッド」にトレーニングする

ChatLLaMA プロジェクトのホームページをクリックすると、実際には 4 つの部分 (

DeepSpeed、RLHF メソッド、LLaMA) が統合されていることがわかります。 LangChain エージェントに基づいて生成されたデータ セット。

その中で、DeepSpeed はオープンソースの深層学習トレーニング最適化ライブラリであり、大規模モデルのトレーニング機能を向上させるために使用される Zero と呼ばれる既存の最適化技術が含まれており、具体的にはモデルのトレーニング向上を支援することを指します。速度、コストの削減、モデルの可用性の向上など。

RLHF は報酬モデルを使用して、事前トレーニングされたモデルを微調整します。報酬モデルは、最初に複数のモデルを使用して質問と回答を生成し、次に質問と回答の手動並べ替えに依存してスコアリングを学習します。次に、報酬学習に基づいてモデルによって生成された回答をスコアリングし、強化学習によるモデルの機能。

LangChain は、さまざまな大規模言語モデルを統合し、他の知識ソースやコンピューティング機能と組み合わせた実用的なアプリケーションを作成することを目的とした大規模言語モデル アプリケーション開発ライブラリです。 LangChainエージェントはGPT-3の思考プロセス全体を思考連鎖のように公開し、操作を記録します。

この時点で、最も重要なのはやはり LLaMA モデルの重みであることがわかります。それはどこから来たのですか?

ねえ、Meta にアクセスして自分で申請してください。ChatLLaMA はそれを提供しません。 (Meta は LLaMA をオープンソースだと主張していますが、それでも申請する必要があります)

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています

したがって、本質的に、ChatLLaMA はオープンソースの ChatGPT プロジェクトではなく、LLaMA に基づく単なるトレーニング方法です。そのライブラリに統合されているいくつかのプロジェクトは、もともとオープンソースでした。

実際、ChatLLaMA は Meta によって構築されたものではなく、Nebuly AI という新興 AI 企業によって構築されました。

Nebuly AI は、AI システムのパフォーマンスを向上させるための一連のプラグ アンド プレイ最適化モジュールを統合する、Nebullvm と呼ばれるオープン ソース ライブラリを作成しました。

たとえば、現在 Nebullvm に含まれているモジュールには、DeepMind のオープン ソース AlphaTensor アルゴリズムに基づく OpenAlphaTensor、ハードウェアを自動的に感知して高速化する最適化モジュールなどがあります。

##ChatLLaMA もこのシリーズのモジュールに含まれていますが、そのオープンソース ライセンスは市販されていないことに注意してください。

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われていますしたがって、「国内自社開発 ChatGPT」を直接使用したい場合は、それほど単純ではないかもしれません (doge)。

このプロジェクトを読んだ後、一部のネチズンは、誰かが本当に LLaMA のモデル重み (コード) を取得できたら素晴らしいのにと言いました...

しかし、一部のネチズンは、「ChatGPT トレーニング メソッドより 15 倍速い」という記述はまったくの誤解を招くものであると指摘しました。

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています

いわゆる 15 倍速いというのは、単に LLaMA モデル自体が非常に小さく、単一の GPU 上で実行することもできますが、それはこのプロジェクトによって行われたものではないはずですよね?

このネチズンは、ライブラリにある trlx と呼ばれる RLHF トレーニング方法よりも優れた RLHF トレーニング方法も推奨しています。トレーニング速度は通常の RLHF 方法よりも速いです。 . 3 ~ 4 回:

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています

#LLaMA のコードは入手しましたか?このトレーニング方法についてどう思いますか?

ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われていますChatLLaMA アドレス:

https://www.php.cn/link/fed537780f3f29cc5d5f313bb​​da423c4

参考リンク: https://www.php.cn/link/fe27f92b1e3f4997567807f38d567a35

以上がChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできます1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできますApr 25, 2025 am 11:16 AM

HiddenLayerの画期的な研究は、主要な大規模な言語モデル(LLMS)における重大な脆弱性を明らかにしています。 彼らの発見は、ほぼすべての主要なLLMSを回避できる「政策の人形劇」と呼ばれる普遍的なバイパス技術を明らかにしています

5つの間違いほとんどの企業が今年持続可能性を備えています5つの間違いほとんどの企業が今年持続可能性を備えていますApr 25, 2025 am 11:15 AM

環境責任と廃棄物の削減の推進は、企業の運営方法を根本的に変えています。 この変革は、製品開発、製造プロセス、顧客関係、パートナーの選択、および新しいものの採用に影響します

H20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたH20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたApr 25, 2025 am 11:12 AM

高度なAIハードウェアに関する最近の制限は、AI優位のためのエスカレートする地政学的競争を強調し、中国の外国半導体技術への依存を明らかにしています。 2024年、中国は3,850億ドル相当の半導体を大量に輸入しました

OpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますOpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますApr 25, 2025 am 11:11 AM

GoogleからのChromeの強制的な売却の可能性は、ハイテク業界での激しい議論に火をつけました。 Openaiが65%の世界市場シェアを誇る大手ブラウザを取得する見込みは、THの将来について重要な疑問を提起します

AIが小売メディアの成長する痛みをどのように解決できるかAIが小売メディアの成長する痛みをどのように解決できるかApr 25, 2025 am 11:10 AM

全体的な広告の成長を上回っているにもかかわらず、小売メディアの成長は減速しています。 この成熟段階は、生態系の断片化、コストの上昇、測定の問題、統合の複雑さなど、課題を提示します。 ただし、人工知能

「aiは私たちであり、それは私たち以上のものです」「aiは私たちであり、それは私たち以上のものです」Apr 25, 2025 am 11:09 AM

古いラジオは、ちらつきと不活性なスクリーンのコレクションの中で静的なパチパチと鳴ります。簡単に不安定になっているこの不安定な電子機器の山は、没入型展示会の6つのインスタレーションの1つである「e-waste land」の核心を形成しています。

Google Cloudは、次の2025年にインフラストラクチャについてより深刻になりますGoogle Cloudは、次の2025年にインフラストラクチャについてより深刻になりますApr 25, 2025 am 11:08 AM

Google Cloudの次の2025年:インフラストラクチャ、接続性、およびAIに焦点を当てています Google Cloudの次の2025年の会議では、多くの進歩を紹介しました。 特定の発表の詳細な分析については、私の記事を参照してください

Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Apr 25, 2025 am 11:07 AM

今週はAIとXR:AIを搭載した創造性の波が、音楽の世代から映画制作まで、メディアとエンターテイメントを席巻しています。 見出しに飛び込みましょう。 AIに生成されたコンテンツの影響力の高まり:テクノロジーコンサルタントのShelly Palme

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。