検索
ホームページテクノロジー周辺機器AI130億パラメータ、8つのA100トレーニング、カリフォルニア大学バークレー校が対話モデルKoalaをリリース

Meta が LLaMA シリーズのモデルをリリースしてオープンソース化して以来、スタンフォード大学、カリフォルニア大学バークレー校などの研究者が LLaMA に基づいて「二次創作」を行い、Alpaca、Vicuna などを次々と発表してきました。 「アルパカ」の大型モデル。

Alpaca は、オープンソース コミュニティの新しいリーダーになりました。 「二次創作」の氾濫により、生物学上のアルパカ属を表す英語はほとんど使われなくなったが、大型モデルに他の動物の名前を付けることも可能である。

最近、カリフォルニア大学バークレー校のバークレー人工知能研究所 (BAIR) は、消費者グレードの GPU で実行できる会話モデル Koala (直訳すると「コアラ」) をリリースしました。 Koala は、Web から収集した会話データを使用して LLaMA モデルを微調整します。

130億パラメータ、8つのA100トレーニング、カリフォルニア大学バークレー校が対話モデルKoalaをリリース

プロジェクトのアドレス: https://bair.berkeley.edu/blog/2023/04/03/koala/

#Koala はオンライン テスト デモを開始しました:

130億パラメータ、8つのA100トレーニング、カリフォルニア大学バークレー校が対話モデルKoalaをリリース

  • #デモ アドレス: https ://chat.lmsys.org/?model=koala-13b
  • オープンソース アドレス: https://github.com/young-geng/EasyLM

Koala の概要

Vicuna と同様、Koala もネットワークから収集した会話データを使用して、次のことに重点を置いて LLaMA モデルを微調整します。 ChatGPT クローズドソースの大規模モデル対話の公開データ。

研究チームは、Koala モデルは JAX/Flax を使用して EasyLM に実装されており、Koala モデルは 8 つの A100 GPU を搭載した単一の Nvidia DGX サーバーでトレーニングされていると述べています。 2 エポックのトレーニングを完了するには 6 時間かかります。このようなトレーニングの費用は、パブリック クラウド コンピューティング プラットフォームでは通常 100 ドル未満です。

研究チームは、Koala と ChatGPT およびスタンフォード大学の Alpaca を実験的に比較しました。その結果、130 億のパラメーターを備えた Koala-13B が、さまざまなユーザーのクエリに効果的に応答し、応答を生成できることが一般的に優れていることがわかりました。 Alpaca のパフォーマンスは、半分以上のケースで ChatGPT のパフォーマンスに匹敵します。

Koala の最も重要な意義は、高品質のデータセットでトレーニングした場合、ローカルで実行できるほど小さなモデルでも大規模モデルと同様の優れたパフォーマンスを達成できることを示していることです。モデル 。これは、単に既存のシステムのサイズを増やすよりも、より安全で現実的で強力なモデルにつながる可能性があるため、オープンソース コミュニティは高品質のデータセットを厳選するためにより熱心に取り組む必要があることを意味します。この観点から見ると、Koala は小さいながらも ChatGPT の洗練された代替品です。

ただし、Koala は研究用のプロトタイプにすぎず、コンテンツ、セキュリティ、信頼性の点で依然として重大な欠陥があるため、研究以外の目的で使用しないでください。

データセットとトレーニング

会話モデルを構築する際の主なハードルは、トレーニング データの管理です。 ChatGPT、Bard、Bing Chat、Claude などの大規模な会話モデルはすべて、広範な人間による注釈を備えた独自のデータセットを使用します。 Koala のトレーニング データセットを構築するために、研究チームは、Web および公開データセットから会話データを収集して厳選しました。これらのデータセットには、ChatGPT などの大規模な言語モデルで話しているユーザーによって公開で共有されたデータが含まれています。

データ セットを最大化するためにできるだけ多くのネットワーク データをクロールする他のモデルとは異なり、Koala は、公開データ セットの質問と回答の部分を含む、小規模で高品質のデータ セットを収集することに重点を置いています。 、人間によるフィードバック (肯定的および否定的) および既存の言語モデルとの対話。具体的には、Koala のトレーニング データ セットには次の部分が含まれています:

ChatGPT 蒸留データ:

  • 一般公開chatGPT 会話データ (ShareGPT);
  • Human ChatGPT 比較コーパス (HC3)、HC3 データセットからの人間の応答と ChatGPT 応答の両方を使用します。

オープンソース データ:

  • オープン インストラクション ジェネラリスト (OIG);
  • スタンフォード アルパカ モデルで使用されるデータセット;
  • Anthropic HH ;
  • OpenAI WebGPT;
  • OpenAI の要約。

実験と評価

この研究では、Koala-All の生成と Koala-Distill、Alpaca、および ChatGPT を比較する手動評価を実施しました。結果は下の図に示されています。このうち、2 つの異なるデータ セットがテストに使用されます。1 つは 180 のテスト クエリを含むスタンフォードの Alpaca テスト セット (Alpaca Test Set)、もう 1 つは Koala Test Set です。

130億パラメータ、8つのA100トレーニング、カリフォルニア大学バークレー校が対話モデルKoalaをリリース

全体的に、Koala モデルは、LLM の多くの機能を実証するのに十分ですが、微調整を容易にしたり、コンピューティング リソースが不足している状況でも十分に小さいため、限定されておりますので、以下をご利用ください。研究チームは、Koala モデルが大規模言語モデルに関する将来の学術研究にとって有用なプラットフォームになることを期待しています。研究応用の方向性としては次のものが考えられます:

  • 安全性と調整: Koala により、言語モデルのセキュリティと人間の意図とのより良い調整に関するさらなる研究が可能になります。
  • モデル バイアス: Koala を使用すると、大規模な言語モデルのバイアスをより深く理解し、会話データセットの品質問題を掘り下げ、最終的には大規模な言語モデルのパフォーマンスの向上に役立ちます。
  • 大規模な言語モデルを理解する: Koala モデルは比較的安価な消費者向け GPU で実行でき、さまざまなタスクを実行できるため、Koala を使用すると、会話言語の内部構造をよりよく調べて理解できるようになります。このモデルにより、言語モデルがより解釈しやすくなります。

以上が130億パラメータ、8つのA100トレーニング、カリフォルニア大学バークレー校が対話モデルKoalaをリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
迅速なエンジニアリングにおける数値的推論のチェーンは何ですか?迅速なエンジニアリングにおける数値的推論のチェーンは何ですか?Apr 17, 2025 am 10:08 AM

導入 迅速に進化する人工知能と自然言語処理の分野では、迅速なエンジニアリングが重要です。 その技術の中で、数値推論のチェーン(CONR)は、AIを強化するための非常に効果的な方法として際立っています

Kaggle Grandmastersが使用するトップPythonライブラリKaggle Grandmastersが使用するトップPythonライブラリApr 17, 2025 am 10:03 AM

Kaggle Grandmastersの秘密のロックを解除する:トップPythonライブラリが明らかにした データサイエンスコンペティションのプレミアプラットフォームであるKaggleは、エリートパフォーマーの選択グループであるKaggle Grandmastersを誇っています。 これらの個人は一貫してInnovaを提供します

AI PCSが職場を変革する10の方法-AnalyticsVidhyaAI PCSが職場を変革する10の方法-AnalyticsVidhyaApr 17, 2025 am 09:59 AM

仕事の未来:AI PCが職場にどのように革命をもたらすか 人工知能(AI)のパーソナルコンピューターへの統合(AI PCS)は、職場技術における大幅な前進を表しています。 AIの融合として定義されたAI PCS

Excelで塗装を凍結する方法は?Excelで塗装を凍結する方法は?Apr 17, 2025 am 09:56 AM

エクセルフリーズペイン機能の詳細な説明:大規模なデータセットを効率的に処理する Microsoft Excelは、データを整理および分析するための優れたツールの1つであり、フリーズペイン機能はそのハイライトの1つです。この機能を使用すると、特定の行または列をピン留めすることで、残りのスプレッドシートを閲覧している間に表示されたままにして、データの監視と比較を簡素化できます。この記事では、Excel Freeze Pane機能の使用方法に飛び込み、いくつかの実用的なヒントと例を提供します。 機能的な概要 Excelのフリーズペイン機能により、大きなデータセットをスクロールするときに特定の行または列が表示され、データの監視と比較が容易になります。 ナビゲーション効率を改善し、タイトルを表示し続け、大規模なスプレッドシートのデータ比較を簡素化します。 [ビュー]タブとフリーズを介して提供します

Neo4J対Amazon Neptune:データエンジニアリングのグラフデータベースNeo4J対Amazon Neptune:データエンジニアリングのグラフデータベースApr 17, 2025 am 09:52 AM

相互接続されたデータの複雑さのナビゲーション:Neo4J対Amazon Neptune 今日のデータが豊富な世界では、複雑な相互接続された情報を効率的に管理することが最重要です。従来のデータベースは関連性がありますが、彼らはしばしばこんにちはと苦労しています

メタサム2:アーキテクチャ、アプリケーション、制限 - 分析Vidhyaメタサム2:アーキテクチャ、アプリケーション、制限 - 分析VidhyaApr 17, 2025 am 09:40 AM

メタのセグメントAnything Anything Model 2(SAM-2):リアルタイムの画像とビデオセグメンテーションの巨大な飛躍 メタは再び人工知能の境界をSAM-2で押し上げました。

AIワークフローと消費者体験のためのデータ戦略AIワークフローと消費者体験のためのデータ戦略Apr 17, 2025 am 09:39 AM

AIでのデジタル消費者エクスペリエンスの強化:データ駆動型アプローチ デジタルランドスケープは激しく競争力があります。 この記事では、人工知能(AI)がデジタルプラットフォームでの消費者エクスペリエンスを大幅に改善する方法を探ります。試験します

安定した拡散における位置エンコーディングは何ですか? - 分析Vidhya安定した拡散における位置エンコーディングは何ですか? - 分析VidhyaApr 17, 2025 am 09:34 AM

安定した拡散:テキストからイメージの生成における位置エンコーディングの力を明らかにする 単純なテキストの説明から息をのむような高解像度の画像を生成することを想像してください。 これは、安定した拡散の力、最先端のテキストから画像モデルです

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。