ホームページ >テクノロジー周辺機器 >AI >GradioとLangchainでOLMO-2をローカルに実行します

GradioとLangchainでOLMO-2をローカルに実行します

William Shakespeareオリジナル: 2025-03-06 10:55:08945ブラウズ

olmo 2：アクセス可能なAI

のための強力なオープンソースLLM

自然言語処理の分野（NLP）は、特に大規模な言語モデル（LLM）で急速に進歩しています。独自のモデルは歴史的に支配的でしたが、オープンソースの代替品は急速にギャップを埋めています。 Olmo 2は、完全な透明性とアクセシビリティを維持しながら、閉鎖モデルに匹敵するパフォーマンスを提供し、パフォーマンスを提供します。この記事は、トレーニング、パフォーマンス、および実用的なアプリケーションを調査し、Olmo 2を掘り下げています。

キー学習ポイント：

Olmo 2のアーキテクチャ、トレーニング方法、およびベンチマークの結果を理解してください
GradioとLangchainを使用して地元でOlmo 2を実行することを学ぶ。
（この記事はデータサイエンスブログの一部です。）

オープンソースLLMSの必要性

olmo 2の紹介 Olmo 2のトレーニングの分解

Olmo 2
結論
よくある質問
オープンソースLLMSの需要

AI（AI2）のOLMOプロジェクトのためのアレン研究所は、このコミットメントを実証しています。 Olmo 2は、単にモデルの重みをリリースするだけではありません。トレーニングデータ、コード、トレーニングレシピ、中級チェックポイント、命令チューニングモデルを提供します。この包括的なリリースは、再現性とさらなるイノベーションを促進します

olmo 2

を理解しています

Olmo 2は、その前身であるOlmo-0424を大幅に改善します。 7Bおよび13Bパラメーターモデルは、英語のアカデミックベンチマークでLlama 3.1のようなオープンウェイトモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。

重要な改善には、次のものが含まれます

実質的なパフォーマンスの向上：Olmo-2（7bおよび13b）は、アーキテクチャ、データ、またはトレーニング方法の進歩を示している以前のOLMOモデルよりも顕著な改善を示しています。 MAP-NEO-7Bとの競争力のある
Olmo-2、特に13Bバージョンは、完全にオープンモデルの中で強力なベースラインであるMAP-NEO-7Bに匹敵するスコアを達成します。

Running OLMo-2 Locally with Gradio and LangChain olmo 2のトレーニング方法

Olmo 2のアーキテクチャは、元のOlmoに基づいて構築されており、安定性とパフォーマンスを改善するための改良を取り入れています。トレーニングプロセスは、2つの段階で構成されています

財団トレーニング： olmo-mix-1124データセット（多様なオープンソースからの約3.9兆トークン）を利用して、言語理解のための堅牢な基盤を確立します。

モデルの知識とスキルを改善するために、高品質のWebデータとドメイン固有のデータ（アカデミックコンテンツ、Q＆Aフォーラム、指導データ、数学ワークブック）のキュレーションされたミックスであるDolmino-Mix-1124データセットを採用しています。「モデルスープ」は、最終的なチェックポイントをさらに強化します
LLMS olmo-2は完全にオープンなモデルであるため、モデルのオープン性の異なるレベルの区別を明確にしましょう。

オープンウェイトモデル：

モデルの重みのみがリリースされます。 Running OLMo-2 Locally with Gradio and LangChain

部分的にオープンモデル：トレーニングプロセスの完全な画像ではありませんが、重みを超えていくつかの追加情報をリリースします。

完全にオープンモデル：

ウェイト、トレーニングデータ、コード、レシピ、チェックポイントなど、完全な透明性を提供します。これにより、完全な再現性が可能になります

olmo 2を局所的に探索して実行しています

Olmo 2はすぐにアクセスできます。モデルとデータをダウンロードするための手順と、トレーニングコードと評価メトリックが利用可能です。 Olmo 2をローカルに実行するには、Ollamaを使用します。インストール後、コマンドラインでollama run olmo2:7bを実行するだけです。必要なライブラリ（LangchainおよびGradio）は、PIPでインストールできます。

olmo 2 でチャットボットを構築します
次のPythonコードは、Olmo 2、Gradio、およびLangchainを使用してチャットボットの構築を示しています。

このコードは、基本的なチャットボットインターフェイスを提供します。この基盤の上に、より洗練されたアプリケーションを構築できます。例の出力とプロンプトは、元の記事に示されています。
import gradio as gr from langchain_core.prompts import ChatPromptTemplate from langchain_ollama.llms import OllamaLLM def generate_response(history, question): template = """Question: {question} Answer: Let's think step by step.""" prompt = ChatPromptTemplate.from_template(template) model = OllamaLLM(model="olmo2") chain = prompt | model answer = chain.invoke({"question": question}) history.append({"role": "user", "content": question}) history.append({"role": "assistant", "content": answer}) return history with gr.Blocks() as iface: chatbot = gr.Chatbot(type='messages') with gr.Row(): with gr.Column(): txt = gr.Textbox(show_label=False, placeholder="Type your question here...") txt.submit(generate_response, [chatbot, txt], chatbot) iface.launch()

結論

Olmo 2は、オープンソースLLMエコシステムへの重要な貢献を表しています。その強力なパフォーマンスは、完全な透明性と組み合わさって、研究者と開発者にとって貴重なツールになります。すべてのタスクで普遍的に優れているわけではありませんが、そのオープンな性質はコラボレーションを促進し、アクセス可能で透明なAIの分野での進歩を加速します。
キーテイクアウト：

OLMO-2の13Bパラメーターモデルは、さまざまなベンチマークで優れたパフォーマンスを示し、他のオープンモデルよりも優れています。 完全なモデルのオープンネスは、より効果的なモデルの開発を促進します。
チャットボットの例では、LangchainとGradioとの統合の容易さを示しています。

よくある質問（FAQ）
（元の記事のFAQはここに含まれています。）
）
（注：画像URLは変更されていません。）

以上がGradioとLangchainでOLMO-2をローカルに実行しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Python pip for while include math using Interface map this table nlp llama langchain Access Foundation Other

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Sutra-R0：India＆＃039;の高度なAI推論に飛びつくことを試しました次の記事：Sutra-R0：India＆＃039;の高度なAI推論に飛びつくことを試しました

続きを見る