検索
ホームページテクノロジー周辺機器AIJamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャー

Jamba 1.5:長いコンテキスト処理のための強力なハイブリッド言語モデル

AI21 Labsの最先端の大規模な言語モデルであるJamba 1.5は、広範なテキストコンテキストを処理するための印象的な機能を誇っています。 Jamba 1.5の大規模なパラメーター(940億パラメーター)とJamba 1.5 Mini(120億パラメーター)の2つのバージョンがあります。これは、Mamba構造化状態空間モデル(SSM)と従来の変圧器アーキテクチャを組み合わせたユニークなハイブリッドアーキテクチャを活用しています。この革新的なアプローチにより、前例のない256K有効コンテキストウィンドウを処理することができます。これは、オープンソースモデルの大幅な飛躍です。

Jamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャー

主な機能と機能:

  • 大規模なコンテキストウィンドウ:最大256kのトークンを処理し、長いドキュメントや複雑なタスクに最適です。
  • ハイブリッドアーキテクチャ:トランスモデルとMAMBAモデルの強度を組み合わせて、最適な効率とパフォーマンスを実現します。
  • 効率的な量子化:メモリフットプリントを削減し、処理を速くするために、ExpertSINT8量子化を採用します。
  • 多言語サポート: 9つの言語で効果的に機能します:英語、スペイン語、フランス語、ポルトガル語、イタリア語、オランダ語、ドイツ語、アラビア語、ヘブライ語。
  • 汎用性の高いアプリケーション:質問の回答、要約、テキスト生成、分類など、幅広いNLPタスクに適しています。
  • アクセス可能な展開: AI21のStudio API、Hugging Face、Cloud Partnersを介して利用できます。

アーキテクチャの詳細:

Jamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャー

側面 詳細
ベースアーキテクチャ 混合物(MOE)モジュールを備えたハイブリッドトランスマンバアーキテクチャ
モデルバリアント Jamba-1.5-large(94bアクティブパラメーター、合計398b)およびJamba-1.5-mini(12bアクティブパラメーター、52b合計)
層構成 9ブロック、それぞれ8層があります。 1:7トランスとマンバ層の比率
専門家の混合(MOE) 16人の専門家、トークンあたり上位2を選択します
隠された寸法 8192
注意ヘッド 64クエリヘッド、8キー価値ヘッド
コンテキストの長さ 最大256Kトークン
量子化技術 MOEおよびMLPレイヤー用のExpertSINT8
アクティベーション機能 統合変圧器とMAMBAの活性化
効率 8x80GB GPUで高スループットと低レイテンシ向けに最適化されています

Jamba 1.5へのアクセスと利用:

Jamba 1.5は、AI21のStudio APIと抱き合った顔を介してすぐにアクセスできます。このモデルは、特定のドメインがパフォーマンスをさらに向上させるために微調整できます。 AI21 APIを使用したPythonの例を以下に示します。

Pythonの例:

 AI21からAI21Clientをインポートします
ai21.models.chatからchatmessageをインポートします

メッセージ= [chatmessage(content = "2〜3行のトークンザーとは?"、role = "user")]]
client = ai21client(api_key = '')#apiキーに置き換えます
Response = client.chat.completions.create(
    メッセージ=メッセージ、
    Model = "Jamba-1.5-mini"、
    ストリーム= true
))
それに応じてチャンクの場合:
    print(chunk.choices [0] .delta.content、end = "") 

Jamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャーJamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャーJamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャー

結論:

Jamba 1.5は、大規模な言語モデルの大幅な進歩を表しており、力と効率の魅力的な融合を提供します。汎用性の高いアプリケーションとアクセス可能な展開オプションと相まって、非常に長いコンテキストを処理する能力は、幅広いNLPタスクにとって貴重なツールになります。

よくある質問(FAQ):(オリジナルに似ていますが、簡潔さのために言い換えられます)

  • Q1:Jamba 1.5とは何ですか? A:94B(大)または12B(ミニ)パラメーターを備えたハイブリッドトランスマンバの大型言語モデル、指示のフォローおよび長いコンテキスト処理のために最適化されています。
  • Q2:Jamba 1.5は長いコンテキストを効率的にどのように処理しますか? A:ハイブリッドアーキテクチャとExpertSINT8の量子化を通じて、メモリ使用量が減少した256Kトークンコンテキストウィンドウを可能にします。
  • Q3:ExpertSINT8量子化とは何ですか? A:MOEでINT8精度を使用した圧縮技術とMLP層を使用して、効率を改善します。
  • Q4:Jamba 1.5は公開されていますか? A:はい、Jamba Open Modelライセンスの下で、顔を抱きしめてアクセスできます。

以上がJamba 1.5:ハイブリッドマンバトランスフォーマーアーキテクチャをフィーチャーの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
外挿の包括的なガイド外挿の包括的なガイドApr 15, 2025 am 11:38 AM

導入 数週間で作物の進行を毎日観察する農民がいるとします。彼は成長率を見て、さらに数週間で彼の植物がどれほど背が高くなるかについて熟考し始めます。 thから

ソフトAIの台頭とそれが今日のビジネスにとって何を意味するかソフトAIの台頭とそれが今日のビジネスにとって何を意味するかApr 15, 2025 am 11:36 AM

ソフトAIは、おおよその推論、パターン認識、柔軟な意思決定を使用して特定の狭いタスクを実行するように設計されたAIシステムとして定義されていますが、曖昧さを受け入れることにより、人間のような思考を模倣しようとします。 しかし、これはBusineにとって何を意味しますか

AIフロンティア向けの進化するセキュリティフレームワークAIフロンティア向けの進化するセキュリティフレームワークApr 15, 2025 am 11:34 AM

答えは明確です。クラウドコンピューティングには、クラウドネイティブセキュリティツールへの移行が必要であるため、AIはAIの独自のニーズに特化した新しい種類のセキュリティソリューションを要求します。 クラウドコンピューティングとセキュリティレッスンの台頭 で

3つの方法生成AIは起業家を増幅します:平均に注意してください!3つの方法生成AIは起業家を増幅します:平均に注意してください!Apr 15, 2025 am 11:33 AM

起業家とAIと生成AIを使用して、ビジネスを改善します。同時に、すべてのテクノロジーと同様に、生成的AIが増幅器であることを覚えておくことが重要です。厳密な2024年の研究o

Andrew Ngによる埋め込みモデルに関する新しいショートコースAndrew Ngによる埋め込みモデルに関する新しいショートコースApr 15, 2025 am 11:32 AM

埋め込みモデルのパワーのロックを解除する:Andrew Ngの新しいコースに深く飛び込む マシンがあなたの質問を完全に正確に理解し、応答する未来を想像してください。 これはサイエンスフィクションではありません。 AIの進歩のおかげで、それはRになりつつあります

大規模な言語モデル(LLMS)の幻覚は避けられませんか?大規模な言語モデル(LLMS)の幻覚は避けられませんか?Apr 15, 2025 am 11:31 AM

大規模な言語モデル(LLM)と幻覚の避けられない問題 ChatGpt、Claude、GeminiなどのAIモデルを使用した可能性があります。 これらはすべて、大規模なテキストデータセットでトレーニングされた大規模な言語モデル(LLMS)、強力なAIシステムの例です。

60%の問題 -  AI検索がトラフィックを排出す​​る方法60%の問題 - AI検索がトラフィックを排出す​​る方法Apr 15, 2025 am 11:28 AM

最近の研究では、AIの概要により、産業と検索の種類に基づいて、オーガニックトラフィックがなんと15〜64%減少する可能性があることが示されています。この根本的な変化により、マーケティング担当者はデジタルの可視性に関する戦略全体を再考することになっています。 新しい

AI R&Dの中心に人間が繁栄するようにするMITメディアラボAI R&Dの中心に人間が繁栄するようにするMITメディアラボApr 15, 2025 am 11:26 AM

Elon UniversityがDigital Future Centerを想像している最近のレポートは、300人近くのグローバルテクノロジーの専門家を調査しました。結果のレポート「2035年に人間である」は、ほとんどがTを超えるAIシステムの採用を深めることを懸念していると結論付けました。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。