世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです-AI-php.cn

ホームページ

テクノロジー周辺機器

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです

PHPz

May 07, 2024 pm 04:13 PM

gitgpt-4モデルmoe

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2^[1] がここにあります。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成され、そのうち 21B は各タグをアクティブにするために使用されます。 DeepSeek 67B と比較して、DeepSeek-V2 はパフォーマンスが強力であると同時に、トレーニングコストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に増加します。

DeepSeek は、汎用人工知能 (AGI) の性質を探求し、研究、エンジニアリング、ビジネスの統合に取り組んでいる会社です。

DeepSeek-V2 の包括的な機能

現在主流の大規模モデルのリストでは、DeepSeek-V2 は優れたパフォーマンスを発揮します:

中国の包括的な機能 (AlignBench) オープンソースモデルの中で最も強力です: GPT-4-Turbo を使用し、 Wenxin 4.0 などのクローズドソースモデルは評価において同じ階層にあります
英語の総合力 (MT-Bench) は最初の階層にあります: 英語の総合能力 (MT-Bench) は最強のオープンソースモデルと同じ階層にありますLLaMA3-70B、最強のMoEオープンソースモデルMixtral 8x22Bを超える
知識、数学、推論、プログラミングなどのリストでトップにランク
128Kコンテキストウィンドウをサポート

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

新しいモデル構造

ときAI の可能性は常に探究されています。深く掘り下げていくと、私たちはこう尋ねずにはいられません。インテリジェントな進歩を促進するための鍵は何でしょうか? DeepSeek-V2 は、革新的なアーキテクチャと費用対効果の完璧な組み合わせという答えを提供します。

「DeepSeek-V2は改良版です。合計パラメータ236B、アクティベーション21Bで、最終的に70B～110Bの高密度モデルの能力に達します。同時に、メモリ消費量はわずか1/5～1/です。」 8 カードの H800 マシンでは、100 枚の同じレベルのトークンを入力し、毎秒 50,000 枚以上のトークンを出力できます。これは技術の飛躍であるだけでなく、革命でもあります。コスト管理。「

AI テクノロジーの急速な発展に伴い、今日、DeepSeek-V2 の出現は技術的な進歩を示すだけでなく、インテリジェントアプリケーションの普及の先駆けでもあります。」これにより、AI の敷居が下がり、より多くの企業や個人が効率的なインテリジェントサービスのメリットを享受できるようになります。同時に、それはインテリジェントなアプリケーションの普及の先駆けでもあります。これにより、AI の敷居が下がり、より多くの企業や個人が効率的なインテリジェントサービスのメリットを享受できるようになります。

中国語の機能 VS 価格

中国語の機能に関して、DeepSeek-V2 は AlignBench ランキングで世界をリードしており、非常に競争力のある API 価格を提供しています。

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

モデルと論文は両方ともオープンソースです

DeepSeek-V2は単なるモデルではなく、よりスマートな世界への鍵です。低コストかつ高パフォーマンスの AI アプリケーションの新たな章を開きます。 DeepSeek-V2 のオープンソースは、より多くの人々の革新的な精神を刺激し、人類の知性の未来を共同で促進するという信念の最良の証拠です。

モデルの重み: https://huggingface.co/deepseek-ai
オープンソースアドレス: https://github.com/deepseek-ai/DeepSeek-V2

AIが進化し続ける現代において、 DeepSeek についてどう思いますか - V2 は私たちの世界をどのように変えますか?興味があれば、chat.deepseek.com にアクセスして、DeepSeek-V2 によってもたらされる技術的な変化をご自身で体験してください。

参考資料

[1]

DeepSeek-V2:https://www.php.cn/link/b2651c9921723afdfd04ed61ec302a6b

以上が世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできますApr 25, 2025 am 11:16 AM

HiddenLayerの画期的な研究は、主要な大規模な言語モデル（LLMS）における重大な脆弱性を明らかにしています。彼らの発見は、ほぼすべての主要なLLMSを回避できる「政策の人形劇」と呼ばれる普遍的なバイパス技術を明らかにしています

5つの間違いほとんどの企業が今年持続可能性を備えていますApr 25, 2025 am 11:15 AM

環境責任と廃棄物の削減の推進は、企業の運営方法を根本的に変えています。この変革は、製品開発、製造プロセス、顧客関係、パートナーの選択、および新しいものの採用に影響します

H20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたApr 25, 2025 am 11:12 AM

高度なAIハードウェアに関する最近の制限は、AI優位のためのエスカレートする地政学的競争を強調し、中国の外国半導体技術への依存を明らかにしています。 2024年、中国は3,850億ドル相当の半導体を大量に輸入しました

OpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますApr 25, 2025 am 11:11 AM

GoogleからのChromeの強制的な売却の可能性は、ハイテク業界での激しい議論に火をつけました。 Openaiが65％の世界市場シェアを誇る大手ブラウザを取得する見込みは、THの将来について重要な疑問を提起します

AIが小売メディアの成長する痛みをどのように解決できるかApr 25, 2025 am 11:10 AM

全体的な広告の成長を上回っているにもかかわらず、小売メディアの成長は減速しています。この成熟段階は、生態系の断片化、コストの上昇、測定の問題、統合の複雑さなど、課題を提示します。ただし、人工知能

「aiは私たちであり、それは私たち以上のものです」Apr 25, 2025 am 11:09 AM

古いラジオは、ちらつきと不活性なスクリーンのコレクションの中で静的なパチパチと鳴ります。簡単に不安定になっているこの不安定な電子機器の山は、没入型展示会の6つのインスタレーションの1つである「e-waste land」の核心を形成しています。

Google Cloudは、次の2025年にインフラストラクチャについてより深刻になりますApr 25, 2025 am 11:08 AM

Google Cloudの次の2025年：インフラストラクチャ、接続性、およびAIに焦点を当てています Google Cloudの次の2025年の会議では、多くの進歩を紹介しました。特定の発表の詳細な分析については、私の記事を参照してください

Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Apr 25, 2025 am 11:07 AM

今週はAIとXR：AIを搭載した創造性の波が、音楽の世代から映画制作まで、メディアとエンターテイメントを席巻しています。見出しに飛び込みましょう。 AIに生成されたコンテンツの影響力の高まり：テクノロジーコンサルタントのShelly Palme

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

メモ帳++7.3.1

使いやすく無料のコードエディター

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、