ホームページ >テクノロジー周辺機器 >AI >Zhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしました

Zhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしました

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2023-10-12 11:41:011388ブラウズ

鞭牛士 10 月 12 日のニュース、最近、Zhipu AI と清華 KEG は、マルチモーダル大型モデル CogVLM-17B を Moda コミュニティでリリースし、直接オープンソース化しました。 CogVLM は、ビジュアルエキスパートモジュールを使用して言語コーディングとビジュアルコーディングを深く統合する強力なオープンソースビジュアル言語モデルであり、14 の信頼できるクロスモーダルベンチマークで SOTA パフォーマンスを達成したことが報告されています。

CogVLM-17B は現在、マルチモーダルの権威ある学術リストで最初の包括的なパフォーマンスを備えたモデルであり、14 のデータセットで最先端または 2 位の結果を達成しています。 CogVLMの効果は「視覚優先」、つまりマルチモーダルモデルにおいて視覚的な理解を優先するという考え方に依存します。 5B パラメーターのビジュアルエンコーダーと 6B パラメーターのビジュアルエキスパートモジュールを使用しており、画像の特徴をモデル化するために合計 11B のパラメーターがあり、テキストの 7B パラメーターよりもさらに多くなります

以上がZhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：Baidu World 2023 のカウントダウンが近づき、世界初の AI ネイティブマップがリリースされようとしています次の記事：Baidu World 2023 のカウントダウンが近づき、世界初の AI ネイティブマップがリリースされようとしています

続きを見る