ホームページ >テクノロジー周辺機器 >AI >Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

PHPz
PHPzオリジナル
2024-06-29 00:25:01965ブラウズ

最近、Yuncong Technology の大型モデルは、権威ある総合評価プラットフォームである OpenCompass のマルチモーダル評価分野で大きな進歩を遂げました。最新の評価結果によると、このシステムにおけるYuncong TechnologyのCongrong大型モデルの平均スコアは65.5であり、この結果はCongrong大型モデルをGoogleのGemini-1.5-ProとGPT-4vを上回り、世界のトップ3に入れています。 GPT-4o (69.9) と Claude3.5-Sonnet (67.9) で 2 位にランクされています。国内市場でも大型モデルの性能がInternVL-Chat(61.7)、GLM-4V(60.8)を上回り1位となった。

Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

1.OpenCompassマルチモーダルリスト
  1. OpenCompass大規模モデルオープン評価システムは、上海人工知能研究所によって開始された完全なオープンソースの再現可能な評価フレームワークです。
  2. OpenCompass マルチモーダル評価は、8 つの代表的なデータセットを使用してマルチモーダル大規模モデルの機能を複数の観点から客観的に定量化し、次の次元のカバレッジを評価します。関係推論

      芸術とデザイン
    • ビジネス
    • 科学
    • 健康と医学
    • 人文科学と社会科学
    • 技術と工学
    • 数理推論
    • 図 2: 穏やかな大きなモデル - 2.0 マルチモーダルの例能力
    • この評価では、Congrong 大規模モデルは 6 つのデータセット (MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench) で良好なパフォーマンスを示し、特に OCRBench テスト セットで、国内で 1 位にランクされました。 827点(1000点満点)で世界最高得点を達成し、2位のGLM-4vを13点上回り、落ち着いた大型モデルのテキスト認識、テキスト中心の視覚的質問の能力をさらに向上させた。応答、ドキュメント指向 視覚的な質問応答や重要な情報の抽出などのビジネス シナリオへの適用性。
    • Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン図 3: OpenCompass China の大規模モデル機能のデモンストレーション

    • このシステムにおける Rongrong 大型モデルの優れたパフォーマンスは、Yuncong Technology が自社開発した効率的なマルチモーダル処理アーキテクチャと、効率的なマルチモーダル モーダルを実現する高度なコンピューティング テクノロジーに依存しています。データ処理機能により、視覚タスクと言語タスクの間の効率的な融合と切り替えを実現でき、コンピューティング リソースの使用を最大限に活用して、大規模なマルチモーダル データを処理する際に高いパフォーマンスと応答速度を維持できるようにすることができます。トレーニング プロセスは次のとおりです。効率が高く、収束速度が速く、パフォーマンスがより安定しています。
  3. 同時に、Yuncong Technology の視覚と言語の分野における長期にわたる深い蓄積と継続的な革新からも恩恵を受けています。

2.0マルチモーダル機能の例。世界のトップ5にランク付けされています。 Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

人機連携技術の研究開発に注力するプラットフォーム企業として、

Yuncong Technology

は、

AIエージェントやラージモデル技術

の開発と応用を積極的に推進してきました。 Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

人工知能技術の急速な発展に伴い、マルチモーダルな大型モデルが産業変革を推進する中核エンジンとなっています。 OpenCompass大型モデル公開評価システム

におけるRongrongモデルの卓越したパフォーマンスは、

Yuncon Technology

の技術革新の強さが認められただけでなく、業界で模範を示し、新しいラウンドで世界的なテクノロジー企業にインスピレーションを与えています。人工知能の競争の高みに到達します。

以上がGemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクインの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。