ホームページ >テクノロジー周辺機器 >AI >Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

PHPzオリジナル: 2024-06-29 00:25:011120ブラウズ

最近、Yuncong Technology の大型モデルは、権威ある総合評価プラットフォームである OpenCompass のマルチモーダル評価分野で大きな進歩を遂げました。最新の評価結果によると、このシステムにおけるYuncong TechnologyのCongrong大型モデルの平均スコアは65.5であり、この結果はCongrong大型モデルをGoogleのGemini-1.5-ProとGPT-4vを上回り、世界のトップ3に入れています。 GPT-4o (69.9) と Claude3.5-Sonnet (67.9) で 2 位にランクされています。国内市場でも大型モデルの性能がInternVL-Chat（61.7）、GLM-4V（60.8）を上回り1位となった。

1.OpenCompassマルチモーダルリスト

OpenCompass大規模モデルオープン評価システムは、上海人工知能研究所によって開始された完全なオープンソースの再現可能な評価フレームワークです。
OpenCompass マルチモーダル評価は、8 つの代表的なデータセットを使用してマルチモーダル大規模モデルの機能を複数の観点から客観的に定量化し、次の次元のカバレッジを評価します。関係推論
- ビジネス
- 科学
- 健康と医学
- 人文科学と社会科学
- 技術と工学
- 数理推論
- 図 2: 穏やかな大きなモデル - 2.0 マルチモーダルの例能力
- この評価では、Congrong 大規模モデルは 6 つのデータセット (MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench) で良好なパフォーマンスを示し、特に OCRBench テストセットで、国内で 1 位にランクされました。 827点（1000点満点）で世界最高得点を達成し、2位のGLM-4vを13点上回り、落ち着いた大型モデルのテキスト認識、テキスト中心の視覚的質問の能力をさらに向上させた。応答、ドキュメント指向視覚的な質問応答や重要な情報の抽出などのビジネスシナリオへの適用性。
- 図 3: OpenCompass China の大規模モデル機能のデモンストレーション

2.0マルチモーダル機能の例。世界のトップ5にランク付けされています。 Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

人機連携技術の研究開発に注力するプラットフォーム企業として、

Yuncong Technology

は、

AIエージェントやラージモデル技術

の開発と応用を積極的に推進してきました。 Gemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクイン

人工知能技術の急速な発展に伴い、マルチモーダルな大型モデルが産業変革を推進する中核エンジンとなっています。 OpenCompass大型モデル公開評価システム

におけるRongrongモデルの卓越したパフォーマンスは、

Yuncon Technology

の技術革新の強さが認められただけでなく、業界で模範を示し、新しいラウンドで世界的なテクノロジー企業にインスピレーションを与えています。人工知能の競争の高みに到達します。

以上がGemini-1.5-ProとGPT-4Vを破り、大型モデルのマルチモーダル機能で世界トップ3にランクインの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

架构人工智能 gpt

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Bengio チームは、Claude 3.5 と GPT-4o の弱点をターゲットにした、新しいマルチモーダルベンチマークを提案します次の記事：Bengio チームは、Claude 3.5 と GPT-4o の弱点をターゲットにした、新しいマルチモーダルベンチマークを提案します

続きを見る