ホームページ  >  記事  >  テクノロジー周辺機器  >  SuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集める

SuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集める

PHPz
PHPz転載
2023-10-13 17:49:01684ブラウズ

最近、SuperCLUEは9月の総合ランキングリストと各カテゴリータスクリストを発表し、SenseTimeのSenseChat 3.0が中国大型モデル総合リストで1位となった。新しく追加された AI エージェントのサブリストでも、SenseChat 3.0 が 1 位にランクされ、中国国内のすべての大型モデル、GPT-3.5 および Claude 2 を上回り、GPT-4 の性能に次ぐ 2 位となりました。これは、大規模モデルの分野での革新的な開発と生産性リリースにおける SenseTime の利点、および AGI

の探索におけるその蓄積と可能性を示しています。

SuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集める

注:海外の代表モデル(GPT4.0/Claude2/gpt-3.5)はランキングに参加しておりません。

SuperCLUE は、中国の一般大型モデルの総合評価ベンチマークです。大型モデルの性能をさまざまな能力次元で総合的に評価することを目的としています。中国で最も専門的で代表的な中国大型モデル評価ベンチマークの 1 つです。この評価では、国内外で最も代表的な 20 の一般言語モデルを選択しました

全体ディスカッション リストで 1 位にランクされ、目標スコアは GPT-3.5

を超えました

最新の SuperCLUE 全体ランキングと各分類タスク ランキングは、主に大規模モデルの 4 つの能力象限、すなわち言語理解と生成 (言語理解と抽出、コンテキスト ペアリング、生成と作成、ロール プレイングを含む)、プロフェッショナル スキルと言語生成に焦点を当てています。知識(知識と百科事典、計算、コード、ロジック、推論を含む) エージェント インテリジェンス(ツールの使用、タスク計画を含む) セキュリティ(システム セキュリティ、コマンド攻撃を含む)、合計 12 の基本的な能力

SenseTimeのSenseChat 3.0は、総合スコア62.75ポイントで総合ランキング1位となり、OPT目標部分ではGPT-3.5をも上回るスコアを獲得し、大規模な中国語モデルの実行能力を実証しました。総合的な競争力

SenseTime は、SenseChat が 2023 年 4 月に正式に開始されることについて説明しました。これは、中国で数千億のパラメータに基づいた最も初期の大規模言語モデルの 1 つであり、継続的に反復更新されています。 SenseTime の大規模 AI デバイスである SenseCore に依存しており、現在約 30,000 個のオンライン GPU があり、計算能力規模が 6 ExaFLOPS に増加し、大規模な言語モデルのトレーニング、アップグレードの反復、およびサービスを効果的にサポートしています。

人工知能エージェントの開発を加速し、強力な人工知能への移行を加速します

大規模モデルの開発に伴い、「チャット」では人々の要求に応えられなくなり、ツールを正確に使用できることが大規模モデルの生産性を解放する鍵となっています。 SuperCLUE の新しい AI エージェント サブリストは、業界初の AI エージェント リストであり、「ツールの使用」と「タスク計画」という 2 つの主要な機能における AI エージェントのパフォーマンスの評価に焦点を当てています。評価によると、SenseTime は、SenseChat 3.0 が人間のスーパー アシスタントとして機能する可能性があると考えており、人間のニーズに応じて自律的にタスクを完了できるため、大規模モデルの生産性を完全に解放でき、AI では GPT-4 に次いで 2 番目になります。エージェントリストに先駆けて、大規模モデルの評価に参加します。

SuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集める

現在、世界をリードする AI エージェントのほとんどは、主要な大規模モデル GPT-4 によって駆動されています。強力なツール使用機能の助けを借りて、複雑な問題を達成可能なサブタスクと人間のような自然言語インタラクションに分解し、他の能力。 SenseChat 3.0 は、中国を代表する大規模モデルとして議論されており、コード インタープリタ、API 呼び出しと検索という 3 つの共通ツールを使用して、複雑なタスクを解決し、AI エージェント アプリケーションを柔軟に構築し、企業の生産性革新をサポートします。

現在、SenseTime は、金融、携帯電話、医療、自動車、不動産、エネルギー、メディア、工業製造などの複数の垂直産業の 500 以上の顧客と緊密な協力関係を確立しています。強力な大規模モデルとして、SenseChat は急速に改善を続けており、人間のように対話できる、より強力な人工知能エージェントを開発し、汎用人工知能への道を模索する機会を SenseTime に提供しています。重要な基盤とサポート

以上がSuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集めるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。