SuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集める
最近、SuperCLUEは9月の総合ランキングリストと各カテゴリータスクリストを発表し、SenseTimeのSenseChat 3.0が中国大型モデル総合リストで1位となった。新しく追加された AI エージェントのサブリストでも、SenseChat 3.0 が 1 位にランクされ、中国国内のすべての大型モデル、GPT-3.5 および Claude 2 を上回り、GPT-4 の性能に次ぐ 2 位となりました。これは、大規模モデルの分野での革新的な開発と生産性リリースにおける SenseTime の利点、および AGI
の探索におけるその蓄積と可能性を示しています。
注:海外の代表モデル(GPT4.0/Claude2/gpt-3.5)はランキングに参加しておりません。
SuperCLUE は、中国の一般大型モデルの総合評価ベンチマークです。大型モデルの性能をさまざまな能力次元で総合的に評価することを目的としています。中国で最も専門的で代表的な中国大型モデル評価ベンチマークの 1 つです。この評価では、国内外で最も代表的な 20 の一般言語モデルを選択しました
全体ディスカッション リストで 1 位にランクされ、目標スコアは GPT-3.5
を超えました最新の SuperCLUE 全体ランキングと各分類タスク ランキングは、主に大規模モデルの 4 つの能力象限、すなわち言語理解と生成 (言語理解と抽出、コンテキスト ペアリング、生成と作成、ロール プレイングを含む)、プロフェッショナル スキルと言語生成に焦点を当てています。知識(知識と百科事典、計算、コード、ロジック、推論を含む) エージェント インテリジェンス(ツールの使用、タスク計画を含む) セキュリティ(システム セキュリティ、コマンド攻撃を含む)、合計 12 の基本的な能力
SenseTimeのSenseChat 3.0は、総合スコア62.75ポイントで総合ランキング1位となり、OPT目標部分ではGPT-3.5をも上回るスコアを獲得し、大規模な中国語モデルの実行能力を実証しました。総合的な競争力
SenseTime は、SenseChat が 2023 年 4 月に正式に開始されることについて説明しました。これは、中国で数千億のパラメータに基づいた最も初期の大規模言語モデルの 1 つであり、継続的に反復更新されています。 SenseTime の大規模 AI デバイスである SenseCore に依存しており、現在約 30,000 個のオンライン GPU があり、計算能力規模が 6 ExaFLOPS に増加し、大規模な言語モデルのトレーニング、アップグレードの反復、およびサービスを効果的にサポートしています。
人工知能エージェントの開発を加速し、強力な人工知能への移行を加速します
大規模モデルの開発に伴い、「チャット」では人々の要求に応えられなくなり、ツールを正確に使用できることが大規模モデルの生産性を解放する鍵となっています。 SuperCLUE の新しい AI エージェント サブリストは、業界初の AI エージェント リストであり、「ツールの使用」と「タスク計画」という 2 つの主要な機能における AI エージェントのパフォーマンスの評価に焦点を当てています。評価によると、SenseTime は、SenseChat 3.0 が人間のスーパー アシスタントとして機能する可能性があると考えており、人間のニーズに応じて自律的にタスクを完了できるため、大規模モデルの生産性を完全に解放でき、AI では GPT-4 に次いで 2 番目になります。エージェントリストに先駆けて、大規模モデルの評価に参加します。
現在、世界をリードする AI エージェントのほとんどは、主要な大規模モデル GPT-4 によって駆動されています。強力なツール使用機能の助けを借りて、複雑な問題を達成可能なサブタスクと人間のような自然言語インタラクションに分解し、他の能力。 SenseChat 3.0 は、中国を代表する大規模モデルとして議論されており、コード インタープリタ、API 呼び出しと検索という 3 つの共通ツールを使用して、複雑なタスクを解決し、AI エージェント アプリケーションを柔軟に構築し、企業の生産性革新をサポートします。
現在、SenseTime は、金融、携帯電話、医療、自動車、不動産、エネルギー、メディア、工業製造などの複数の垂直産業の 500 以上の顧客と緊密な協力関係を確立しています。強力な大規模モデルとして、SenseChat は急速に改善を続けており、人間のように対話できる、より強力な人工知能エージェントを開発し、汎用人工知能への道を模索する機会を SenseTime に提供しています。重要な基盤とサポート
以上がSuperCLUE 9月評価リストでSenseTimeが1位を獲得、AIインテリジェンス方面で注目を集めるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

メモ帳++7.3.1
使いやすく無料のコードエディター

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター
