ホームページ  >  記事  >  テクノロジー周辺機器  >  国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランク

国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランク

PHPz
PHPzオリジナル
2024-06-28 20:52:47962ブラウズ
国産大型モデルの性能は新たなレベルに到達!

6月27日、iFlytekはiFlytek SparkモデルV4.0と医療、教育、ビジネスなど多くの分野の人工知能アプリケーションを正式にリリースしました。

新バージョンのリリースにより、iFlytek Spark V4.0 の 7 つのコア機能が完全にアップグレードされ、8 つの国際主流テストセットで第 1 位にランクされ、総合的に GPT-4 Turbo を上回り、国内の大型モデルをリードしました。

Liu Qingfeng 氏によると、現在、Spark APP のダウンロード数は 1 億 3,100 万に達しており、ユーザーのお気に入りのアプリケーション アシスタントが多数登場しています。 Spark モデルのサポートにより、一部のシナリオにおけるスマート ハードウェアの売上は前年比 70% 以上増加し、月間平均使用量は 4,000 万を超えました。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
さらに、Spark V4.0 大型モデルは、国内初の Wanka コンピューティング クラスター「Flying Star One」に基づいてトレーニングされており、完全に自律的で制御可能です。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

全体的に GPT-4 Turbo を上回りました基盤となる 7 つのコア機能が再びアップグレードされました

今年 1 月末、Spark Model V3.5 は言語理解の点で GPT-4 Turbo を上回りました。数学的機能は優れていますが、コード、マルチモダリティ、その他の機能には後者とのギャップがまだあります。

5 か月が経過した今、Spark Model V4.0 は再び進化し、テキスト生成、言語理解、知識の質問と回答、論理の 5 つの主要な機能において GPT-4 Turbo を総合的に上回っただけでなく、推論と数学、そしてコードとマルチモーダル能力の差をさらに縮め、特にマルチモーダル能力は後者のレベルの 97% に達しました。

国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

それだけでなく、国内外の理解と推論、総合試験、数学と科学、コーディングタスクをカバーする 12 の主流の中国語と英語のテスト セットにおいて、Spark Model V4.0 は 8 つのテスト セットで 1 位にランクされました。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
主流のテストセットに加えて、最近リリースされた高校および大学の入学試験問題は、大規模な言語モデルの総合的な品質をより適切にテストできます。

この分野の評価では、Spark Large Model V4.0のパフォーマンスが特に優れていました。 2024 年の北京高校入学試験を例にとると、Spark Model V4.0 は主観的問題得点率と客観的問題得点率の両方で 1 位を獲得し、合格者、または平均レベルの受験者と言えます。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
ベースの 7 つのコア機能の包括的な改善に加えて、Spark Model V4.0 では、コマンド追従、テキスト、マルチモーダリティ、そして推理力。

まず、Spark Large Model V4.0 は、複雑なコマンドのフォローと長いテキストの処理機能を強化し、業界初の新機能である長いテキスト コンテンツのトレーサビリティを備えています。

特に、長い文書の特徴抽出、長い文書の要約要約、長い文書の Q&A、長い文書のテキスト生成などのタスクでは、Spark Large Model V4.0 の全体的なパフォーマンスは GPT-4 Turbo に匹敵します。同時に、コンテンツ トレース機能により、長い文書知識の質問と回答タスクにおける錯覚がさらに軽減され、回答がより正確になります。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
マルチモダリティの観点から、Spark の画像およびテキスト認識機能は、特に科学研究、金融、医療、司法、オフィスなどの専門分野で大幅に向上し続けています。先月リリースされたOpenAIの最新フラッグシップモデルGPT-4oの性能を上回りました。これは、Spark Large Model V4.0 が将来、これらの垂直アプリケーション分野でより大きな応用可能性を秘めていることを意味します。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
Starfire Large Model V4.0 は、複雑な教育現場向けの画像およびテキスト認識タスクの能力も向上しており、印刷文字と手書き文字の複雑な数式認識において GPT-4o を大幅に上回っています。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
同様に、論理関係に基づくマルチモーダルな理解の点で、Spark Model V4.0 は以前よりも厳密なロジックと明確なアイデアで答えを与えることができます。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

最後に、Spark Model V4.0 では、より複雑な論理推論と空間推論の問題を解決できます。

空間的推論を例に挙げます。「ボブはリビングルームにいて、カップを持ってキッチンに行き、カップを持って寝室に行きました。そしてカップをひっくり返しました。」それから彼は庭にカップを置き、ガレージに歩きました。 質問: ボールはどこにありますか? 「iFlytek Spark は、スペースと常識に基づいてボールが寝室の床にあると推測します。これらの機能は将来の身体化された知能にとって大きな利益となり、ロボットにはすべて意味があります。

国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
一連の基礎的なコア機能のアップグレードは、国内の大規模言語モデルが外国の競合製品を包括的に上回り、大規模モデルに基づくアプリケーション実装の強固な基盤を築いたことを示していると言えます。

Xinghuo Voice Model、74の言語と方言で「フリーダイアログ」をリリース強い干渉シナリオでの音声認識の問題を解決

音声機能は常に iFlytek の絶対的な利点です。 6月24日、iFlytekは「多言語インテリジェント音声キーテクノロジーと産業化」プロジェクトで2023年度国家科学技術進歩賞の最優秀賞を受賞した。

早くも 2024 年 1 月 30 日、iFlytek は Spark モデル V3.5 アップデートで初めて Spark 音声モデルをリリースしました。37 の主流言語の最初のバッチの音声認識効果は、その音声認識効果を超えています。 OpenAI ウィスパー V3。 Spark V4.0 の発表時に、iFlytek は、音声モデルの機能が再びアップグレードされ、37 の主流言語に加えて、37 の方言の認識も追加されたと発表しました。ユーザーは37言語+37方言、合計74言語で手を切ることなく自由なコミュニケーションを実現できます。

現場では、デモンストレーターが上海語、広東語、合肥語、四川語、日本語、フランス語などの言語で大型モデルと直接コミュニケーションをとり、大型モデルを迅速かつ正確に認識することができました。 国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
ライブ方言認識デモンストレーション

さらに、iFlytek は、超複雑なシーンで音声を書き写す機能も強調しました。 3 人は、通常の人間の耳では音声の同時エイリアシングが明瞭に聞こえることが難しい騒がしい現場での測定を実施しました。iFlytek Spark のマルチモーダル機能により、3 人の重なり合う音声の役割を分離できるだけでなく、各人の発言をリアルタイムに変換します。

国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
インテリジェント音声のアップグレードにより、iFlytek は自動車シーンでの存在感をさらに深めました。 Liu Qingfeng 氏は、アップグレードされた Xinghuo スマート コックピットも披露しました。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

医療用大型モデル「iFlytek Xiaoyi」みんなのAI健康アシスタント

医療シナリオの特殊性、極めて高い専門性、極めて低いエラー許容度により、Cサイドの健康知識Q&Aは常に難しい点。

昨年 10 月、iFlytek は、Spark V3 のリリース中に、大規模医療モデル アプリケーション「iFlytek Xiaoyi」とその B サイド アプリケーション「Smart Medical Assistant」を簡単に紹介しました。健康診断レポート分析などの機能を提供し、「インテリジェント医療アシスタント」は事前問診などの機能を提供できます。

今回 Spark V4.0 がリリースされ、iFlytek はさらにアップグレードし、大規模な医療モデルとアプリケーションを導入しました。 Liu Qingfeng 氏が現場で共有したデータは、iFlytek Spark Medical の中核機能が GPT-4 Turbo および GPT-4o を上回っていることを示しました。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
アプリケーション側では、医師向けの「インテリジェント医療アシスタント」はリリース以来、8億2,000万件の補助診断、147万件の修正診断を達成し、7,267万件の不合理な処方箋の発見に貢献しました。

個人向けアプリ「iFlytek Xiaoyi」は、一般ユーザーに医療記録、健康診断報告書、検査報告書を自由に解釈してもらい、医療知識について会話することもできます。あらゆる健康情報を収集することで、病歴、薬歴、生活習慣などを記録したパーソナルデジタルヘルススペースをユーザーに提供します。ユーザーが医師の診察を受ける前に病気の原因を分析し、ユーザーに健康情報を提供することができます。薬を服用する際の性格判断と薬物禁忌、検査後の変化の分析と記録を提供します。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
ライブデモンストレーション: QRコードをスキャンして医療記録と身体検査レポートをアップロードし、分析して解釈します。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

インテリジェントマーキングマシンをリリース大規模教育モデルが再びアップグレードされました

Iflytek Spark V4.0は大規模教育モデルをアップグレードし、Sparkインテリジェントマーキングマシンの2つのモデルとさらにアップグレードされたiFlytek AI学習をリリースしました機械のハードウェア。

インテリジェントなマーキングマシンは教師を対象としています。マーキングマシンにテスト用紙を置き、元の用紙を自動的にスキャンして印刷し、スキャンしたデータを自動的にアップロードして分析を生成します。学生の個別の学業状況とクラスの共通性分析を使用して、学生に個別の課題を割り当てることもできます。手動採点と比較して、採点シナリオにおけるインテリジェント採点機の効率は、1 クラスあたり 90 分から 1 クラスあたり 5 分に向上しました。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
さらに、iFlytekは教育用ハードウェア「AI学習機」のアップグレードも続けています。バージョンアップした「AI学習機」を使えば、ユーザーは試験問題を写真に撮って問題を選択するだけで、AIが質問に答えたり、インテリジェントな会話型の解説を行ったりする。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

「パーソナルスペース」の起動あなたを理解するAIアシスタントの作成

「インテリジェントエージェント」の人気は、2024年にアプリケーションが爆発的に増加する重要な兆候となっています。

OpenAI が GPT と GPT ストアを立ち上げて以来、人々は大規模なモデルに基づいて独自の AI スマート アシスタントをカスタマイズできるようになりました。多くの人は、AI の「iPhone の瞬間」が到来すると信じて、その登場に大きな期待を寄せています。他のメーカーもこれに倣い、同様の AI エージェント サービスを開始しています。たとえば、Microsoft は独自の Copilot GPT サービスを開始しています。

しかし、事態は期待通りには進まず、GPT はすぐにボトルネックに陥りました。数日前、Microsoft は、3 か月しか提供されなかった Copilot GPT サービスを終了すると発表しました。理由を詳しく見てみると、GPT はアプリケーション シナリオと商用実装の点でほとんど追いついておらず、その後さらなる開発の勢いを失っていることがわかります。

したがって、過去6か月間、国内の大型頭部モデルメーカーはスマートボディへの取り組みを急速に発展させ、アプリケーションレベルで多大な努力を払ってきました。

この iFlytek Spark V4.0 バージョンは、「インテリジェントな」アップデートの開始にも重点を置いています。 iFlytek Spark Desk および Spark App では、「エージェント」がチャットボットと同じ第 1 レベルの入り口になりました。 「エージェント センター」をクリックすると、iFlytek のスマートフォン ストアが生産性ツール、学習、プログラミング、マーケティングなどの複数の分野のスマートフォンをカバーします。

記者会見で開示された情報によると、現在、Spark APP/Deskは、特定のシナリオ向けの専用アシスタントを作成する14個のインテリジェントエージェントの最初のバッチを起動します。

ユーザーは、ここで自分の AI 英語教師を選択することも、契約書の草案を作成するのに役立つカスタマイズされた AI 弁護士を選択することもできます。また、Python、C++、その他の言語が得意な AI プログラマーを選択することもできます。 . プログラミングを自分で実装します。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
例えば、厳しい「IELTSの先生」を探してください。エージェントの作成をクリックすると、必要な「IELTS 教師」を一文で要約できます。彼は、リスニング、スピーキング、読み書き、各パートの指導をカバーする 3 か月の学習計画の作成を手伝ってくれる必要があります。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
「生成」をクリックすると、必要に応じて背景がエージェントの他の側面を自動的に展開し、いつでもデバッグできます。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
デバッグが完了したら、「AI IELTS講師」から学ぶことができます。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
ただし、GPT Storeと比較して、iFlytekは「インテリジェント」機能をユーザーのパーソナライゼーションを実現する一環として捉えています。ユーザーは、自分のニーズに応じて、必要なスマート アシスタントを選択して定義できます。

「パーソナライゼーション」の実現に関して、iFlytek Spark V4.0 は、ユーザーに専用のプライベート ドメインのナレッジ ベースを提供する「パーソナル スペース」もリリースしました。個人のドキュメントをアップロードすることで、大規模なモデルをより正確に処理できます。回答とコンテンツの生成、個人のタグ付け、スケジュール管理、情報の購読、講演者の作成を通じて、よりパーソナライズされた興味深いサービスをユーザーに提供します。

ユーザーは、自分の個人空間に自分の情報ファイルをアップロードし続けることができ、AI はアップロードされた情報に基づいて質問と回答を実行し、コンテンツのトレーサビリティを提供し、パーソナライゼーションの向上に基づいてモデルの錯覚を軽減します。
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一

個人知識の強化から個人タグの選択、スピーカーの作成、オープンエージェント定義まで、ユーザーがより高いレベルで「チャットボット」を定義できるようにすることで、iFlytek は大規模モデル「チャットボット」定義の自律性のデータを使用します。 、ワークフロー、表現形式のあらゆる面で実現されています。

パーソナライズされたラージ モデルは新たな段階に到達しました。Spark Large Models V4.0 は、「パーソナライズ」と「インテリジェンス」の両方で「全員のパーソナライズされたインテリジェント アシスタント」を一歩前進させます。

最後に書きました

大型モデルの発売初年度となる2024年、トップの地位を維持したいなら、先頭に立って全方位のレイアウトを整えることが重要です。

数日前、iFlytekの「多言語インテリジェント音声主要技術と産業化」プロジェクトが国家科学技術進歩賞の一等賞を受賞しました。これは、iFlytek の長年にわたる AI テクノロジーの成果の裏付けの 1 つである可能性があります。ご存知のとおり、ディープラーニング革命以来、過去 10 年間で人工知能の分野で国家科学技術進歩賞の第一位を受賞したのはこれが初めてです。

1月末のV3.5から今日のV4.0まで、iFlytek Sparkモデルは基礎的な機能の点でより安定しただけでなく、アプリケーションの実装においても完全に開発されたと言えます。 。

一方で、私たちは基礎となるコア言語機能を常に改善し、世界のトップの大規模モデルに追いつき続け、他方では音声機能などの独自の有利なモデル機能を磨き、アップグレードしています。実用化と商品化にさらなるエネルギーを投入し、現場のニーズを踏まえて総合的なレイアウトを行い、Bサイド、Cサイドの大型モデルの実装を加速していきます。スケールモデル、プライベートにカスタマイズされたエージェント、エンドサイドのインテリジェントハードウェアにより、より多くの企業や一般ユーザーがモデルがもたらす価値を直接体験できます。

以上が国産大型モデルが新たな高みへ! iFlytek Spark 4.0 リリース: 総合的に GPT-4 Turbo を上回り、8 つの国際的な権威あるテスト セットで 1 位にランクの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。