ホームページ >テクノロジー周辺機器 >AI >国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2024-07-11 15:52:551115ブラウズ

2024年7月5日、上海 - 2024年世界人工知能会議および人工知能グローバル・ガバナンスに関するハイレベル会議（WAIC 2024）の戦略的パートナーであるSenseTimeは、「境界なき愛・Xiang Xinli」人工知能フォーラムを開催し、リリースした国内初の WYSIWYG モデルは「毎日新しい 5o」で、インタラクティブエクスペリエンスは GPT-4o に対してベンチマークされ、新しい AI インタラクションモデルを実現します。国内初の WYSIWYG モデル「Ririxin 5o」は、音声、テキスト、画像、ビデオなどのさまざまな形式に基づくクロスモーダル情報を統合することにより、新しい AI インタラクションモデル、つまりリアルタイムストリーミングマルチモーダルインタラクションをもたらします。この革新的なインタラクションモデルは、現場にいる全員にも実証されました。スタッフは最初に「RiRiXin5o」と挨拶するだけで、スタッフが着用しているバッジストラップの文字を自動的に認識し、そのシーンが世界の会場であると判断しました。人工知能のカンファレンスで、ここでは「よく勉強できる」と言われました。

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

その後、スタッフがかわいい子犬の人形を持ってきました。「RiRiXin5o」は子犬の外見、表情、重要な服装を正確に描写しました - SenseTimeのロゴがプリントされた白い帽子をかぶった人形は、とてもかわいらしく、ホームの群衆が整列しました。

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

さらに難しいのは、本の任意のページを開くだけで、「RiRiXin5o」は、単純な文字のOCR認識ではなく、写真とテキストを認識してわかりやすく要約することです。瞬時に完了することができ、まさにリアルタイムのインタラクションを実現します。

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

スタッフもその場で「絵のスキル」を披露し、「RiRiXin5o」がかわいいと言って、シンプルな小さなウサギを描きました。そして、スタッフはこれで笑顔が落ち着きました。スタッフはそれを見て、口を大きくし、舌を追加しました。「RiRiXin5o」さんは、この表情のほうが幸せだとすぐに言いました。

実際の人間がチャットしているのと同じように、トピックを聞いたり、読んだり、検索したりできます。この対話モードは、リアルタイムの対話や音声認識などのアプリケーションに特に適しており、複数のタスクを自然に処理できます。 GPT-4o と同等のインタラクティブなエクスペリエンスを実現できるのは、「RiRiXin 5.5」の基本モデルの機能が総合的に向上しているためです。

今年4月にリリースされた「RiRiXin 5.0」は、GPT-4 Turboをベンチマークする最初の国内大型モデルであり、わずか2か月あまりで新しい「RiRiXin 5.5」システムが大幅にアップグレードされ、総合的なパフォーマンスが向上しました。「Ririxin 5.0」と比較して平均30％向上し、インタラクティブな効果と複数のコア指標により、数的推理力、英語力、コマンド追従力が大幅に向上し、ベンチマークGPT-4oを達成しました。

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

「Ririxin 5.5」は、クラウドとエッジデバイスのコラボレーションを最大化し、推論コストを削減するために、ハイブリッドデバイスとクラウドのコラボレーションエキスパートアーキテクチャを採用しています。モデルトレーニングは、大量のデータを含む10TBを超える高品質のトレーニングデータに基づいています。思考力を向上させるための合成思考連鎖データ。

国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリース

より多くの企業ユーザーが「RiRiXin」大型モデルシステムの強力な機能を低いしきい値でアクセスして使用できるようにするために、SenseTime は最近「大型モデル 0 元 Go」プランを開始しました。

「RiRiXin」の新規登録ユーザーは全員、通話、移行、トレーニングなどを含む無料のサービスパッケージを受け取ります。
同時に、SenseTime は 5,000 万トークンパッケージを無料で配布し、OpenAI ユーザーがサービスコストゼロの移行を達成できるよう専属の引っ越しコンサルタントを派遣します。

以上が国内初！ SenseTime、リアルタイムマルチモーダルストリーミングインタラクションベンチマークGPT-4o「Ririxin 5o」をリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

架构人工智能 ocr gpt

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：新しい TextGrad フレームワーク: GPT-4o をエンジンとして使用し、エンドツーエンドのタスクを自動的に最適化します。次の記事：新しい TextGrad フレームワーク: GPT-4o をエンジンとして使用し、エンドツーエンドのタスクを自動的に最適化します。

関連記事

続きを見る