ホームページ >テクノロジー周辺機器 >AI >Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?
中国はAIモデルで再びそれをやりましたが、今回は打撃がより大きく、より良いです! Baidu - 中国のAI会社は、最近2つの大手言語モデル(LLMS)をリリースしました - アーニー4.5&X1。これまでのOpenaiの最新かつ最大のモデルよりも優れたパフォーマンスを主張するGPT-4.5では、これらのモデルはDeepSeek-R1よりも費用効率が高いです。モデルはあまりにも良いように見えます - 価格のほんの一部で高品質を提供します。このブログでは、アーニー4.5&X1モデルを調査し、ベンチマークの結果を評価し、それらが実際のアプリケーションでどのように機能するかを確認します。それでは、始めましょう。
Ernie 4.5&X1は、インターネットサービス、人工知能、自律運転を専門とする中国の大手技術会社Baiduが開発した2つの最新のマルチモーダルLLMです。中国での支配的な検索エンジンと、AI主導のイノベーションの進歩で最もよく知られています。 Baiduは、2021年12月に最初のLLMであるErnie 3.0 Titanを発売しました。その後、さらにいくつかのモデルをリリースし、より堅牢なLLMを構築するために同時に作業しました。すべての研究と継続的な努力の結果は、アーニー4.5とX1です。
Ernie 4.5は、テキスト、画像、オーディオ、ビデオなど、さまざまなデータタイプを理解し統合できるマルチモーダルファンデーションモデルです。この多様なモデリングアプローチは、さまざまな種類のコンテンツを理解して生成する能力を高めます。
アーニー4.5の重要な機能の一部を次に示します。
Ernie X1は、マルチモーダル機能を備えた深い考えの推論モデルとして設計されています。これは、Baiduがリリースしたこの種のディープ思考モデルの最初です。主要な機能のいくつかは次のとおりです。
AIチャットボット - アーニーボット、またはAPIを介して、アーニー4.5とX1にアクセスできます。
ボット経由のアクセス:
どちらのモデルも、BaiduのErnie Botプラットフォームで個々のユーザーが自由にアクセスできます。ただし、アーニーボットの登録は現在、中国国民に限定されています。
API経由のアクセス:
現在、プラットフォームにはすべてのユーザーがアクセスすることはできません。また、APIを介して利用可能なのはArnie 4.5のみであり、Arnie X1はまもなくプラットフォームで利用可能になります。
このセクションでは、これらのモデルがマルチメディア、推論、ドキュメント分析などを含むタスクでどのように機能するかを確認します。モデルインターフェイスは中国語のみをサポートしており、アカウントの作成は中国国民に限定されているため、2つのモデルをどのように使用しているか、および受け取った出力の例をいくつか見ていきます。以下を含む、オンラインで見つけたアーニー4.5とX1の最も一般的なユースケースのいくつかをカバーします。
このタスクでは、モデルは画像の形で与えられた数学的問題を解決するように求められました。
使用されるモデル:アーニー4.5
出力:
他のほとんどのマルチモーダルLLMSと同様に、アーニー4.5はビデオをすばやく分析し、画像の問題を解決します。画像のすべての質問を1つずつ受け取り、最終的にそれらすべてを要約します。パフォーマンスの速度と正確性により、迅速かつ正確な問題解決を必要とする学生、教育者、研究者、専門家にとって有用なツールになります。
ここでは、モデルにドキュメントが与えられ、そのドキュメントから特定のトピックに関する情報を要約する必要がありました。
使用されるモデル:アーニー4.5
出力:
このモデルを使用すると、さまざまなタイプの複数のファイルを一度にアップロードできます。ドキュメント、PDF、PPTS、Excelシートなど、さまざまなタイプのファイルを処理できます。アップロードされたファイルから、チャットボットについて照会したいファイル(またはそれ以上)を選択でき、モデルはトピックをすばやく要約します。複数のファイルの迅速な処理は、研究分析、法的文書レビュー、財務データ抽出、企業報告などのタスクに非常に役立ちます。
このタスクでは、モデルは指定されたオーディオを分析し、そのソースを見つける必要がありました。
使用されるモデル:アーニー4.5
出力:
オーディオ分析は、人気のあるAIチャットボットがインターフェイスに組み込まれていない機能であり、この種のアーニー4.5を作る機能です。モデルはクリップを迅速に分析し、そのソースを決定し、クリップの重要性を説明し続けます。その迅速な分析と詳細な説明により、リアルタイムの転写、音声ベースの検索、ディープフェイク検出、メディア、顧客サービス、教育、法執行機関全体の感情分析などのタスクの貴重なツールになります。
このタスクのために、モデルは部屋を分析し、全体的な魅力を高めることができる可能性のある装飾を提案する必要がありました。その後、部屋の更新された画像を生成する必要がありました。
使用されるモデル:アーニーX1
出力:
モデルはすぐに画像を処理します。次に、全体的な魅力を高めるために、部屋の装飾の改善の可能性を示唆しています。最後に、すべての提案された機能強化を備えた部屋の画像を生成します。この機能は、インテリアデザイン、家の改修計画、不動産のステージング、仮想装飾の視覚化などのタスクに最適な追加です。
注:この投稿からXの例を挙げました。
Ernie 4.5とX1の両方に、Openai、Deepseek、Grok、Claudeなどのトップモデルと比較して、すべての機能があります。ここに2つのモデルの価格の内訳があります。
モデル | 入力価格(100万トークンあたり) | 出力価格(100万トークンあたり) | 可用性 |
アーニー4.5 | 0.55ドル | 2.20ドル | 利用可能 |
アーニーX1 | 0.28ドル | $ 1.10 | まだ利用できません |
他のトップモデルと比較して、アーニー4.5とX1は大幅に安価であり、生成AIの進歩における貴重な資産となっています。
最新のアーニーモデルの機能、能力、価格設定をすでに見てきました。次に、GPT-4.5、GPT-4O、DeepSeek-R1などのトップモデルに対するこれらのモデルのパフォーマンス数を見てみましょう。
以下のグラフは、マルチモーダルAIパフォーマンスをテストする複数のベンチマークにわたって、アーニー4.5とGPT-4Oを比較しています。
グラフは次のことを示しています:
次のグラフでは、テキストベースの推論と問題解決のために、複数のベンチマークでArnie 4.5、Deepseek V3 - Chat、GPT-4O、およびGPT-4.5を比較します。
グラフからの重要なポイントを次に示します。
トップLLMになるレースは熱くなり、バイドゥのアーニー4.5とX1は、オープン、ディープシーク、人類、メタの深刻な競争を導入しています。中国のAI Labsが西部AIに匹敵するモデルを数分の1のコストで提供するモデルを提供することで、企業は競争力を維持するためにより速く革新し、コストを削減することを余儀なくされます。
これらの進歩はすべて、ついに次のようになります。
BaiduのErnie 4.5およびX1モデルは、AIモデルの単なるセットではなく、業界の破壊者です。彼らの優れたマルチモーダルおよび推論能力、低価格、および中国のデジタルエコシステムへの深い統合は、グローバルAI市場のパワーシフトを示しています。
この傾向が続くと、さまざまな業界で大規模なAI民主化とアウトリーチが見られます。これにより、多くの西洋企業がより安価なモデルをリリースするようになります。これは市場での競争力を高めるだけでなく、ユーザーが自分のお金に最も価値を獲得することも保証します。
A. Ernie 4.5&X1は、Baiduが開発した最新の大型言語モデル(LLMS)であり、OpenaiのGPT-4.5やDeepseek-R1などのトップAIモデルに匹敵するように設計されています。アーニー4.5はマルチモーダルファンデーションモデルですが、アーニーX1は高度な機能を備えた深い考えの推論モデルです。
Q2。バイドゥのアーニー4.5はアーニーX1とどう違うのですか?A.アーニー4.5は、テキスト、画像、オーディオ、ビデオを高い精度で処理できるマルチモーダル理解のために最適化されています。一方、アーニーX1は、深い考えの推論のために設計されており、文脈の理解、計画、および自己反射を伴う問題解決に優れています。
Q3。 Ernie 4.5とX1は、OpenaiのGPT-4.5と比較してどうですか?A. Baidu Ernie 4.5は、特に推論、マルチモーダル理解、および幻覚防止で、複数のベンチマークでGPT-4.5を上回り、GPT-4.5の価格の1%しかかかりません。 Ernie X1は、DeepSeek-R1レベルのパフォーマンスを半分のコストで提供し、非常に競争力のあるAIソリューションを提供します。
Q4。アーニー4.5とX1の価格の詳細は何ですか? A.アーニー4.5:入力コストは100万トークンあたり0.55ドル、出力は100万トークンあたり2.20ドルでした。
Ernie X1:入力コストは100万トークンあたり0.28ドル、出力は100万トークンあたり1.10ドルでした。
Ernie X1モデルはまだAPIを介して利用できませんが、まもなく利用できます。
A.これらのモデルにアクセスできます。
1。Yiyan.Baidu.comのErnie Bot(AI Chatbot)(中国のユーザーのみが利用できます)。
2。BaiduAI CloudのMaasプラットフォーム、Qianfan、APIアクセス用(現在はErnie 4.5のみが利用可能です)。
以上がBaidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。