検索
ホームページテクノロジー周辺機器AIBaidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

中国はAIモデルで再びそれをやりましたが、今回は打撃がより大きく、より良いです! Baidu - 中国のAI会社は、最近2つの大手言語モデル(LLMS)をリリースしました - アーニー4.5&X1。これまでのOpenaiの最新かつ最大のモデルよりも優れたパフォーマンスを主張するGPT-4.5では、これらのモデルはDeepSeek-R1よりも費用効率が高いです。モデルはあまりにも良いように見えます - 価格のほんの一部で高品質を提供します。このブログでは、アーニー4.5&X1モデルを調査し、ベンチマークの結果を評価し、それらが実際のアプリケーションでどのように機能するかを確認します。それでは、始めましょう。

目次

  • アーニー4.5とx1とは何ですか?
    • アーニー4.5
    • アーニーX1
  • アーニー4.5とx1にアクセスする方法は?
  • アーニー4.5およびX1パフォーマンスチェック
    • タスク1:推論画像分析
    • タスク2:ドキュメント分析の要約
    • タスク3:オーディオ分析
    • タスク4:創造性の画像生成
  • Baiduのアーニー4.5&X1:価格
  • アーニー4.5およびX1:標準ベンチマークの結果
  • 将来の影響
  • 結論
  • よくある質問

アーニー4.5とx1とは何ですか?

Ernie 4.5&X1は、インターネットサービス、人工知能、自律運転を専門とする中国の大手技術会社Baiduが開発した2つの最新のマルチモーダルLLMです。中国での支配的な検索エンジンと、AI主導のイノベーションの進歩で最もよく知られています。 Baiduは、2021年12月に最初のLLMであるErnie 3.0 Titanを発売しました。その後、さらにいくつかのモデルをリリースし、より堅牢なLLMを構築するために同時に作業しました。すべての研究と継続的な努力の結果は、アーニー4.5とX1です。

アーニー4.5

Ernie 4.5は、テキスト、画像、オーディオ、ビデオなど、さまざまなデータタイプを理解し統合できるマルチモーダルファンデーションモデルです。この多様なモデリングアプローチは、さまざまな種類のコンテンツを理解して生成する能力を高めます。

アーニー4.5の重要な機能の一部を次に示します。

  • アーニー4.5は、その前身であるアーニー4.0に対する理解、生成、推論、および記憶の包括的な改善を示しています。
  • 幻覚防止、論理的推論、コーディングに大きな能力を示し、より高い精度で複雑なタスクの取り扱いに熟達しています。 ​
  • このモデルは、複数のベンチマークでOpenaiのGPT-4.5よりも優れたパフォーマンスもありますが、GPT-4.5を使用するのにかかる費用の1%しかかかりません。

アーニーX1

Ernie X1は、マルチモーダル機能を備えた深い考えの推論モデルとして設計されています。これは、Baiduがリリースしたこの種のディープ思考モデルの最初です。主要な機能のいくつかは次のとおりです。

  • アーニーX1は、コンテキストを理解し、その思考プロセスを計画し、その反応を反映し、時間の経過とともに進化することに優れています。
  • 高度な検索、画像理解、複雑な計算などのタスクにさまざまなツールを自律的に利用できます。
  • このモデルは、DeepSeek-R1と同等のパフォーマンスを提供しますが、半分の価格で、高度なAI機能を求めている企業に費用対効果の高いソリューションを提供します。

アーニー4.5とx1にアクセスする方法は?

AIチャットボット - アーニーボット、またはAPIを介して、アーニー4.5とX1にアクセスできます。

ボット経由のアクセス:

  • https://yiyan.baidu.comに向かいます
  • 詳細を追加してアカウントを作成し、開始します。

どちらのモデルも、BaiduのErnie Botプラットフォームで個々のユーザーが自由にアクセスできます。ただし、アーニーボットの登録は現在、中国国民に限定されています。

API経由のアクセス:

  • QianfanのBaidu Ai CloudのMaasプラットフォームに向かいます
  • プラットフォームでアカウントを作成して、開始します。

現在、プラットフォームにはすべてのユーザーがアクセスすることはできません。また、APIを介して利用可能なのはArnie 4.5のみであり、Arnie X1はまもなくプラットフォームで利用可能になります。

アーニー4.5およびX1パフォーマンスチェック

このセクションでは、これらのモデルがマルチメディア、推論、ドキュメント分析などを含むタスクでどのように機能するかを確認します。モデルインターフェイスは中国語のみをサポートしており、アカウントの作成は中国国民に限定されているため、2つのモデルをどのように使用しているか、および受け取った出力の例をいくつか見ていきます。以下を含む、オンラインで見つけたアーニー4.5とX1の最も一般的なユースケースのいくつかをカバーします。

  1. 画像分析による推論
  2. ドキュメント分析と要約
  3. オーディオ分析
  4. 創造性とイメージ生成

タスク1:推論画像分析

このタスクでは、モデルは画像の形で与えられた数学的問題を解決するように求められました。

使用されるモデル:アーニー4.5

出力:

他のほとんどのマルチモーダルLLMSと同様に、アーニー4.5はビデオをすばやく分析し、画像の問題を解決します。画像のすべての質問を1つずつ受け取り、最終的にそれらすべてを要約します。パフォーマンスの速度と正確性により、迅速かつ正確な問題解決を必要とする学生、教育者、研究者、専門家にとって有用なツールになります。

タスク2:ドキュメント分析の要約

ここでは、モデルにドキュメントが与えられ、そのドキュメントから特定のトピックに関する情報を要約する必要がありました。

使用されるモデル:アーニー4.5

出力:

このモデルを使用すると、さまざまなタイプの複数のファイルを一度にアップロードできます。ドキュメント、PDF、PPTS、Excelシートなど、さまざまなタイプのファイルを処理できます。アップロードされたファイルから、チャットボットについて照会したいファイル(またはそれ以上)を選択でき、モデルはトピックをすばやく要約します。複数のファイルの迅速な処理は、研究分析、法的文書レビュー、財務データ抽出、企業報告などのタスクに非常に役立ちます。

タスク3:オーディオ分析

このタスクでは、モデルは指定されたオーディオを分析し、そのソースを見つける必要がありました。

使用されるモデル:アーニー4.5

出力:

オーディオ分析は、人気のあるAIチャットボットがインターフェイスに組み込まれていない機能であり、この種のアーニー4.5を作る機能です。モデルはクリップを迅速に分析し、そのソースを決定し、クリップの重要性を説明し続けます。その迅速な分析と詳細な説明により、リアルタイムの転写、音声ベースの検索、ディープフェイク検出、メディア、顧客サービス、教育、法執行機関全体の感情分析などのタスクの貴重なツールになります。

タスク4:創造性の画像生成

このタスクのために、モデルは部屋を分析し、全体的な魅力を高めることができる可能性のある装飾を提案する必要がありました。その後、部屋の更新された画像を生成する必要がありました。

使用されるモデル:アーニーX1

出力:

モデルはすぐに画像を処理します。次に、全体的な魅力を高めるために、部屋の装飾の改善の可能性を示唆しています。最後に、すべての提案された機能強化を備えた部屋の画像を生成します。この機能は、インテリアデザイン、家の改修計画、不動産のステージング、仮想装飾の視覚化などのタスクに最適な追加です。

注:この投稿からXの例を挙げました。

Baiduのアーニー4.5&X1:価格

Ernie 4.5とX1の両方に、Openai、Deepseek、Grok、Claudeなどのトップモデルと比較して、すべての機能があります。ここに2つのモデルの価格の内訳があります。

モデル 入力価格(100万トークンあたり) 出力価格(100万トークンあたり) 可用性
アーニー4.5 0.55ドル 2.20ドル 利用可能
アーニーX1 0.28ドル $ 1.10 まだ利用できません

他のトップモデルと比較して、アーニー4.5とX1は大幅に安価であり、生成AIの進歩における貴重な資産となっています。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

アーニー4.5およびX1:標準ベンチマークの結果

最新のアーニーモデルの機能、能力、価格設定をすでに見てきました。次に、GPT-4.5、GPT-4O、DeepSeek-R1などのトップモデルに対するこれらのモデルのパフォーマンス数を見てみましょう。

以下のグラフは、マルチモーダルAIパフォーマンスをテストする複数のベンチマークにわたって、アーニー4.5とGPT-4Oを比較しています。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

グラフは次のことを示しています:

  • アーニー4.5は、ほとんどのマルチモーダルタスクでGPT-4Oを上回ります。
  • アーニー4.5の平均スコアは77.77で、GPT-4Oの73.92よりも高くなっています。
  • アーニー4.5は、MathvistaとDocvqaに大きな優位性を持ち、数学の推論とドキュメントベースの質問を回答するスキルを示しています。
  • どちらのモデルもOcrbenchとMmmuで同様に機能しますが、アーニー4.5にはまだわずかな利点があります。

次のグラフでは、テキストベースの推論と問題解決のために、複数のベンチマークでArnie 4.5、Deepseek V3 - Chat、GPT-4O、およびGPT-4.5を比較します。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

グラフからの重要なポイントを次に示します。

  • Ernie 4.5は、平均スコア79.6でパックをリードし、Deepseek V3をわずかに上回る79.14でチャットします。
  • MMLU-Pro、GSM8K、Humanvalなどの一般的な知識、推論、およびプログラミングベンチマークでうまく機能します。
  • GPT-4OとDeepSeek V3も強力な結果を示しており、DeepSeek V3はCMMLUのような中国のベンチマークで競争力のあるパフォーマンスを発揮しています。
  • Ernie 4.5はGSM8K(MATH)およびC-EVAL(一般的な推論)に優れていますが、DeepSeek V3はパフォーマンスが非常に近いです。

将来の影響

トップLLMになるレースは熱くなり、バイドゥのアーニー4.5とX1は、オープン、ディープシーク、人類、メタの深刻な競争を導入しています。中国のAI Labsが西部AIに匹敵するモデルを数分の1のコストで提供するモデルを提供することで、企業は競争力を維持するためにより速く革新し、コストを削減することを余儀なくされます。

これらの進歩はすべて、ついに次のようになります。

  • すべての主要なAI研究センターでAIがより速く進歩しています。
  • 企業や開発者向けのより手頃なAI。
  • 従来のテキストベースのAIを超えて拡大するマルチモーダルAIアプリケーションの新しい時代。

結論

BaiduのErnie 4.5およびX1モデルは、AIモデルの単なるセットではなく、業界の破壊者です。彼らの優れたマルチモーダルおよび推論能力、低価格、および中国のデジタルエコシステムへの深い統合は、グローバルAI市場のパワーシフトを示しています。

この傾向が続くと、さまざまな業界で大規模なAI民主化とアウトリーチが見られます。これにより、多くの西洋企業がより安価なモデルをリリースするようになります。これは市場での競争力を高めるだけでなく、ユーザーが自分のお金に最も価値を獲得することも保証します。

よくある質問

Q1。アーニー4.5とx1とは何ですか?

A. Ernie 4.5&X1は、Baiduが開発した最新の大型言語モデル(LLMS)であり、OpenaiのGPT-4.5やDeepseek-R1などのトップAIモデルに匹敵するように設計されています。アーニー4.5はマルチモーダルファンデーションモデルですが、アーニーX1は高度な機能を備えた深い考えの推論モデルです。

Q2。バイドゥのアーニー4.5はアーニーX1とどう違うのですか?

A.アーニー4.5は、テキスト、画像、オーディオ、ビデオを高い精度で処理できるマルチモーダル理解のために最適化されています。一方、アーニーX1は、深い考えの推論のために設計されており、文脈の理解、計画、および自己反射を伴う問題解決に優れています。

Q3。 Ernie 4.5とX1は、OpenaiのGPT-4.5と比較してどうですか?

A. Baidu Ernie 4.5は、特に推論、マルチモーダル理解、および幻覚防止で、複数のベンチマークでGPT-4.5を上回り、GPT-4.5の価格の1%しかかかりません。 Ernie X1は、DeepSeek-R1レベルのパフォーマンスを半分のコストで提供し、非常に競争力のあるAIソリューションを提供します。

Q4。アーニー4.5とX1の価格の詳細は何ですか?

A.アーニー4.5:入力コストは100万トークンあたり0.55ドル、出力は100万トークンあたり2.20ドルでした。
Ernie X1:入力コストは100万トークンあたり0.28ドル、出力は100万トークンあたり1.10ドルでした。
Ernie X1モデルはまだAPIを介して利用できませんが、まもなく利用できます。

Q5。アーニー4.5とx1にアクセスするにはどうすればよいですか?

A.これらのモデルにアクセスできます。
1。Yiyan.Baidu.comのErnie Bot(AI Chatbot)(中国のユーザーのみが利用できます)。
2。BaiduAI CloudのMaasプラットフォーム、Qianfan、APIアクセス用(現在はErnie 4.5のみが利用可能です)。

以上がBaidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
AIセラピストがここにいます:あなたが知る必要がある14の画期的なメンタルヘルスツールAIセラピストがここにいます:あなたが知る必要がある14の画期的なメンタルヘルスツールApr 30, 2025 am 11:17 AM

訓練を受けたセラピストの人間のつながりと直観を提供することはできませんが、多くの人々は、比較的顔のない匿名のAIボットと心配や懸念を共有することを快適に共有していることが研究で示されています。 これが常に良いかどうか

食料品の通路にAIを呼びます食料品の通路にAIを呼びますApr 30, 2025 am 11:16 AM

数十年の技術である人工知能(AI)は、食品小売業界に革命をもたらしています。 大規模な効率性の向上とコスト削減から、さまざまなビジネス機能にわたる合理化されたプロセスまで、AIの影響はUndeniablです

あなたの精神を持ち上げるために生成的なAIからPEPの話をするあなたの精神を持ち上げるために生成的なAIからPEPの話をするApr 30, 2025 am 11:15 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さを特定して説明するなど、最新のAIで進行中のForbes列のカバレッジの一部です(こちらのリンクを参照)。さらに、私のコンプのために

AI駆動のハイパーパーソナリゼーションがすべてのビジネスにとって必須である理由AI駆動のハイパーパーソナリゼーションがすべてのビジネスにとって必須である理由Apr 30, 2025 am 11:14 AM

プロの画像を維持するには、時折ワードローブの更新が必要です。 オンラインショッピングは便利ですが、対面の試練の確実性がありません。 私の解決策? AI駆動のパーソナライズ。 衣類の選択をキュレーションするAIアシスタントが想像しています

Duolingoを忘れてください:Google Translateの新しいAI機能は言語を教えていますDuolingoを忘れてください:Google Translateの新しいAI機能は言語を教えていますApr 30, 2025 am 11:13 AM

Google Translateは言語学習機能を追加します Android Authorityによると、App Expert AssemberBugは、Google Translateアプリの最新バージョンには、パーソナライズされたアクティビティを通じてユーザーが言語スキルを向上させるように設計された新しい「実践」モードのテストコードが含まれていることを発見しました。この機能は現在、ユーザーには見えませんが、AssembleDebugはそれを部分的にアクティブにして、新しいユーザーインターフェイス要素の一部を表示できます。 アクティブ化すると、この機能は、「ベータ」バッジでマークされた画面の下部に新しい卒業キャップアイコンを追加し、「実践」機能が最初に実験形式でリリースされることを示します。 関連するポップアッププロンプトは、「あなたのために調整されたアクティビティを練習してください!」を示しています。つまり、Googleがカスタマイズされたことを意味します

彼らはAIのためにTCP/IPを作成しており、Nandaと呼ばれています彼らはAIのためにTCP/IPを作成しており、Nandaと呼ばれていますApr 30, 2025 am 11:12 AM

MITの研究者は、AIエージェント向けに設計された画期的なWebプロトコルであるNandaを開発しています。 ネットワークエージェントと分散型AIの略であるNandaは、インターネット機能を追加することにより、人類のモデルコンテキストプロトコル(MCP)に基づいて構築され、AI Agenを可能にします

プロンプト:Deepfake Detectionは活況を呈しているビジネスですプロンプト:Deepfake Detectionは活況を呈しているビジネスですApr 30, 2025 am 11:11 AM

メタの最新のベンチャー:chatgptに匹敵するAIアプリ Facebook、Instagram、WhatsApp、およびThreadsの親会社であるMetaは、新しいAIを搭載したアプリケーションを立ち上げています。 このスタンドアロンアプリであるMeta AIは、OpenaiのChatGptと直接競争することを目指しています。 レバー

ビジネスリーダーのためのAIサイバーセキュリティでの次の2年間ビジネスリーダーのためのAIサイバーセキュリティでの次の2年間Apr 30, 2025 am 11:10 AM

AIサイバー攻撃の上昇する潮をナビゲートします 最近、人類のためのCISOであるジェイソン・クリントンは、機械間通信が増殖すると、これらの「アイデンティティ」を保護するために、非人間のアイデンティティに結びついた新たなリスクを強調しました。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境