GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入-AI-php.cn

ホームページ

テクノロジー周辺機器

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 01, 2024 pm 05:39 PM

グーグルbardgpt-4

「大規模モデル予選」権威リスト Chatbot Arena が更新されました:

Google Bard が GPT-4 を上回り、GPT-4 Turbo に次いで 2 位にランクされました。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

しかし、これに対して多くのネチズンは「不満」と「不公平」を表明した。

Google AI の責任者である Jeff Dean が、大型モデル Gemini Pro スケールの新しいバージョンが搭載されているため、Bard のパフォーマンスが大幅に向上したことを明らかにしたことが判明しました。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

これは、「ランクマッチ」でプレイする吟遊詩人にはネットワーク機能があることも意味します。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

ネチズンの疑問はこの点を中心に展開しています:

オンラインとオフラインの大規模モデルを同じランキングリストに混在させるのは非常に不公平です。誤解を招きやすい。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

Hugging Face の「最高アルパカ責任者」オマールサンセビエロ氏も次のように述べています:

この場合...私も提出できます検索機能を備えた lmsys Mixtral に?

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

さまざまな疑問に直面して、Imsys は公式に次のように回答しました:

アリーナのランキングはリアルタイムです。ご質問がある場合は、、アリーナでモデルを直接比較して投票できます。
投票データはオープンで透明性があり、ユーザープロンプトの多様性と投票の質に関する研究と、対応するデータセットが間もなくリリースされます。

ネチズンが最も懸念している問題として、Bard に抜かれた GPT-4 は非ネットワーク版であるが、Imsys は「リアルタイムデータへのアクセスによりユーザーエクスペリエンスが向上すれば、ランキングに反映されるだろう」と述べたそれ。"

そして、@OpenAI と Bing、そして Microsoft 幹部の Mikhail Parakhin に直接、GPT-4 オンラインバージョンまたは Bing Copilot をアリーナに追加する意欲を表明しました。

最新のニュースは、OpenAI の最新モデル gpt-4-0125-preview がアリーナに登場し、ユーザーの投票参加を待っているということです。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

Bard はどのようにして GPT-4 を超えたのでしょうか?

Chatbot Arena は、カリフォルニア大学バークレー校の研究者が率いる Imsys (Large Model Systems Organization) 組織によって作成された、大規模モデルの信頼できるリストです。

このランキングは匿名の 1V1 バトル投票ルールを使用し、Elo 評価システムに基づいてランク付けされています。

具体的には、投票ページは次のとおりです。モデル A とモデル B の 2 つのモデルはどちらも匿名です。ユーザーは複数の質問をした後、モデルの回答を評価します。合計 4 つの選択肢があります。A が優れています。 B の方が優れています。、A と B は同等に優れており、A と B は両方とも悪いです。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

なお、質疑応答の過程でモデルの身元が漏洩した場合、投票は無効となりますのでご了承ください。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

現在のリストによると、この分野には 56 個の大規模なモデルがあります:

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

以前は GPT-4 に依存していました。しかし、Bard の新しいバージョンがリリースされた後、GPT-4 の 2 つのバージョンを直接上回り、最初の GPT-4 Turbo とわずか 34 ポイントの差で 2 位に急上昇しました:

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

さらに詳しくは、引き分けのないすべてのモデル A 対 B の対戦において、モデル A が勝つ割合は次のとおりです:

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

モデルの組み合わせごとに決闘数もあります (引き分けなし):

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

さらに、Chatbot Arena リーダーボードは、ブートストラップを使用して Elo スコア推定値を 1,000 回ランダムにサンプリングし、信頼区間などを評価します。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

他のすべてのモデルと比較した 1 つのモデルの平均勝率は次のとおりです:

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

ただし、注目すべき点は、アリーナランキングランキングはリアルタイムであり、Bard は現在 2 位ですが、総投票数は 3,000 を超えています。

これに対し、GPT-4 Turboの得票数は3万票に達しており、上回った2バージョンの得票数もBardの数倍となっている。

GPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入

GPT-4 の最新バージョンが市場に投入されたので (ランキングリストでは更新されていませんが)、その後の結果を待つ必要があります~

参考リンク: https://twitter.com/lmsysorg/status/1752035632489300239。

以上がGPT-4は受け入れを拒否し、Bardに追い抜かれた：最新モデルが市場に参入の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

摩擦から流れへ：AIがどのように法的作業を変えているかMay 09, 2025 am 11:29 AM

法的技術革命は勢いを増し、法律専門家にAIソリューションを積極的に受け入れるように促しています。受動的抵抗は、競争力を維持することを目指している人にとってはもはや実行可能な選択肢ではありません。なぜテクノロジーの採用が重要なのですか？法律専門家

これはAIがあなたのことを考えており、あなたについて知っていることですMay 09, 2025 am 11:24 AM

多くの人は、AIとの相互作用が匿名であると仮定しており、人間のコミュニケーションとはまったく対照的です。ただし、AIはすべてのチャット中にユーザーを積極的にプロファイルします。すべてのプロンプト、すべての単語が分析および分類されます。 AI Revoのこの重要な側面を探りましょう

繁栄した、AIの準備ができている企業文化を構築するための7つのステップMay 09, 2025 am 11:23 AM

成功した人工知能戦略は、強力な企業文化サポートから分離することはできません。 Peter Druckerが言ったように、事業運営は人々に依存しており、人工知能の成功も依存しています。人工知能を積極的に受け入れる組織の場合、AIに適応する企業文化を構築することが重要であり、AI戦略の成功または失敗さえ決定します。ウェストモンローは最近、繁栄するAIに優しい企業文化を構築するための実用的なガイドをリリースしました。ここにいくつかの重要なポイントがあります。 1. AIの成功モデルを明確にする：まず第一に、AIがどのようにビジネスに力を与えることができるかについての明確なビジョンが必要です。理想的なAI操作文化は、人間とAIシステム間の作業プロセスの自然統合を実現できます。 AIは特定のタスクが得意であり、人間は創造性と判断が得意です

Netflix New Scroll、Meta AI＆＃x27;のゲームチェンジャー、Neuralinkは85億ドルで評価されていますMay 09, 2025 am 11:22 AM

メタはAIアシスタントアプリケーションをアップグレードし、ウェアラブルAIの時代が来ています！ ChatGPTと競合するように設計されたこのアプリは、テキスト、音声インタラクション、画像生成、Web検索などの標準的なAI機能を提供しますが、初めてジオロケーション機能を追加しました。これは、メタAIがあなたがどこにいるのか、あなたがあなたの質問に答えるときにあなたが何を見ているのかを知っていることを意味します。興味、場所、プロファイル、アクティビティ情報を使用して、これまで不可能な最新の状況情報を提供します。このアプリはリアルタイム翻訳もサポートしており、レイバンメガネのAIエクスペリエンスを完全に変更し、その有用性を大幅に改善しました。外国映画への関税の賦課は、メディアや文化に対する裸の力の行使です。実装された場合、これはAIと仮想生産に向かって加速します

AIサイバー犯罪から身を守るために、今日これらの手順を踏んでくださいMay 09, 2025 am 11:19 AM

人工知能は、サイバー犯罪の分野に革命をもたらし、新しい防御スキルを学ぶことを強いています。サイバー犯罪者は、ディープフォーファリーやインテリジェントなサイバー攻撃などの強力な人工知能技術を、前例のない規模で詐欺と破壊に使用しています。過去1年間、グローバルビジネスの87％がAIサイバー犯罪の標的を絞っていると報告されています。それでは、どうすればこの賢い犯罪の波の犠牲者になることを避けることができますか？リスクを特定し、個人および組織レベルで保護対策を講じる方法を探りましょう。サイバー犯罪者が人工知能をどのように使用するか技術が進むにつれて、犯罪者は、個人、企業、政府を攻撃する新しい方法を常に探しています。人工知能の広範な使用は最新の側面かもしれませんが、その潜在的な害は前例のないものです。特に、人工知能