ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！-AI-php.cn

ホームページ

テクノロジー周辺機器

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 07, 2023 pm 03:40 PM

chatgptgpt-4

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

今日の生成型 AI チャットボットの世界では、ChatGPT (2022 年 11 月に OpenAI によって開始) が突然台頭し、続いて今年 2 月に Bing Chat、そして 2022 年に Google Bard が開始されました。行進。私たちは、これらのチャットボットにさまざまなタスクを実行して、どれが AI チャットボットスペースを支配するかを決定することにしました。 Bing Chat は最新の ChatGPT モデルに似た GPT-4 テクノロジーを使用しているため、今回は AI チャットボットテクノロジーの 2 つの巨人、OpenAI と Google に焦点を当てます。

私たちは、悪いジョーク、ディベートでの会話、数学の文章問題、要約、事実の検索、創造的な文章、コーディングの 7 つの主要なカテゴリで ChatGPT と Bard をテストしました。各テストでは、まったく同じコマンド (「プロンプト」と呼ばれる) を ChatGPT (GPT-4 を使用) と Google Bard に入力し、最初に得られた結果を選択して比較しました。

以前の GPT-3.5 モデルに基づく ChatGPT のバージョンも利用可能ですが、テストではそのバージョンを使用しなかったことに注意してください。 GPT-4 のみを使用するため、混乱を避けるために、この記事では ChatGPT を「ChatGPT-4」と呼びます。

明らかに、これは科学的な研究ではなく、チャットボットの機能の興味深い比較にすぎません。ランダムな要素により、出力はセッション間で異なる場合があり、異なるプロンプトを使用してさらに評価すると、異なる結果が生成されます。さらに、Google と OpenAI がモデルのアップグレードを続けるにつれて、これらのモデルの機能は時間の経過とともに急速に変化します。ただし、現時点では、2023 年 4 月初旬の状況を比較してみましょう。

悪いジョーク

知恵の戦いを盛り上げるために、ChatGPT と Bard にジョークを書いてもらうように依頼しました。コメディの本質は悪いジョークに見られることが多いため、この 2 つのチャットボットがユニークなジョークを考え出せるかどうかを確認したいと考えました。

手順/プロンプト: オリジナルの悪いジョークを 5 つ書いてください

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！ ##Bard が提供した 5 つの悪いジョークのうち、3 つは Google を使用していることがわかりました。他の 2 つの悪いジョークのうち、1 つはミッチ・ヘドバーグが Twitter に投稿したジョークから部分的に借用しましたが、ただ面白くない言葉遊びであり、あまり効果的ではありませんでした。驚いたことに、他では見つけることができない、一見オリジナルと思われるジョーク (カタツムリに関する) が 1 つありますが、残念なことに、それも同様に面白くありません。

同時に、ChatGPT-4 の 5 つの冷たいジョークは 100% オリジナルではなく、他のチャンネルから完全に盗用されたものですが、正確に表現されています。 Bard は現時点では ChatGPT-4 よりも優位に立っているようで、（私たちの指示に従って）オリジナルのジョークを作成しようとしていますが、いくつかのジョークは恥ずかしいやり方でひどく失敗しています（しかし、悪いジョークとはそういうものです）。彼は意図せずに間違ったことを言ったとさえ言われる（これも冷たいジョークのスタイルで）。

勝者: Bard

ディベート会話

数学応用問題

伝統的に、数学の問題は ChatGPT などの大規模言語モデル (LLM) の長所ではありません。そこで、各ロボットに一連の複雑な方程式と算術を与える代わりに、各ロボットに昔ながらの学校スタイルの文章問題を与えました。

手順/ヒント: Microsoft Windows 11 で 3.5 インチのフロッピーディスクを使用する場合、フロッピーディスクは何枚必要ですか?

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

##この問題を解決するには、各 AI モデルは Microsoft Windows 11 インストールのデータサイズと 3.5 のデータ容量を知る必要があります。インチのフロッピーディスク。また、質問者が使用する可能性が最も高いフロッピーディスクの密度についても推測する必要があります。次に、概念をまとめるために基本的な数学を行う必要があります。

私たちの評価では、Bard はこれら 3 つの重要な点を正しく理解していました (Windows 11 のインストールサイズの推定値は通常 20 ～ 30 GB であるため、十分に近い) が、計算では惨めに失敗しました。「15.11」フロッピーディスクはその後、それは「単なる理論上の数字」だと言い、最後にフロッピーディスクが 15 枚以上必要であることを認めましたが、それでも正しい値には近くありません。

対照的に、ChatGPT-4 には、Windows 11 のインストールサイズ (最小 64 GB を正しく引用し、実際の基本インストールサイズと比較) に関連するいくつかの小さな違いが含まれており、フロッピーディスクの容量を正しく解釈し、掛け算と割り算が正しく行われ、最終的には 14222 個のディスクになりました。 1GB が 1024 または 1000MB であると主張する人もいるかもしれませんが、この数字は妥当です。また、実際の数値は他の要因に基づいて変化する可能性があることも正確に述べています。

勝者: ChatGPT-4

概要

AI 言語モデルは、複雑な情報を要約し、テキストを主要な要素に要約する能力で知られています。各言語モデルのテキスト要約能力を評価するために、最近の Ars Technica の記事から 3 つの段落をコピーして貼り付けました。

手順/ヒント: 1 つの段落に要約します [記事本文の 3 つの段落]

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！ ##Bard と ChatGPT-4 はどちらもこの情報を収集し、重要な詳細にまで絞り込みます。ただし、Bard のバージョンは情報を新しい表現に統合した真の要約に近いのに対し、ChatGPT-4 のバージョンは文が切り取られ、断片が残された、より連結したものに見えます。どちらも優れていますが、このテストでは Bard が ChatGPT-4 よりも優れていることを認めざるを得ません。

勝者: Google Bard

事実検索

大規模な言語モデルは独善的な誤り (研究者によって「幻想」と呼ばれることがよくあります) を起こすことが知られており、そのため信頼性が低くなります。外部情報源によって補足されない限り、事実に基づく言及。興味深いことに、Bard はオンラインで情報を照会できますが、ChatGPT-4 はまだできません (ただし、この機能はプラグインで間もなく公開される予定です)。

この能力をテストするために、私たちは Bard と ChatGPT-4 に、難しくデリケートなトピックに関する歴史的知識を表現するよう挑戦しました。

手順/ヒント: ビデオゲームを発明したのは誰ですか?

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

##誰がビデオゲームを発明したかという質問に答えるのは困難です。それは、「ビデオゲーム」という言葉をどのように定義するかによって異なり、歴史家によってこの言葉の定義が異なるためです。初期のコンピュータゲームはビデオゲームであると考える人もいれば、テレビも必ず含めるべきだと考える人もいます。受け入れられた答えはありません。 ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

オンラインで情報を見つけることができる Bard の能力が同社に有利であると考えていましたが、今回の場合、ラルフベアを「ビデオゲームの父」と呼ぶ、Google で最も人気のある回答の 1 つを選択したため、それが裏目に出た可能性があります。」。ベアに関する事実はすべて正しいが、ベアは 2014 年に亡くなっているため、最後の文は過去形にするべきだったのだろう。しかし、Bard 氏は、「Tennis for Two」や「Spacewar!」など、「最初のビデオゲーム」タイトルの他の初期の候補については言及していないため、その答えは誤解を招き、不完全である可能性があります。

ChatGPT-4 は、多くの初期ビデオゲーム史家の現在の感情を代表する、より包括的かつ詳細な回答を提供し、「ビデオゲームの発明は 1 人の人物に帰することはできない」とし、ランダムな「一連の革新」を提示しています。 " 時間とともに。唯一の間違いは、Spacewar! を「最初のデジタルコンピュータゲーム」と呼んだことでしたが、実際はそうではありませんでした。もっとニッチなエッジケースを含めるように答えを拡張することもできますが、ChatGPT-4 は重要な初期の先駆者の概要を提供します。

勝者: ChatGPT-4

クリエイティブライティング

気まぐれなトピックに対する自由な創造性は、大規模な言語モデルに適しています。私たちは、Bard と ChatGPT-4 に短い気まぐれな物語を書いてもらうことでこれをテストしました。

指示/プロンプト: エイブラハムリンカーンのバスケットボールの発明について、2 段落の創造的なストーリーを書きます。

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

Bard の出力結果はいくつかの側面にあります。満足です。まず、2 段落ではなく 10 段落であり、短く、途切れた段落です。さらに、プロンプトのコンテキストではあまり意味をなさない詳細もいくつか共有されています。たとえば、エイブラハムリンカーンのホワイトハウスがイリノイ州スプリングフィールドにあったのはなぜですか? それ以外は、興味深い単純な話です。

ChatGPT-4 もイリノイ州を舞台にしていますが、より正確に言えば、その時代の大統領やホワイトハウスについてはまったく言及されていません。しかし、後に「北と南の選手たち」が互いの違いを脇に置いて一緒にバスケットボールをしたと書かれており、これはバスケットボールが発明されて間もなくの出来事であることを意味している。

全体として、ChatGPT-4 の出力が実際に 2 つの段落に分割されているため、ChatGPT-4 の方がわずかに優れていると考えられます。ただし、各段落を可能な限り拡張することでこの制限を回避しているようです。それでも、私たちは ChatGPT-4 バージョンのストーリーのクリエイティブな詳細が大好きです。

勝者: ChatGPT-4

エンコーディング

この世代の大規模言語モデルに「キラー」があるとしたら、それをプログラミングアシスタントとして使用している可能性があります。 Codex モデルに関する OpenAI の初期の取り組みにより、GitHub の CoPilot が可能になり、ChatGPT 自体は、単純なプログラム用のかなり有能なコーダーおよびデバッガーとして名声を博しました。したがって、Google Bard のパフォーマンスも興味深いはずです。

手順/ヒント: 「Hello World」という Python スクリプトを作成し、ランダムに無限に繰り返す文字列を作成します。

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！

ChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！ #Google Bard はまったく書けないようですコード。 Googleはこの機能をまだサポートしていないが、近いうちにコード化される予定だという。現在、Bard は、「私にコーディングを手伝ってほしいようですが、私はそのための訓練を受けていません。」と言って、私たちのプロンプトを拒否しています。また、コードをシステムクリップボードにコピーして IDE やテキストエディタに簡単に貼り付けることができる、[コードをコピー] ボタンを備えた派手なコードボックスにもフォーマットされています。しかし、このコードは機能しますか? コードを rand_string.py ファイルに貼り付け、Windows 10 のコンソールで実行したところ、問題なく機能しました。

勝者: ChatGPT-4

勝者: ChatGPT-4、しかしまだ終わっていない

全体として、ChatGPT-4 は 7 つのトライアルのうち 5 回勝利しました (これは上記を無視してここをスキップした場合のために、「GPT-4 を使用する ChatGPT」を参照します)。しかし、それだけではありません。速度、コンテキストの長さ、コスト、将来のアップグレードなど、考慮すべき要素は他にもあります。

速度の点では、現在 ChatGPT-4 のほうが遅く、リンカーンとバスケットボールに関する物語を書くのに 52 秒かかったのに対し、Bard では 6 秒しかかかりませんでした。 OpenAI が GPT-4 よりもはるかに高速な AI モデルを GPT-3.5 の形式で提供していることは注目に値します。このモデルは、リンカーンとバスケットボールの物語を書くのにわずか 12 秒しかかかりませんが、深くて創造的なタスクには適していないと言えます。

各言語モデルには、一度に処理できるトークン (単語の断片) の最大数があります。これは「コンテキストウィンドウ」と呼ばれることもありますが、短期記憶にほぼ似ています。会話型チャットボットの場合、コンテキストウィンドウにはこれまでの会話履歴全体が含まれています。いっぱいになると、ハードリミットに達するか、先に進みますが、前に説明したセクションの「メモリ」は消去されます。 ChatGPT-4 はメモリをローリングし続け、以前のコンテキストを消去します。報告によると、トークンの制限は約 4,000 です。 Bard は総出力を約 1,000 に制限しており、この制限を超えると、以前の議論の「記憶」を消去すると報告されています。

最後に、コストの問題があります。 ChatGPT (具体的には GPT-4 ではありません) は現在、ChatGPT Web サイトを通じて限定的に無料で利用できますが、GPT-4 への優先アクセスが必要な場合は、月額 20 ドルを支払う必要があります。プログラミングに精通したユーザーは、API を介してより安価に初期の ChatGPT-3.5 モデルにアクセスできますが、この記事の執筆時点では、GPT-4 API はまだ限定的なテスト中です。一方、Google Bard は、一部の Google ユーザーを対象とした限定トライアルとして無料です。現在、Google は、Bard がより広く利用可能になった場合に、Bard へのアクセスに料金を請求する予定はありません。

最後に、前述したように、両方のモデルは常にアップグレードされています。たとえば、Bard は先週の金曜日に数学が得意になるアップデートを受け取ったばかりで、すぐにコーディングできるようになるかもしれません。 OpenAI は GPT-4 モデルの改良も続けています。 Google は現在、最も強力な言語モデルを維持しているため (おそらく計算コストのため)、より強力な競合他社である Google が追いつく可能性があります。

つまり、生成 AI ビジネスはまだ初期段階にあり、状況はまだ不確実です。あなたも私もダークホースです!

以上がChatGPT と Google Bard: どちらが優れていますか?検査結果が教えてくれる！の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

Dreamweaver Mac版

ビジュアル Web 開発ツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。