ホームページ > 記事 > テクノロジー周辺機器 > ChatGPT は実際のテストで Bard を全面的に粉砕しました。 Google崩壊、10年間の努力が無駄に
OpenAI の ChatGPT が普及してから、生成 AI は本当に有名になりました。
同時に、Google もそれほど遅れをとっておらず、Bard と呼ばれる AI アシスタントを提供しています。
しかし、この吟遊詩人については何と言えばいいでしょうか? あまり使いやすいものではありません。
外国人の兄弟マイケル キングは、ChatGPT と GPT-3.5 および GPT-4 を搭載した Google の Bard を使用し、詳細な評価を実施しました。
#結果は衝撃的です。
キング氏は、2 つの AI の長所、短所、奇妙な点をまとめました。
ご存知のとおり、Google は Bard に多額の投資を行っており、10 年間にわたって開発されてきました。しかし、最終的な結果は、10 年間の投資に比べて少し価値が低いように思えます。
最初に数学について話しましょう最初は論理と数学です。
弟は 2 人の AI に同じ質問をしました。
シャオ ミンが 6 歳のとき、妹は彼の年齢の半分でした。 、彼の母親は妹の10倍の年齢です。シャオミンは今年60歳ですが、彼の母親は何歳ですか?
読者は頭を使って、すぐに理解できるかどうかを確認してください。
AI が生成した結果から判断すると、Bard は間違っています。
分析プロセス全体で信じられないほどのエラーが発生しました。バードはシャオ・ミンとシャオ・ミンの年齢差さえ計算しませんでした。彼の母親。 、ちょうど 30 から 60 を追加しました。
GPT-3.5 であっても GPT-4 であっても、計算された答えは正しいです。母親の 30 歳からシャオミンさんの 6 歳を引きます。まず年齢差を計算し、24 歳と 60 歳を足します。すると、彼女の母親は今年 84 歳であることがわかります。
#GPT-3.5:
##GPT-4:
#第一レベルの吟遊詩人に合格できませんでした。現在のスコアは 1:0 で、ChatGPT が暫定的にリードしています。
ラップソング作成 PK2 番目のレベルは、文学分野の課題です。
私は両方の AI に、エミネムの歌い方を使って、タイタニック号、相対性理論、カーダシアン一家についてのラップソングを書いてもらうように頼みました。
まずは Bard の作品を見てみましょう:
# #上下にスクロールしてすべてを表示します
歌詞の意味をいちいち読む必要もなく、一度読んだらリズムがないことがわかります。またはまったく韻を踏んでいます。
各文は非常に長く、ラップソングではなく、霧のかかったエッセイのようです。#GPT-3.5 の傑作をもう一度見てみましょう:
# #もう一度読んでみると、一文一文の長さもちょうどよく、韻も踏んでいるのがわかります。 3つのテーマを組み合わせた合唱もあり、まさにプロと言えるでしょう。 Mu Ye の歌をよく知っている友人は、Mu Ye のリズム感とスタイルをはっきりと認識できます。
弟は、GPT-3.5 の出来は悪くなく、GPT-4 の方が良くできると思っていると言いました。
編集者は英語のラップについてはあまり詳しくありませんが、おそらくレビューを担当した人はラップ愛好家だと思います。彼は GPT-4 の作品は非常に爆発的であり、ChatGPT は AI 業界における当然のラップの王であると信じています。
実のところ、私の友達はラップについてあまり知る必要はありません。これら 3 つの段落をまとめると、私のような音楽に疎い人でも、比較を念頭に置く必要があります。
現在のスコアは 2:0 です。
次に、弟は 2 人の AI に、NASA、寿司、トランプについてのジョークを言うように頼みました。
吟遊詩人:
「NASA は火星に巻き寿司を送る計画を立てています。彼らは火星に寿司がまだ新鮮かどうかを確認したいと考えています。」火星に到着した巻き寿司は、適温に保てるように専用の容器に入れられ、同時にNASAは寿司を食べられるタイミングがわかるようにタイマーも設置しました。
#この巻き寿司はついに火星に着陸しましたが、まだ新鮮でした。NASA の科学者たちは驚きました。彼らは次のステップとしてトランプ ステーキを火星に送ることにしました。
トランプ ステーキも同じ容器に入れられ、容器にはタイマーもありました
しかし、火星に到着した後、トランプ ステーキはもはや新しいものではなくなりました。 NASAの科学者らは非常に残念がっており、トランプ大統領本人に何が起こったのか説明する手紙を送る予定だという。しかし、それは古くなっていました。その理由はあなたのパフォーマンスのせいかもしれないと思います。あなたはいつも自分の素晴らしさを自慢し、常に他の人を侮辱しています。ステーキが傷んだのはあなたのせいだと思います。ご迷惑をおかけして申し訳ありません。
私たちが理解できなかったアメリカのユーモアがあるかどうかはわかりませんが、それを見た後、私は本当に笑いたくありませんでした。しかし、査読者も「本当に理解できなかった」とも言っていました。すると編集者はホッとするが、確かに文章は下手だ。
GPT-3.5:
「NASAはトランプのために特別な巻き寿司を作るために寿司職人を宇宙に送り込んだ。シェフがトランプに尋ねたとき」もし気に入ったら、トランプは言った、「大丈夫だけど、もう少しスペースを追加してもらえますか?」空間。原文は次のとおりです。
査読者は大丈夫だと言いましたが、それでも大丈夫です。
GPT-4:
「なぜ NASA はトランプ氏と寿司職人を宇宙計画に招待するのでしょうか? NASA の誰かが必要だからです」変更に対処し、タスクを見逃さないようにするためです!」
#いつものように、元のバージョンはここに置かれます:
#弟は平均的だと言っていたが、オチは悪くない。
このゲームでの ChatGPT のパフォーマンスも少し異常だったので、0.5 ポイントを与えます。
プログラムのデバッグ?このラウンドはより専門的なものです - プログラムをデバッグします。
弟は Python プログラムを入力して 2 つの AI を個別にデバッグしました。
吟遊詩人:
このデバッグは良くない、バードは学校に戻って再受験すべきだ、と弟は冗談めかして言いました。
GPT-3.5:
GPT-3.5 では、次のように述べています。 Enter セットが空の場合、ZeroDivisionError が発生します。このエラーを回避するには、前にチェック ステップを追加できます。入力セットが空の場合は、エラーを表示せずに 0 が直接出力されます。
弟は、デバッグは完璧だと言いました。
GPT-4:
GPT-4 は、次のことを指摘しています。 GPT - -3.5 で指摘された同じエラーと、同じ解決策が提供されました。このラウンドでも ChatGPT が勝利しました。
吟遊詩人?程遠い!
評価結果から判断すると、ChatGPT と比較すると、Google Bard のパフォーマンスは非常に残念です。これは、GPT-4 はおろか、GPT-3.5 の機能にもはるかに劣ります。Google の将来は明らかに Bard の成功にかかっていますが、Bard の開発が競合他社である OpenAI に追いついていないのは明らかです。
一方、OpenAI の株式を大量に取得するという Microsoft の動きは非常に賢明です。これにより、今後 10 年間の AI 開発におけるリーダー的地位が確保されます。
しかし、Google が GPT に対抗できるように Bard のパフォーマンスを向上させるために努力しなければ、Google が淘汰される可能性があります。
以上がChatGPT は実際のテストで Bard を全面的に粉砕しました。 Google崩壊、10年間の努力が無駄にの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。