ホームページ >ハードウェアチュートリアル >ハードウェアのレビュー >大手模型メーカーも力を入れており、Googleも「ボリューム」を公開:Geminiチャットロボットが新型に切り替わり、出力内容もワンクリックで確認できるようになった。
Meta や OpenAI などの大手モデル メーカーが集中的に取り組んでいる中、Google もメジャー アップデートを発表しました -
今後、Gemini チャット ロボットは Gemini 1.5 Flash によって駆動されます。
以前のバージョンと比較して、ウィンドウの長さが4倍に増加し、応答速度も速くなりました。
Googleの紹介によると、チャットボットの新バージョンの背後にある1.5 Flashモデルは軽量化と速度の向上に重点を置いています。
もちろん、モデル応答の品質も向上し、コンテキスト ウィンドウが元の (1.0 Pro ベース) 8k から 32k に増加しました。
さらに、新バージョンのチャットボットでは、生成されたコンテンツが真実かどうかをワンクリックで検出できる「ファクトチェック」機能も追加され、モデルの錯覚による悪影響を軽減します。
一部のネチズンは、まず今日の Google のパフォーマンスが非常に好調だったと嘆き、その後 Gemini もアップデートをリリースしました。
願いモードをオンにして、Google Scholar 学術検索に AI 機能が追加されることを楽しみにしている人もいます。
コンテキストウィンドウの延長と高速化
今回のアップデートの主な内容は、無料版のモデルを1.0Proから1.5 Flashに変更することです。
Gemini 1.5 Flash は、5 月の Google I/O 開発者カンファレンスで初めて発表されました。
トレーニング データの「蒸留」を通じて、Gemini 1.5 フラッシュは、より軽量なサイズでより高い生成品質を実現します。
また、サイズが小さいため、モデルがより高速かつ効率的になり、マルチモーダル推論もサポートされます。
Googleは、今回のモデルチェンジ後、チャットボットが高速化し、旧バージョン8kのコンテキストウィンドウが32kに拡張されると紹介しました。
ただし、1.5 Flash 自体は 100 万個のコンテキストをサポートしていますが、この減少は確かに小さくありませんが、結局のところ無料バージョンです。
モデルのアップグレードに加えて、もう 1 つの重要なアップデートはファクトチェック機能です。
最新のGeminiチャットボットでは、この機能を利用してワンクリックで出力内容を確認することができます。
システムは出力内のコンテンツを Google で検索して比較し、一致するものと不一致があるものをマークします。
一部のネチズンは、OpenAI が GPT-4o mini をリリースするのを見て、Google が新しいバージョンをリリースするのは時間の問題だと感じたとコメントしました。
確かに最近はOpenAIやGoogleだけでなく、MetaやMistralなど大型モデルを作っているメーカーも頻繁に動き出しています。
このモデルのパフォーマンスについては、このネチズンも 1.0 Pro と 1.5 Flash を試したと述べています。2 つのパフォーマンスはほぼ同じで、1.5 Flash の方が高速です。
つまり、Google によるこの一連のオペレーションは、最近の「モデルの軽量化」の傾向にもある程度適応しています。
では、1.5 Flash を置き換えた後の Gemini チャットボットのパフォーマンスはどうですか?
ワンクリックでモデル出力を確認
Qubit は、チャットボットの新しいバージョンで簡単なテストを実行しました。
まず、今回のアップデートのファクトチェック機能を見てみましょう。最初のステップは、通常の会話と同じように質問をすることです。Gemini はそれに普通に答えます。
回答の下にGoogleのロゴがあるのがわかります。これはファクトチェック機能のボタンです。
クリックすると、システムは自動的に Google で検索し、独自の出力と比較します。
比較が完了すると、ソースが検索され、一致するコンテンツが緑色で強調表示され、検索結果と一致しない場合は、背景が薄赤色でマークされます。
マークされた場所をクリックすると、Gemini が比較に使用するコンテンツ リンクが表示されます。
このような注釈は、出力内容が間違っていることを意味するものではないことに注意してください。たとえば、ここで引用した比較データでは、トム・クルーズの母親はメアリー・リー・サウスです。
テキストの不一致のため、回答のこの部分はシステムによってマークされましたが、実際にはどちらも正しい回答です。
このファクトチェックはインターネット検索に依存しているため、比較情報の品質にもばらつきがあり、100% 正確ではない可能性があります。
たとえば、「林大宇がしだれ柳を根こそぎにする」という古典的なジョークに関しては、双子座は明らかに正解を出しましたが、赤マークが付けられました。
引用した比較情報を改めて見てみると、確かにストレッチは少し難しいですね。
つまり、この機能の機能は主に、より便利な認証方法を提供することですが、それをどのように受け入れるかは、複数の当事者による認証とユーザー自身の判断に依存します。
さらに、モデル自体に関しては、大きなモデルが壁にぶつかることが多い、最近よく見られるいくつかの問題もテストしました。
たとえば、ジェミニは 2 つの数字をお金に変換しましたが、1 回の操作後の最終結果は…間違っていました。
この質問が発見されて以来、これが 2 番目に面白い答えであれば、1 位を主張するモデルは誰もいません。
私も最初は間違った答えをしてしまいましたが、後ほど分析の過程で修正しました。
しかし、英語で質問すれば、正しく答えられる可能性はまだあります。
別の質問ですが、この答えは実際に中国語の文字を数えることができます...これは人々を混乱させます、そしてそれはまったく予測の範囲内ではありません。
最後に、このアップデートで言及された速度の向上については、テストの結果、Gemini 1.5 Flash は Claude 3 Haiku よりも最初の単語を出力する時間が短いことが判明しました。その後の速度の違いは、肉眼ではあまり明らかではありません。
上記はチャットボットにおける Gemini 1.5 Flash のパフォーマンスです。興味のある読者はご自身で試してみてください。
参考リンク:
[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[ 2 ] https://x.com/GeminiApp/status /1816512086232731696
以上が大手模型メーカーも力を入れており、Googleも「ボリューム」を公開:Geminiチャットロボットが新型に切り替わり、出力内容もワンクリックで確認できるようになった。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。