ホームページ > 記事 > テクノロジー周辺機器 > Googleが本格的な反撃開始! AIが検索を再構築すると正式発表、新モデルはGPT-4に匹敵、MicrosoftはChatGPTをターゲットに
Google の反撃に多くの注目が集まっています。
今、Google検索についにAI会話機能が追加され、キューイングチャネルがオープンしました。
もちろん、これは最初のステップにすぎません。
大きなものはこれからです:
新しい大規模言語モデル PaLM 2 が正式に発表され、Google はいくつかのタスクで GPT-4 を上回ると主張しています。
Bard の機能が大幅に更新され、列に並ぶ必要がなく、新しい言語がサポートされています。
AI オフィス アシスタントの Google バージョンもリリースされており、Gmail に初めて登場します。
Google Cloud は、業界にさらなる生成 AI サービスを提供するために、複数の基本的な大規模モデルも立ち上げています...
最新の I/O 開発者カンファレンスでの Google の重大発表は本当に衝撃的です。
一部のネチズンは直接こう言いました:
AI戦争は本格化しています。
次のように言う人もいます。
今では、ChatGPT にお金を払ったことを後悔しています。
記者会見の後、Google の株価は 4% 以上上昇しました。
PaLM 2 が今年の I/O カンファレンスの最優先事項であることは疑いの余地がありません。 by Picha Yi が個人的に紹介しました。
現在の Bard と 25 を超える Google AI 製品および機能は、基盤となるテクノロジーとして PaLM 2 によってサポートされるようになりました。
Google の最も先進的な大規模モデルである PaLM 2 は、Pathways アーキテクチャに基づいており、JAX を介して TPU v4 上に構築された PaLM のアップグレード バージョンです。
レポートによると、PaLM 2 は 100 以上の言語でトレーニングを受けているため、言語の理解、生成、翻訳が強化され、常識的な推論と数理論理学の分析においても優れているとのことです。
PaLM 2 のデータセットには、多くの数式をカバーする多数の論文やウェブページが含まれていると Google は述べています。このデータでトレーニングされた後、PaLM 2 は数学的な問題を簡単に解決し、グラフを作成することもできます。
プログラミングの面では、PaLM 2 は、Python、JavaScript、その他の一般的な言語に加え、Prolog、Fortran、Verilog など、20 のプログラミング言語をサポートするようになりました。
#今回、Google は 4 つの異なるサイズで PaLM 2 を発売しました。
彼らは、スケールを表すためにさまざまな動物を使用しています。最小のものは「ヤモリ」、最大のものは「ユニコーン」です。
「Gecko」バージョンは非常に軽量で、オフラインを含むモバイル デバイス上で高速に実行でき、1 秒あたり 20 トークンを処理できます。
DeepMind の副社長は、I/O カンファレンス前の記者会見で次のように述べました:
モデルにおいては、大きいほど必ずしも優れているわけではないことがわかりました。これが、さまざまなサイズのモデルを提供することにした理由でもあります。
これは、より多くの製品やアプリケーションをサポートできるように、PaLM 2 を微調整することが容易になることを意味します。
I/O カンファレンスで、Google は現在 25 以上の製品とアプリケーションが PaLM 2 の機能を使用していると発表しました。
具体的な表現形式がDuet AIです。
さまざまなオフィス ソフトウェアに組み込むことができる AI アシスタントである Microsoft 365 Copilot のベンチマーク製品として理解できます。
Google は記者会見で、Gmail、Google ドキュメント、Google スプレッドシートにおける Duet AI の機能をデモンストレーションしました。
プロンプトに従ってメール内容を補足する、PPT を作成する、プロンプトに従って画像素材を生成する、ワンクリックで表を作成するなど。
同様に、この AI アシスタントはプログラミング支援も提供できます。 Google Cloud に基づいて、コード ブロックをリアルタイムで推奨および修正し、会話形式でプログラミングの質問に答えることができ、現在 Go、JavaScript、Python、SQL をサポートしています。
さらに、Google は PaLM 2 に基づいて、プロフェッショナル分野向けのいくつかの大型モデルも発売しました。
Google の医療チームは Med-PaLM 2 を構築しました。これは、米国の医師免許試験で専門家レベルに到達した最初の大規模言語モデルと言われており、さまざまな医療上の質問に答えることができます。
Google は現在、X 線を自律的に検査して診断を行うなど、マルチモーダル機能の強化に取り組んでいます。このモデルは、今夏後半に一部の Google Cloud ユーザーに提供される予定です。
もう 1 つのプロフェッショナル向け大型モデルは、Sec-PaLM 2 です。
これはネットワーク セキュリティ維持のための大規模なモデルであり、潜在的な悪意のあるスクリプトを分析および解釈し、スクリプトの危険性を検出できます。
PaLM 2 の優れた機能を実証した後は、PaLM 2 を開いて使用する方法について説明します。
Google は、PaLM 2 が PaLM API インターフェース、Firebase、Colab を通じて利用可能になったと発表しました。
ChatGPT に対してベンチマークされている Bard は、ついに試用キューをキャンセルし、180 の国と地域で完全にオープンしました世界中で。
プログラマーから絶賛された新しいダークモード: (手動犬頭)
Bard は、日本語と韓国語での直接会話機能を追加しました。英語以外にもアクセス範囲を拡大します。 Googleは、間もなく中国語を含む40の言語バージョンを追加すると発表した。
今日から、Bard は PaLM 2 に完全に接続されることになり、コード生成、デバッグ、解釈を含むそのプログラミングおよび推論機能も大幅に改善されました。プロフェッショナル(プログラマーに認められる種類)。
他のコードを参照するチェスの「学者の仲間」の動きを Python を使用して記述するように要求すると、便宜のために関連リンクが表示されます。
コード内の理解できない関数についてさらに質問したり、改善できるかどうか尋ねたり、すべてをマージするように依頼したりすることができます。コードブロック。
#しかし、最も驚くべきことは、開発者の要望に応えてワンクリックインポート機能が追加されたことです。
Bard によって生成されたコードを Colab に直接エクスポートできるようになりました。
コードに加えて、メールの下書き、フォームなど、Bard で生成したコンテンツも、Gmail、ドキュメント、スプレッドシートに直接ドラッグできます。
ちなみに、Bard は回答で写真もサポートするようになりました。旅行ガイドについて尋ねる最も便利な方法は次のとおりです。
写真で答えるだけでなく、2 匹の犬の写真をアップロードするなど、写真を直接送信することもでき、ガイドを編集するのに役立ちます。興味深い話:
#この機能は、Google レンズ (機械が「写真を見て話す」ことを学習できる AI アプリケーション) を利用しています。
Google レンズに加えて、ドキュメント、ドライブ、Gmail、マップなどの Google 独自のアプリケーション機能の多くも Bard に統合されています。
たとえば、Bard の回答では、Google マップを直接使用して、いくつかの大学の地理的位置を確認できます。
Google を使用するさまざまな製品があります。 Bardへの入り口は1つだけで十分な気がします。
独自のアプリケーションに加えて、Bard は今回 Adobe Firefly も動かしました。著作権で保護されたさまざまなクリエイティブな画像を対話を通じて「すぐに」利用できます:
多くの喧騒を経て、Google 検索はついに AI 対話機能を開放しました。
「3歳以下の子供と犬を連れた家族の場合、ブライスキャニオンとアーチーズ国立公園のどちらに行くのが良いでしょうか?」
この質問については、脇に置いておきましょう。以前は、最終的に答えを見つけるまでに、小さな質問に分割し、検索エンジンにアクセスして多くの情報を整理する必要があったかもしれません。
Google では、ワンステップで正しく解決できるようになりました。
図に示すように、Google 検索は、見つかった回答を単に移動するのではなく、子供と犬の 2 つの要素を考慮して、整理された回答を提供します。たとえば、次のようになります:
ブライス キャニオンには犬が入れるループが 2 つあり、ベビーカーにも非常に優しいです。アーチーズ国立公園では、道路のほとんどのセクションでペットの通行が禁止されており、どちらの場所でもペットにはリードを付ける必要があります。
各文には、表示するための特定の基本リンクがあります:
さらに、投稿されたガイド リンクも表示されます。さまざまなウェブサイトからのネチズン。
最も重要なことは、[フォローアップを求める] ボタンをクリックすると、その回答についてさらに会話的な質問をできることです。
新しい Google 検索を使用したショッピングも、合理的な購入決定を迅速に下すのに役立つと主張されているため、非常に楽しいものです。
たとえば、「5 マイルの山の通勤に適した自転車」が必要な場合、まず、選択する前に考慮すべき重要な要素が次のように表示されます。電動自転車、ロードバイク、クロスバイクが通勤に適した設計
2つ目はモーターとバッテリー、3つ目は衝撃吸収のためのサスペンションです。亀裂や凹凸。
その後、お客様に最適な車をお勧めします。お勧めする際には、具体的な製品の説明、最新のレビュー、価格、写真などの包括的な情報も提供します。
さらに質問することもできます。たとえば、赤い電動自転車だけが欲しい場合は、回答がさらに最適化されます。
この機能は、Google のショッピング比較製品であるショッピング グラフを利用して、継続的にデータを収集します。世界中の製品リストを更新しました。
Google が、更新された AI 検索インターフェースでも引き続き広告を埋め込むと率直に述べたことは言及しておく価値がありますが、心配する必要はありません。広告は専用の広告スロットにのみ表示され、検索結果に混入されることはありません。
最後に、この新機能は Google Search Labs での試用にのみ適用でき、米国内のユーザーに限定されています。
Google Cloud で 3 つの基本モデルが登場
Google は、多数の AI 機能を更新した後、クラウド機械学習プラットフォーム Vertex AI に 3 つの新しい大規模モデルをリリースしました。
Codey: プログラマーのコード作成を支援するテキストからコードへの変換
Imagen: テキストから画像へ、高品質の画像を生成します。
Chirp: 音声からテキストへ、コミュニケーションを促進します。
#本日の記者会見では、コード生成やGoogle Photoのスマート編集など、これら3モデルの機能が実際にデモされました。
Vertex AI では、現在、埋め込みテキストおよび画像 API を使用することも可能です。このツールを使用すると、テキスト データと画像データを多次元数値ベクトルに変換し、意味関係をマッピングすることで、開発者はより興味深いアプリケーションを作成できます。
Google は、マネージド サービスのエンドツーエンドの機械学習プラットフォームに RLHF 機能を初めて組み込んだと主張しています。利点は、企業が RLHF を使用して報酬モデルを迅速にトレーニングし、基本モデルを微調整できることです。これは、業界アプリケーションにおける大規模モデルの精度を向上させるために重要です。
モデルに加えて、Google Cloud はトレーニング用の次世代 A3 GPU スーパーコンピューターも発売しました。 A3 仮想マシンと Nvidia H100 を組み合わせることで、Google Cloud はより優れたコンピューティング スループットと帯域幅を提供し、企業が機械学習モデルをより迅速に開発できるようになります。
これらに加えて、Google は、1,799 米ドル (約 12,000 人民元) で販売される初の折りたたみ式携帯電話や、AI 機能が統合された Android 14 システム (たとえば、情報返信提案など)、ここでは一つ一つ紹介しません。
全体として、今回は 15 回目の I/O カンファレンスとして、Google は本当に多くの有益な情報を皆さんにお届けしました。
注目すべき点は、今回ステージに登場したゲスト スピーカーはジェフ ディーンではなく、数日前に階級が変わったばかりであることです。
過去の Google AI の最も代表的な経営者として、彼は AI 2.0 の波の中でどのような立場になるのでしょうか?
Googleが大型モデルやAI検索の分野でまだ追いつけるかどうかも楽しみだ。
今回の Google の反撃に満足していますか?
以上がGoogleが本格的な反撃開始! AIが検索を再構築すると正式発表、新モデルはGPT-4に匹敵、MicrosoftはChatGPTをターゲットにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。