3.6兆のトークンと3,400億のパラメータを備えたGoogleの大規模モデルPaLM 2の詳細が明らかになった-AI-php.cn

ホームページ

テクノロジー周辺機器

3.6兆のトークンと3,400億のパラメータを備えたGoogleの大規模モデルPaLM 2の詳細が明らかになった

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 21, 2023 am 08:07 AM

グーグルモデル

先週の木曜日、2023 Google I/O カンファレンスで、Google CEO のピチャイは、GPT-4 のベンチマークとなる大規模モデルである PaLM 2 の立ち上げを発表し、数学、コード、機能を改善したプレビューバージョンを正式にリリースしました。、多言語翻訳および自然言語生成機能。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

PaLM 2 モデルは、小型から大型まで、異なるサイズの 4 つのバージョンを提供します。Gecko の場合、 Otter、Bison、Unicorn は、さまざまなユースケースに簡単に導入できます。その中でも、軽量の Gecko モデルはモバイルデバイス上で非常に高速に実行でき、優れたインタラクティブアプリケーションをインターネットに接続せずにデバイス上で実行できます。

ただし、会議では Google は PaLM 2 に関する具体的な技術的な詳細については明らかにせず、PaLM 2 は Google の最新の JAX および TPU v4 に基づいて構築されているとだけ述べました。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

昨日、海外メディア CNBC が確認した内部文書によると、PaLM 2 はトレーニングでした 3.6 兆トークン。比較のために、前世代のPaLMは7,800億トークンでトレーニングされました。

さらに、Google は以前、PaLM 2 は以前の LLM よりも小さいと述べました。つまり、より複雑なタスクを実行しながら効率を高めることができるということです。これは内部文書でも検証されており、PaLM 2 の学習パラメータ数は 3,400 億であり、PaLM の 5,400 億よりもはるかに少ないです。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

PaLM 2 のトレーニングトークンとパラメーターは他の LLM とどのように比較されますか?比較のために、Meta が 2 月にリリースした LLaMA は、1 兆 4,000 億のトークンでトレーニングされました。 OpenAI の 1,750 億パラメータ GPT-3 は、3,000 億トークンでトレーニングされました。

Google は、自社の AI テクノロジーの威力と、AI テクノロジーを検索、電子メール、文書処理、スプレッドシートにどのように組み込むことができるかを熱心に実証してきましたが、規模の開示にも消極的でした。トレーニングデータのサイズまたはトレーニングデータのサイズ、その他の詳細。実際、これを行っているのは Google だけではなく、OpenAI も最新のマルチモーダル大型モデル GPT-4 の詳細については沈黙しています。詳細非開示は事業の競争上の性質に起因すると全員が述べた。

しかし、AI 軍拡競争が激化するにつれ、研究コミュニティは透明性の向上をますます求めています。そして、少し前に漏洩した Google の内部文書の中で、Google の内部研究者は次のような見解を表明しました: 表面的には、OpenAI と Google は大規模な AI モデルでお互いを追いかけているように見えますが、本当の勝者は必ずしもこの 2 つから生まれるわけではないかもしれません。なぜなら、サードパーティの力である「オープンソース」が静かに台頭しているからです。

現時点では、この内部文書の信頼性は検証されておらず、Google は関連する内容についてコメントしていません。

ネチズンのコメント

PaLM 2 の公式発表の初めに、一部のネチズンはチンチラの法則に基づいてパラメータの数を予測しました。 PaLM 2 モデルファミリは 80B. / 90B / 100B になりますが、これは今回報告された 340B とは依然として大きく異なります。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

PaLM 2 のトレーニングコストについて、多くの人々が予測を立てています。大規模モデルの開発によると、過去に、このネットユーザーは、PaLM 2 の構築には 1 億米ドルかかると述べました。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

#PaLM 2 パラメータが漏洩しました。Bard を推測してみてください、このネチズンはこう言いました:

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

PaLM 2 トークンの数が漏洩したことで、ネチズンは、AGI の登場前の大きな転換点に至るまでにどれくらいのトークンが必要になるのか疑問に思わずにはいられません。

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

以上が3.6兆のトークンと3,400億のパラメータを備えたGoogleの大規模モデルPaLM 2の詳細が明らかになったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します