搜尋
首頁科技週邊人工智慧Google PaLM 2訓練所用文字資料量是初代的近5倍

谷歌 PaLM 2训练所用文本数据量是初代的近5倍

5月17日訊息,Google上週在2023年I/O開發者大會上推出最新大型語言模式PaLM 2。公司內部文件顯示,2022年起訓練新模型所使用的文字資料量幾乎是前一代的5倍。

據悉,Google最新發布的PaLM 2能夠執行更高階的程式設計、運算和創意寫作任務。內部文件透露,用於訓練PaLM 2的token數量有3.6兆個。

所謂的token就是字串,人們會將訓練模型所用文字中的句子、段落進行切分,其中的每個字串通常被稱為token。這是訓練大型語言模型的重要組成部分,能教導模型預測序列中接下來會出現哪個單字。

Google於2022年發布的上一代大型語言模型PaLM在訓練中使用了7800億個token。

儘管Google一直熱衷於展示其在人工智慧技術領域的實力,說明如何將人工智慧嵌入到搜尋引擎、電子郵件、文字處理和電子表格中,但一直不願公佈訓練資料的規模或其他細節。微軟支援的OpenAI也對最新發表的GPT-4大型語言模型細節保密。

兩家公司都表示,不透露這些資訊的原因是人工智慧產業存在激烈競爭。 Google和OpenAI都想要吸引那些希望使用聊天機器人而不是傳統搜尋引擎搜尋資訊的用戶。

但隨著人工智慧領域競爭的白熱化,研究界要求提高透明度。

自從推出PaLM 2以來,Google一直表示,新模型比之前的大型語言模型更小,這意味著該公司技術在完成更複雜任務時能變得更有效率。參數(parameters)通常用於說明語言模型的複雜性。根據內部文件,PaLM 2接受了3,400億個參數的訓練,初代的PaLM接受了5,400億個參數的訓練。

Google沒有立即發表評論。

Google在一篇關於PaLM 2的部落格文章中表示,新模型使用了一種名為“計算最優縮放”(compute-optimal scaling)的“新技術”,能使得PaLM 2“更有效率,整體效能更好,例如推理更快、服務參數更少,服務成本也更低。」

在發布PaLM 2時,Google透露新模型接受了100種語言的訓練,並能勝任各種各樣的任務。包括Google試驗性聊天機器人Bard在內的25項功能和產品用的都是PaLM 2。 PaLM 2依參數規模有四個不同的版本,從小到大依序是Gecko(壁虎)、Otter(水獺)、Bison(野牛)和Unicorn(獨角獸)。

根據Google公開披露的信息,PaLM 2比任何現有模型都更強大。 Facebook在今年2月宣布推出名為LLaMA的大型語言模型,在訓練中使用了1.4兆個token。 OpenAI在發布GPT-3時披露了相關訓練規模,當時公司表示,這個模型接受了3000億個token的訓練。今年3月份,OpenAI發布新模型GPT-4,並表示在許多專業測試中表現出「人類水平」。

根據最新文件,Google兩年前推出的語言模型接受了1.5兆個token的訓練。

隨著新的生成式人工智慧應用迅速成為科技業主流,圍繞底層技術的爭議也越來越激烈。

今年2月份,Google研究部門高級科學家埃爾·馬赫迪·埃爾·馬哈迪(El Mahdi El Mhamdi)因公司缺乏透明度而辭職。週二,OpenAI執行長薩姆·奧爾特曼(Sam Altman)在美國參議院司法小組委員會關於隱私和技術的聽證會上出庭作證,也同意用新系統來應對人工智慧。

「對於一項非常新的技術,我們需要一個新的框架,」奧爾特曼說,「當然,像我們這種公司對自己推出的工具負有很大責任。」

以上是Google PaLM 2訓練所用文字資料量是初代的近5倍的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器