搜尋
首頁科技週邊人工智慧Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

Google力推的JAX在最近的基準測試中效能已經超過Pytorch和TensorFlow,7項指標排名第一。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

而且測試並不是JAX效能表現最好的TPU上完成的。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

但未來,也許有更多的大模型會基於JAX平台進行訓練和運行。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

模型

最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras 2進行了基準測試。

首先,他們為生成式和非生成式人工智慧任務選擇了一組主流的電腦視覺和自然語言處理模型:

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

對於模型的Keras版本,其採用了KerasCV和KerasNLP中已有的實作進行建構。而對於原生的PyTorch版本,則選擇了網路上最受歡迎的幾個選項:

- 來自HuggingFace Transformers的BERT、Gemma、Mistral

#- 來自HuggingFace Diffusers的StableDiffusion

- 來自Meta的SegmentAnything

#他們將這組模型稱為「Native PyTorch」,以便與使用PyTorch後端的Keras 3版本進行區分。

他們對所有基準測試都使用了合成數據,並在所有LLM訓練和推理中使用了bfloat16精度,同時在所有LLM訓練中使用了LoRA(微調)。

根據PyTorch團隊的建議,他們在原生PyTorch實作中使用了torch.compile(model, mode="reduce-overhead")(由於不相容,Gemma和Mistral訓練除外)。

為了衡量開箱即用的效能,他們使用高階API(例如HuggingFace的Trainer()、標準PyTorch訓練循環和Keras model.fit()),並盡可能減少配置。

硬體配置

所有基準測試都使用Google Cloud Compute Engine進行,配置為:一塊擁有40GB記憶體的NVIDIA A100 GPU、12個虛擬CPU和85GB的主機記憶體。

基準測試結果

表2顯示了基準測試結果(以步/毫秒為單位)。每個步驟都涉及對單一資料批次進行訓練或預測。

結果是100步的平均值,但排除了第一步,因為第一步包括了模型創建和編譯,這會額外花費時間。

為了確保比較的公平性,對於相同的模型和任務(不論是訓練還是推理)都使用相同的批次大小。

然而,對於不同的模型和任務,由於它們的規模和架構有所不同,可根據需要調整資料批大小,從而避免因過大而導致記憶體溢出,或是批過小而導致GPU使用不足。

過小的批次大小也會使PyTorch看起來較慢,因為會增加Python的開銷。

對於大型語言模型(Gemma和Mistral),測試時也使用了相同的批次大小,因為它們是相同類型的模型,具有類似數量的參數(7B)。

考慮到使用者對單批文字產生的需求,也對批次大小為1的文字產生情況進行了基準測試。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

關鍵發現

發現1

#不存在「最優」後端。

Keras的三種後端各展所長,重要的是,就效能而言,並沒有哪一個後端能夠始終勝出。

選擇哪個後端最快,往往取決於模型的架構。

這一點突顯了選擇不同框架以追求最佳效能的重要性。 Keras 3可以協助輕鬆切換後端,以便為模型找到最合適的選擇。

發現2

#Keras 3的效能普遍超過PyTorch的標準實作。

相對於原生PyTorch,Keras 3在吞吐量(步/毫秒)上有明顯的提升。

特別是,在10個測試任務中,有5個的速度提升超過了50%。其中,最高更是達到了290%。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

如果是100%,表示Keras 3的速度是PyTorch的2倍;如果是0%,則表示兩者效能相當

發現3

Keras 3提供一流的「開箱即用」效能。

也就是,所有參與測試的Keras模型都未進行過任何最佳化。相較之下,使用原生PyTorch實作時,通常需要使用者自行進行更多效能最佳化。

除了上面分享的數據,測試中還注意到在HuggingFace Diffusers的StableDiffusion推理功能上,從版本0.25.0升級到0.3.0時,性能提升超過了100% 。

同樣,在HuggingFace Transformers中,Gemma從4.38.1版本升級至4.38.2版本也顯著提高了效能。

這些效能的提升凸顯了HuggingFace在效能優化上的專注與努力。

對於一些手動最佳化較少的模型,如SegmentAnything,則使用了研究作者提供的實作。在這種情況下,與Keras相比,效能差距比大多數其他型號更大。

這表明,Keras能夠提供卓越的開箱即用效能,使用者無需深入了解所有最佳化技巧即可享受到快速的模型運行速度。

發現4

#Keras 3的表現總是優於Keras 2。

例如,SegmentAnything的推理速度提升了驚人的380%,StableDiffusion的訓練處理速度提升了150%以上,BERT的訓練處理速度也提升了100%以上。

這主要是因為Keras 2在某些情況下直接使用了更多的TensorFlow融合操作,而這可能對於XLA的編譯並不是最佳選擇。

值得注意的是,即使只升級到Keras 3並繼續使用TensorFlow後端,也能顯著提升效能。

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇

結論

框架的表現在很大程度上取決於具體使用的模型。

Keras 3能夠幫助為任務選擇最快的框架,這種選擇幾乎總是超越Keras 2和PyTorch實作。

更為重要的是,Keras 3模型無需進行複雜的底層最佳化,即可提供卓越的開箱即用效能。

以上是Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
易於理解的解釋如何在Chatgpt中建立兩步身份驗證!易於理解的解釋如何在Chatgpt中建立兩步身份驗證!May 12, 2025 pm 05:37 PM

CHATGPT SECURICE增強:兩階段身份驗證(2FA)配置指南 需要兩因素身份驗證(2FA)作為在線平台的安全措施。本文將以易於理解的方式解釋2FA設置過程及其在CHATGPT中的重要性。這是為那些想要安全使用chatgpt的人提供的指南。 單擊此處獲取OpenAI最新的AI代理OpenAi Deep Research⬇️ [chatgpt]什麼是Openai深入研究?關於如何使用它和費用結構的詳盡解釋! 目錄 chatg

[針對企業] Chatgpt培訓|對8種免費培訓選項,補貼和示例進行了詳盡的介紹![針對企業] Chatgpt培訓|對8種免費培訓選項,補貼和示例進行了詳盡的介紹!May 12, 2025 pm 05:35 PM

生成的AI的使用吸引了人們的關注,這是提高業務效率和創造新業務的關鍵。特別是,由於其多功能性和準確性,許多公司都採用了Openai的Chatgpt。但是,可以有效利用chatgpt的人員短缺是實施它的主要挑戰。 在本文中,我們將解釋“ ChatGpt培訓”的必要性和有效性,以確保在公司中成功使用Chatgpt。我們將介紹廣泛的主題,從ChatGpt的基礎到業務使用,特定的培訓計劃以及如何選擇它們。 CHATGPT培訓提高員工技能

關於如何使用Chatgpt簡化您的Twitter操作的詳盡解釋!關於如何使用Chatgpt簡化您的Twitter操作的詳盡解釋!May 12, 2025 pm 05:34 PM

社交媒體運營的提高效率和質量至關重要。特別是在實時重要的平台上,例如Twitter,需要連續交付及時和引人入勝的內容。 在本文中,我們將解釋如何使用具有先進自然語言處理能力的AI的Chatgpt操作Twitter。通過使用CHATGPT,您不僅可以提高實時響應功能並提高內容創建的效率,而且還可以製定符合趨勢的營銷策略。 此外,使用預防措施

[對於Mac]說明如何開始以及如何使用ChatGpt桌面應用程序![對於Mac]說明如何開始以及如何使用ChatGpt桌面應用程序!May 12, 2025 pm 05:33 PM

CHATGPT MAC桌面應用程序詳細指南:從安裝到音頻功能 最後,Chatgpt的Mac桌面應用程序現已可用!在本文中,我們將徹底解釋從安裝方法到有用的功能和將來的更新信息的所有內容。使用桌面應用程序獨有的功能,例如快捷鍵,圖像識別和語音模式,以極大地提高您的業務效率! 安裝桌面應用的ChatGpt Mac版本 從瀏覽器訪問:首先,在瀏覽器中訪問chatgpt。

chatgpt的角色限制是什麼?解釋如何避免它和模型上限chatgpt的角色限制是什麼?解釋如何避免它和模型上限May 12, 2025 pm 05:32 PM

當使用chatgpt時,您是否曾經有過這樣的經驗,例如“輸出在中途停止”或“即使我指定了字符的數量,它也無法正確輸出”?該模型非常開創性,不僅允許自然對話,而且還允許創建電子郵件,摘要論文,甚至允許產生諸如小說之類的創意句子。但是,ChatGpt的弱點之一是,如果文本太長,輸入和輸出將無法正常工作。 Openai的最新AI代理“ Openai Deep Research”

什麼是Chatgpt的語音輸入和語音對話功能?解釋如何設置以及如何使用它什麼是Chatgpt的語音輸入和語音對話功能?解釋如何設置以及如何使用它May 12, 2025 pm 05:27 PM

Chatgpt是Openai開發的創新AI聊天機器人。它不僅具有文本輸入,而且還具有語音輸入和語音對話功能,從而可以進行更自然的交流。 在本文中,我們將解釋如何設置和使用Chatgpt的語音輸入和語音對話功能。即使您不能脫身,Chatp Plans也通過與您交談來做出回應並回應音頻,這在繁忙的商業情況和英語對話練習等各種情況下都帶來了很大的好處。 關於如何設置智能手機應用程序和PC的詳細說明以及如何使用。

易於理解的解釋如何使用Chatgpt進行求職和尋找工作!易於理解的解釋如何使用Chatgpt進行求職和尋找工作!May 12, 2025 pm 05:26 PM

成功的快捷方式!使用chatgpt有效的工作變更策略 在當今加劇的工作變更市場中,有效的信息收集和徹底的準備是成功的關鍵。 諸如Chatgpt之類的高級語言模型是求職者的強大武器。在本文中,我們將解釋如何有效利用Chatgpt來提高您的工作企業效率,從自我分析到申請文件和麵試準備。節省時間和學習技術,以充分展示您的優勢,並幫助您成功搜索工作。 目錄 使用chatgpt的狩獵工作示例 自我分析的效率:聊天

易於理解的解釋如何使用ChatGpt創建和輸出思維地圖!易於理解的解釋如何使用ChatGpt創建和輸出思維地圖!May 12, 2025 pm 05:22 PM

思維地圖是組織信息並提出想法的有用工具,但是創建它們可能需要時間。使用Chatgpt可以大大簡化此過程。 本文將詳細說明如何使用chatgpt輕鬆創建思維地圖。此外,通過創建的實際示例,我們將介紹如何在各種主題上使用思維圖。 了解如何使用Chatgpt有效地組織和可視化您的想法和信息。 Openai的最新AI代理OpenA

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器