Google推出了第五代客製化張量處理器(TPU)晶片TPU v5e,用於大型模型的訓練和推理。這款新晶片使得訓練和運行AI模型的速度提高了5倍。與上一代晶片相比,TPU v5e在每一美元的訓練性能上提升了2倍,在每一美元的推理性能上提升了2.5倍
Google的第五代客製化張量處理器(TPU)晶片,即TPU v5e,被用於大型模型的訓練和推理,從而使得訓練和運行人工智慧模型的速度提高了5倍
在舊金山舉行的Google雲端年度會議Google Cloud Next上,Google發布了一款全新的人工智慧晶片——第五代客製化張量處理器(TPU)晶片TPU v5e,用於大規模模型的訓練和推理。相較於上一代晶片,TPU v5e在每一美元的訓練性能上提升了2倍,在每一美元的推理性能上提升了2.5倍
Google為神經網路設計了專用晶片TPU,透過優化可以加快機器學習模型的訓練和推斷速度。第一代TPU於2016年推出,第四代客製化處理器TPU於2021年發布,並於2022年提供給開發者。雲端TPU是Google雲端服務的功能,適用於需要大量矩陣運算的大型複雜深度學習模型,例如大語言模型、蛋白質折疊建模和藥物研發等。使用雲端TPU可以幫助企業在實現AI工作負載時節省資金和時間
Google雲端推出了TPU v5e,專為中大型模式的訓練和推理需求而設計。此版本的晶片注重效率,與上一代的TPU v4相比,每一美元的訓練性能提高了2倍,每一美元的推理性能提高了2.5倍,而成本不到TPU v4的一半。這使得更多的組織能夠訓練和部署更大更複雜的人工智慧模型,而無需犧牲效能或靈活性。谷歌雲端將TPU v5e描述為“超級電腦”,最多支援256個晶片的互連,總頻寬超過400 Tb/s,並提供八種不同的虛擬機配置,以滿足各種大型語言模型和生成式人工智能模型的需求。根據速度基準測試,使用TPU v5e訓練和運行人工智慧模型的速度提高了5倍
據科技媒體TechCrunch報道,谷歌雲端運算和機器學習基礎設施副總裁兼總經理馬克·洛邁爾(Mark Lohmeyer) 表示,“這是迄今為止最具成本效益且易於訪問的雲TPU。”洛邁爾強調,Google雲端確保用戶能夠將其TPU叢集擴展到以前無法達到的水平,讓客戶能夠輕鬆擴展他們的人工智慧模型,超越單一TPU叢集的實體邊界。也就是說,單一大型人工智慧工作負載可以跨越多個實體TPU集群,擴展到數萬個晶片,並且經濟高效。 「在雲端GPU和雲端TPU方面,我們為客戶提供了許多選擇和靈活性,以滿足我們看到的人工智慧工作負載的廣泛需求。」
Google雲端除了推出新一代TPU外,也宣布將在下個月推出基於英偉達H100 GPU的A3系列虛擬機,以GPU超級電腦的形式提供,為人工智慧大模型提供強大的運算能力
以上是谷歌發布第五代AI晶片:加速AI模型的訓練和運行速度提升5倍的詳細內容。更多資訊請關注PHP中文網其他相關文章!