首頁 >科技週邊 >人工智慧 >明略科技發布免費開源TensorBoard.cpp,促進大型模型的預訓練工作

明略科技發布免費開源TensorBoard.cpp,促進大型模型的預訓練工作

PHPz
PHPz轉載
2023-08-14 08:17:02768瀏覽

近日,明略科技集團實現了機器學習視覺化工具-TensorBoard的C 接口,進一步豐富了基於C 的大模型專案工具集,使得大模型預訓練過程監控更便利、有效率,加速行銷領域大模型預訓練流程。該工具已在Github開源。

TensorBoard是Google開發的機器學習視覺化工具,常用於監控機器學習過程的各項指標。明略科技資深技術總監趙亮介紹:「在大模型訓練過程中,資料監測是一個重要維度,而TensorBoard透過視覺化模型中的各種參數和結果,例如記錄大模型訓練過程的Loss變化、驗證集的PPL變化、學習率變化、Token消耗量、單步參數更新時延等指標,幫助分析訓練狀態,發現訓練過程中出現的問題並及時採取乾預措施,提升大模型訓練流程與效果。」

明略科技發布免費開源TensorBoard.cpp,促進大型模型的預訓練工作

#明略科技的C 介面TensorBoard工具頁面是開源的

#先前,TensorBoard僅支援Python語言介面。此次明略科技透過C 實現TensorBoard,將進一步豐富基於C 實現的大模型專案工具集,

#大幅提升模型訓練監測效率,加速模型訓練進程,改寫介面後的工具將透過多維度的資料模式展示訓練指標,包括標量、直方圖、圖像、圖像集、音訊、文字等資料模式。工具包透過github專案Tensorboard.cpp分享,協助明略科技發布免費開源TensorBoard.cpp,促進大型模型的預訓練工作

更多研究者與開發者參與並加速大模式的研發進程,推動人工智慧多領域的應用探索。

明略科技在G

ithub開源的兩款工具包:ASR-BlockFormer與tensorboard.cpp明略科技集團CTO郝傑表示:

###「我們要在更有效率、更低成本的要求#######下做出行銷領域的大模型,透過自適應技術提升大模型的能力。好的產業大模型需要具備通用大模型的邏輯性、語言順暢度,同時還需要實現通用大模型所不具備的,在某個產業內或具體的領域中的真實性、專業性。我們以明略科技憑藉17年來積累的海量行業數據為基礎,從客戶實際需求出發,借助龐大的數據和知識庫進行增強訓練,滿足客戶多樣化的任務和場景需求。在訓練監控視覺化工具的加持下,我們將提升訓練速度,及時發現問題,為客戶打造一個更可靠、效果更好的行業大模型。」#######

以上是明略科技發布免費開源TensorBoard.cpp,促進大型模型的預訓練工作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除