搜尋
首頁科技週邊人工智慧通過微調小語言模型的新聞分類

小語言模型(SLM):用於資源受限環境的高效AI

小語言模型(SLM)是大型語言模型(LLM)的簡化版本,其參數少於100億。這種設計優先考慮降低計算成本,降低能耗和更快的響應時間,同時保持專注的性能。 SLM特別適合用於資源有限的設置,例如Edge Computing和實時應用程序。它們的效率源於專注於特定任務並使用較小的數據集,在性能和資源使用之間取得了平衡。這使高級AI功能更容易訪問和擴展,非常適合輕巧聊天機器人和設備AI等應用程序。

關鍵學習目標

本文將涵蓋:

  • 在規模,培訓數據和計算需求方面了解SLM和LLM之間的區別。
  • 探索微調SLM在專門任務中的優勢,包括提高效率,準確性和更快的訓練週期。
  • 確定何時需要微調,以及何時及時的工程或檢索增強發電(RAG)等替代方案更合適。
  • 檢查參數有效的微調(PEFT)技術,例如LORA及其對減少計算需求的影響,同時增強模型適應性。
  • 應用微調SLM的實踐方面,通過使用Microsoft的PHI-3.5-Mini-Instruct模型等新聞類別分類進行了說明。

本文是數據科學博客馬拉鬆的一部分。

目錄

  • SLM與LLMS:比較
  • 微調SLM背後的理由
  • 什麼時候需要微調?
  • PEFT與傳統微調
  • 用Lora進行微調:一種參數效率的方法
  • 結論
  • 常見問題

SLM與LLMS:比較

這是關鍵差異的細分:

  • 模型大小: SLM明顯較小(低於100億個參數),而LLMS大大較大。
  • 培訓數據和時間: SLM使用較小的,專注的數據集,需要數週的培訓,而LLMS則使用大量的,不同的數據集並花費數月的時間進行培訓。
  • 計算資源: SLM需要更少的資源,促進可持續性,而LLMS則需要大量資源進行培訓和操作。
  • 任務能力: SLM在更簡單的專業任務上表現出色,而LLM則更適合複雜的通用任務。
  • 推理與控制: SLM可以在設備上本地運行,提供更快的響應時間和更大的用戶控制。 LLMS通常需要專門的硬件,並提​​供更少的用戶控制。
  • 成本:與LLMS相關的較高成本不同,SLM的資源要求較低,因此SLM更具成本效益。

微調SLM背後的理由

通過幾個關鍵好處,微調SLMS是各種應用的寶貴技術:

  • 域專業化:特定於域的數據集的微調可以使SLM更好地理解專業的詞彙和上下文。
  • 效率和成本節省:微調較小的型號所需的資源少於培訓較大的型號。
  • 更快的培訓與迭代: SLM的微調過程更快,可以更快地迭代和部署。
  • 降低過度擬合風險:較小的模型通常會更好地推廣,從而最大程度地減少過度擬合。
  • 增強的安全性和隱私: SLM可以在更安全的環境中部署,以保護敏感數據。
  • 較低的延遲:它們的尺寸較小,可以更快地處理,使其非常適合低延遲應用。

什麼時候需要微調?

進行微調之前,請考慮及時工程或抹布等替代方案。微調最適合高風險應用程序,要求精確和上下文意識,而及時的工程為實驗提供了靈活且具有成本效益的方法。抹布適合需要動態知識集成的應用。

PEFT與傳統微調

PEFT通過專注於一小部分參數,為傳統微調提供了有效的替代方法。這降低了計算成本和數據集大小要求。

通過微調小語言模型的新聞分類

用Lora進行微調:一種參數效率的方法

Lora(低級適應)是一種PEFT技術,可以通過冷凍原始重量並引入較小,可訓練的低級矩陣來提高效率。這大大減少了需要培訓的參數數量。

通過微調小語言模型的新聞分類

通過微調小語言模型的新聞分類

(以下各節詳細介紹了使用BBC新聞數據和PHI-3.5-MINI-Instruct模型詳細介紹逐步微調過程。

結論

SLM為AI提供了強大而有效的方法,尤其是在資源約束環境中。微調,尤其是使用PEFT技術,例如Lora,可以增強其功能,並使Advanced AI更容易訪問。

關鍵要點:

  • 與LLM相比,SLM的資源有效。
  • 微調SLM允許域專業化。
  • 及時的工程和抹布是微調的可行替代方案。
  • PEFT方法等PEFT方法顯著提高了微調效率。

常見問題

  • Q1。什麼是SLM? A.緊湊,有效的LLM,參數少於100億。
  • Q2。微調如何改善SLM?答:它允許在特定領域進行專業化。
  • Q3。什麼是peft?答:一種有效的微調方法,重點是一小部分參數。
  • Q4。什麼是洛拉? A.使用低級矩陣來減少訓練參數的PEFT技術。
  • Q5。微調與及時工程? A.微調用於高風險應用;及時的工程是靈活,具有成本效益的適應性。

(注意:圖像URL保持不變。)

以上是通過微調小語言模型的新聞分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代May 02, 2025 am 11:17 AM

動盪遊戲:與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室,由暴風雪和黑曜石等行業巨頭的退伍軍人組成,有望用其創新的AI驅動的Platfor革新遊戲創作

Uber想成為您的Robotaxi商店,提供商會讓他們嗎?Uber想成為您的Robotaxi商店,提供商會讓他們嗎?May 02, 2025 am 11:16 AM

Uber的Robotaxi策略:自動駕駛汽車的騎車生態系統 在最近的Curbivore會議上,Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。 利用他們在

AI代理玩電子遊戲將改變未來的機器人AI代理玩電子遊戲將改變未來的機器人May 02, 2025 am 11:15 AM

事實證明,視頻遊戲是最先進的AI研究的寶貴測試理由,尤其是在自主代理商和現實世界機器人的開發中,甚至有可能促進人工通用情報(AGI)的追求。 一個

創業公司工業綜合體VC 3.0和James Currier的宣言創業公司工業綜合體VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不斷發展的風險投資格局的影響在媒體,財務報告和日常對話中顯而易見。 但是,對投資者,初創企業和資金的具體後果經常被忽略。 風險資本3.0:範式

Adobe在Adobe Max London 2025更新創意云和螢火蟲Adobe在Adobe Max London 2025更新創意云和螢火蟲May 02, 2025 am 11:13 AM

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新,反映了向可訪問性和生成AI的戰略轉變。 該分析結合了事件前簡報中的見解,並融合了Adobe Leadership。 (注意:Adob

Llamacon宣布的所有元數據Llamacon宣布的所有元數據May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一項綜合的AI策略,旨在直接與OpenAI等封閉的AI系統競爭,同時為其開源模型創建了新的收入流。 這個多方面的方法目標bo

關於AI僅僅是普通技術的主張的釀造爭議關於AI僅僅是普通技術的主張的釀造爭議May 02, 2025 am 11:10 AM

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱,是時候揭露“皇帝的新衣”了,而另一些人則強烈反對人工智能僅僅是普通技術的觀點。 讓我們來探討一下。 對這一創新性人工智能突破的分析,是我持續撰寫的福布斯專欄文章的一部分,該專欄涵蓋人工智能領域的最新進展,包括識別和解釋各種有影響力的人工智能複雜性(請點擊此處查看鏈接)。 人工智能作為普通技術 首先,需要一些基本知識來為這場重要的討論奠定基礎。 目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能(AGI)甚至可能實現人工超級智能(AS

模型公民,為什麼AI值是下一個業務碼模型公民,為什麼AI值是下一個業務碼May 02, 2025 am 11:09 AM

公司AI模型的有效性現在是一個關鍵的性能指標。自AI BOOM以來,從編寫生日邀請到編寫軟件代碼的所有事物都將生成AI使用。 這導致了語言mod的擴散

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。