通過微調小語言模型的新聞分類-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

通過微調小語言模型的新聞分類

Jennifer Aniston

Mar 15, 2025 am 09:46 AM

小語言模型（SLM）：用於資源受限環境的高效AI

小語言模型（SLM）是大型語言模型（LLM）的簡化版本，其參數少於100億。這種設計優先考慮降低計算成本，降低能耗和更快的響應時間，同時保持專注的性能。 SLM特別適合用於資源有限的設置，例如Edge Computing和實時應用程序。它們的效率源於專注於特定任務並使用較小的數據集，在性能和資源使用之間取得了平衡。這使高級AI功能更容易訪問和擴展，非常適合輕巧聊天機器人和設備AI等應用程序。

關鍵學習目標

本文將涵蓋：

在規模，培訓數據和計算需求方面了解SLM和LLM之間的區別。
探索微調SLM在專門任務中的優勢，包括提高效率，準確性和更快的訓練週期。
確定何時需要微調，以及何時及時的工程或檢索增強發電（RAG）等替代方案更合適。
檢查參數有效的微調（PEFT）技術，例如LORA及其對減少計算需求的影響，同時增強模型適應性。
應用微調SLM的實踐方面，通過使用Microsoft的PHI-3.5-Mini-Instruct模型等新聞類別分類進行了說明。

本文是數據科學博客馬拉鬆的一部分。

SLM與LLMS：比較
微調SLM背後的理由
什麼時候需要微調？
PEFT與傳統微調
用Lora進行微調：一種參數效率的方法
結論
常見問題

SLM與LLMS：比較

這是關鍵差異的細分：

模型大小： SLM明顯較小（低於100億個參數），而LLMS大大較大。
培訓數據和時間： SLM使用較小的，專注的數據集，需要數週的培訓，而LLMS則使用大量的，不同的數據集並花費數月的時間進行培訓。
計算資源： SLM需要更少的資源，促進可持續性，而LLMS則需要大量資源進行培訓和操作。
任務能力： SLM在更簡單的專業任務上表現出色，而LLM則更適合複雜的通用任務。
推理與控制： SLM可以在設備上本地運行，提供更快的響應時間和更大的用戶控制。 LLMS通常需要專門的硬件，並提供更少的用戶控制。
成本：與LLMS相關的較高成本不同，SLM的資源要求較低，因此SLM更具成本效益。

微調SLM背後的理由

通過幾個關鍵好處，微調SLMS是各種應用的寶貴技術：

域專業化：特定於域的數據集的微調可以使SLM更好地理解專業的詞彙和上下文。
效率和成本節省：微調較小的型號所需的資源少於培訓較大的型號。
更快的培訓與迭代： SLM的微調過程更快，可以更快地迭代和部署。
降低過度擬合風險：較小的模型通常會更好地推廣，從而最大程度地減少過度擬合。
增強的安全性和隱私： SLM可以在更安全的環境中部署，以保護敏感數據。
較低的延遲：它們的尺寸較小，可以更快地處理，使其非常適合低延遲應用。

什麼時候需要微調？

進行微調之前，請考慮及時工程或抹布等替代方案。微調最適合高風險應用程序，要求精確和上下文意識，而及時的工程為實驗提供了靈活且具有成本效益的方法。抹布適合需要動態知識集成的應用。

PEFT與傳統微調

PEFT通過專注於一小部分參數，為傳統微調提供了有效的替代方法。這降低了計算成本和數據集大小要求。

通過微調小語言模型的新聞分類

用Lora進行微調：一種參數效率的方法

Lora（低級適應）是一種PEFT技術，可以通過冷凍原始重量並引入較小，可訓練的低級矩陣來提高效率。這大大減少了需要培訓的參數數量。

通過微調小語言模型的新聞分類

（以下各節詳細介紹了使用BBC新聞數據和PHI-3.5-MINI-Instruct模型詳細介紹逐步微調過程。

結論

SLM為AI提供了強大而有效的方法，尤其是在資源約束環境中。微調，尤其是使用PEFT技術，例如Lora，可以增強其功能，並使Advanced AI更容易訪問。

關鍵要點：

與LLM相比，SLM的資源有效。
微調SLM允許域專業化。
及時的工程和抹布是微調的可行替代方案。
PEFT方法等PEFT方法顯著提高了微調效率。

常見問題

Q1。什麼是SLM？ A.緊湊，有效的LLM，參數少於100億。
Q2。微調如何改善SLM？答：它允許在特定領域進行專業化。
Q3。什麼是peft？答：一種有效的微調方法，重點是一小部分參數。
Q4。什麼是洛拉？ A.使用低級矩陣來減少訓練參數的PEFT技術。
Q5。微調與及時工程？ A.微調用於高風險應用；及時的工程是靈活，具有成本效益的適應性。

（注意：圖像URL保持不變。）

以上是通過微調小語言模型的新聞分類的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

AI遊戲開發通過Upheaval的Dreamer Portal進入其代理時代May 02, 2025 am 11:17 AM

動盪遊戲：與AI代理商的遊戲開發徹底改變 Roupheaval是一家遊戲開發工作室，由暴風雪和黑曜石等行業巨頭的退伍軍人組成，有望用其創新的AI驅動的Platfor革新遊戲創作

Uber想成為您的Robotaxi商店，提供商會讓他們嗎？May 02, 2025 am 11:16 AM

Uber的Robotaxi策略：自動駕駛汽車的騎車生態系統在最近的Curbivore會議上，Uber的Richard Willder推出了他們成為Robotaxi提供商的乘車平台的策略。利用他們在

AI代理玩電子遊戲將改變未來的機器人May 02, 2025 am 11:15 AM

事實證明，視頻遊戲是最先進的AI研究的寶貴測試理由，尤其是在自主代理商和現實世界機器人的開發中，甚至有可能促進人工通用情報（AGI）的追求。一個

創業公司工業綜合體VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不斷發展的風險投資格局的影響在媒體，財務報告和日常對話中顯而易見。但是，對投資者，初創企業和資金的具體後果經常被忽略。風險資本3.0：範式

Adobe在Adobe Max London 2025更新創意云和螢火蟲May 02, 2025 am 11:13 AM

Adobe Max London 2025對Creative Cloud和Firefly進行了重大更新，反映了向可訪問性和生成AI的戰略轉變。該分析結合了事件前簡報中的見解，並融合了Adobe Leadership。（注意：Adob

Llamacon宣布的所有元數據May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一項綜合的AI策略，旨在直接與OpenAI等封閉的AI系統競爭，同時為其開源模型創建了新的收入流。這個多方面的方法目標bo

關於AI僅僅是普通技術的主張的釀造爭議May 02, 2025 am 11:10 AM

人工智能領域對這一論斷存在嚴重分歧。一些人堅稱，是時候揭露“皇帝的新衣”了，而另一些人則強烈反對人工智能僅僅是普通技術的觀點。讓我們來探討一下。對這一創新性人工智能突破的分析，是我持續撰寫的福布斯專欄文章的一部分，該專欄涵蓋人工智能領域的最新進展，包括識別和解釋各種有影響力的人工智能複雜性（請點擊此處查看鏈接）。人工智能作為普通技術首先，需要一些基本知識來為這場重要的討論奠定基礎。目前有大量的研究致力於進一步發展人工智能。總目標是實現人工通用智能（AGI）甚至可能實現人工超級智能（AS