鍵學習成果
本教程將涵蓋:
常規的情感分析工作流程及其局限性。
- 用LLMS零攝像的文本分類的原理和好處。
- SKLLM庫的簡介及其與Scikit-Learn的集成。
- 零攝像分類的實際應用在女性電子商務服裝評論數據集中。
- >現實世界中的零攝像分類的實踐經驗。
- *本文是*** 數據科學blogathon的一部分。
目錄的> 什麼是零擊文本分類?
>為什麼零射擊如此高效?
>- 數據集概述
- >逐步指南
- 潛在的缺點
- 少數文本分類
- 經過思考的文本分類
- 摘要
- 常見問題
- 什麼是零擊文本分類? >
- 分析在線零售商收到的大量客戶評論對有效的情感分析和主題識別提出了重大挑戰。 傳統方法涉及:
收集和清潔審核數據。
>手動標記數千個樣本(例如,“正”,“負”,“中性”)。
使用此標記的數據進行細微調整專用分類模型。
- 這個過程是耗時的和資源密集的。零彈性文本分類提供了一個解決方案:直接使用LLMS無需自定義培訓來對文本進行分類。 通過提供描述性標籤(例如,“正面”,“負”,“中性”),該模型滲透了正確的類。
- > 為什麼零射擊如此高效?
- > 零拍的效率源於:
-
- 消除微調:避免了像GPT-4這樣的微調LLM的昂貴過程。 預先訓練的LLM可直接使用,提供了立即的高質量分類。 >
- >簡單的標籤改編:更改標籤集(例如,從一般情感到更具體的情感)僅需要更新標籤列表;不需要模型再培訓。 >
- >降低數據要求:與監督學習不同,零攝像分類只需要描述性標籤,使其適用於具有有限或未標記數據的情況。 >
- >>更快的部署:通過跳過數據註釋和模型培訓,部署大大加速了。
>
[鏈接到數據集]
密鑰數據集特性:
- >
- “評論文本”列包含主要文本數據。
- 其他元數據(“標題”,“評級”,“推薦的IND”等)可用,但對於零攝影分類而不是必不可少。
- >逐步指南
>本節詳細介紹瞭如何使用LLMS和SKLLM庫進行零攝像分類執行情感分析和主題檢測。
>步驟1:安裝和設置
確保安裝Python 3.7並安裝SKLLM:
>獲得LLM提供商(例如OpenAI)的有效API密鑰,並將其設置在您的環境中:
pip install scikit-llm
步驟2:導入庫和加載數據
from skllm.config import SKLLMConfig # Replace with your OpenAI API key SKLLMConfig.set_openai_key("your_openai_api_key")
>步驟3:定義標籤
import pandas as pd from skllm.models.gpt.classification.zero_shot import ZeroShotGPTClassifier # Load dataset df = pd.read_csv("Womens Clothing E-Commerce Reviews.csv") # Handle missing review texts df = df.dropna(subset=["Review Text"]).reset_index(drop=True) X = df["Review Text"].tolist()
用於情感分類,使用:。 可以根據需要自定義。
>>步驟4:零射擊分類
實例化["positive", "negative", "neutral"]
(使用
或其他合適的模型):>
表示不需要培訓數據;分類器以標籤集初始化。ZeroShotGPTClassifier
gpt-4o
clf = ZeroShotGPTClassifier(model="gpt-4o") clf.fit(None, ["positive", "negative", "neutral"])
>步驟5:分類評論
fit(None, labels)
這顯示了前五個評論及其預測的觀點。
結果比較predictions = clf.predict(X) for review_text, sentiment in zip(X[:5], predictions[:5]): print(f"Review: {review_text}") print(f"Predicted Sentiment: {sentiment}") print("-" * 50)
傳統的ML方法需要標籤,模型培訓,驗證和連續更新。零拍攝可顯著降低此開銷,從而立即獲得結果,而無需標記數據和易於標籤的細化。
潛在的缺點
- 準確性波動:準確性可以根據文本的複雜性和模型解釋特定域行話的能力而有所不同。 >
- 成本注意事項:>使用強大的模型(例如GPT-4)會產生API成本。 >
- 數據隱私:在將數據發送到外部API時,請確保符合數據隱私法規。
幾乎沒有射擊分類使用少數標記的示例來指導模型。 SKLLM估計器使用整個培訓集來創建幾個示例。 對於大型數據集,請考慮將數據分開並使用一個小的培訓子集(例如,每個課程不超過10個示例),然後將示例放置為 。
經過思考的文本分類
pip install scikit-llm
經過思考鏈分類產生了中間推理步驟,有可能提高準確性,但可以提高令牌使用和成本。與基線零射擊方法相比,使用少量射擊和鍊鍊方法進行實驗可能會產生更好的結果。
摘要
SKLLM庫為建立自定義情感分析管道提供了快速有效的替代方案。 零射擊分類可以快速分析客戶反饋,而無需手動標籤或模型培訓。 這對於迭代任務和標籤擴展尤其有價值。from skllm.config import SKLLMConfig # Replace with your OpenAI API key SKLLMConfig.set_openai_key("your_openai_api_key")
>>關鍵點
像GPT-4這樣的LLMS
LLMS立即提供高質量的分類結果。- 零射擊分類是快速,適應性的,並且需要最少的數據。
- 常見問題
- Q1。在零射擊,很少射擊和經營鏈之間進行選擇: 零射擊是快速原型製作和有限數據的理想選擇;通過一個小標記的數據集,很少能提高準確性;經過思考鏈會提高性能,但增加了成本。
> 建議每班最多10個示例;避免偏見的示例示例。
Q3。對準確性的影響鏈的影響:不能保證提高準確性;有效性取決於任務的複雜性和迅速的清晰度。
Q4。規模上的成本:
>成本取決於令牌使用,模型選擇,及時長度和數據集大小。 經過思考鏈會增加由於更長的提示而增加的成本。 注意:>本文中使用的圖像不歸作者所有,並且隨許可使用。
>
以上是用Scikit-llm零射擊和少量的文本分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

法律技術革命正在獲得動力,促使法律專業人員積極採用AI解決方案。 對於那些旨在保持競爭力的人來說,被動抵抗不再是可行的選擇。 為什麼技術採用至關重要? 法律專業人員

許多人認為與AI的互動是匿名的,與人類交流形成了鮮明的對比。 但是,AI在每次聊天期間都會積極介紹用戶。 每個單詞的每個提示都經過分析和分類。讓我們探索AI Revo的這一關鍵方面

成功的人工智能戰略,離不開強大的企業文化支撐。正如彼得·德魯克所言,企業運作依賴於人,人工智能的成功也同樣如此。 對於積極擁抱人工智能的組織而言,構建適應AI的企業文化至關重要,它甚至決定著AI戰略的成敗。 西蒙諾諮詢公司(West Monroe)近期發布了構建蓬勃發展的AI友好型企業文化的實用指南,以下是一些關鍵要點: 1. 明確AI的成功模式: 首先,要對AI如何賦能業務有清晰的願景。理想的AI運作文化,能夠實現人與AI系統之間工作流程的自然融合。 AI擅長某些任務,而人類則擅長創造力、判

Meta升級AI助手應用,可穿戴式AI時代來臨!這款旨在與ChatGPT競爭的應用,提供文本、語音交互、圖像生成和網絡搜索等標準AI功能,但現在首次增加了地理位置功能。這意味著Meta AI在回答你的問題時,知道你的位置和正在查看的內容。它利用你的興趣、位置、個人資料和活動信息,提供最新的情境信息,這在以前是無法實現的。該應用還支持實時翻譯,這徹底改變了Ray-Ban眼鏡上的AI體驗,使其實用性大大提升。 對外國電影徵收關稅是對媒體和文化的赤裸裸的權力行使。如果實施,這將加速向AI和虛擬製作的

人工智能正在徹底改變網絡犯罪領域,這迫使我們必須學習新的防禦技巧。網絡罪犯日益利用深度偽造和智能網絡攻擊等強大的人工智能技術進行欺詐和破壞,其規模前所未有。據報導,87%的全球企業在過去一年中都成為人工智能網絡犯罪的目標。 那麼,我們該如何避免成為這波智能犯罪的受害者呢?讓我們探討如何在個人和組織層面識別風險並採取防護措施。 網絡罪犯如何利用人工智能 隨著技術的進步,犯罪分子不斷尋找新的方法來攻擊個人、企業和政府。人工智能的廣泛應用可能是最新的一個方面,但其潛在危害是前所未有的。 特別是,人工智

最好將人工智能(AI)與人類智力(NI)之間的複雜關係理解為反饋循環。 人類創建AI,對人類活動產生的數據進行培訓,以增強或複制人類能力。 這個AI

Anthropic最近的聲明強調了有關尖端AI模型缺乏了解,引發了專家之間的激烈辯論。 這是一個真正的技術危機,還是僅僅是通往更秘密的道路上的臨時障礙

印度是一個多元化的國家,具有豐富的語言,使整個地區的無縫溝通成為持續的挑戰。但是,Sarvam的Bulbul-V2正在幫助彌合其高級文本到語音(TTS)T


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Dreamweaver CS6
視覺化網頁開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

禪工作室 13.0.1
強大的PHP整合開發環境

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。