搜尋
首頁後端開發Python教學探索教師庫:結構化非結構化資料(以及沿途的一些樂趣)

Exploring the Instructor Library: Structuring Unstructured Data (and Some Fun along the Way)

我最近遇到了講師庫,我必須說,給我留下了深刻的印象。結構化非結構化資料的概念非常強大,我敢說,有點神奇。你可以獲取無處不在的數據並以某種方式對其施加秩序——嗯,這就是我的魔法。

但是…它到底是如何運作的?

為了找到答案,我花了一些時間深入研究這個庫的內部結構,我發現幕後有兩個關鍵人物對它的大部分魔力負責。

認識玩家:Pydantic 和一個不錯的提示

import instructor
from pydantic import BaseModel
from openai import OpenAI

現在,如果您熟悉 Python 的資料驗證和設定管理,您可能聽說過 Pydantic。如果你還沒有…好吧,請繫好安全帶!這是一個令人驚嘆的庫,可讓您定義資料結構,然後即時驗證傳入資料是否與這些結構相符。將其視為高級俱樂部的保鏢,確保只有正確的數據才能進入。

FastAPI 是另一個很棒的工具,它很好地利用了 Pydantic 來確保透過 API 傳遞的資料採用正確的格式。那麼,下一步是什麼?現在我們已經定義了我們的結構,我們如何讓 LLM(如 OpenAI 的 GPT)遵循它?嗯……

假設1:Pydantic的序列化

我的第一個假設是 Pydantic 可能允許某種序列化——將資料結構轉換為法學碩士可以輕鬆理解和使用的東西。事實證明,我沒有錯。

Pydantic 讓您可以使用以下方法將資料序列化到字典中:

model.model_dump(...)  # Dumps the model into a dictionary

此方法遞歸地將 Pydantic 模型轉換為字典,然後可以輸入 LLM 進行處理。到目前為止,一切都很好。但後來我偶然發現了一些更有趣的事:

假設 2:產生 JSON 模式

一切都變得更好了。 Pydantic 不僅可以將資料轉換為字典,還可以為您的模型產生 JSON 模式。這是關鍵,因為現在您已經有了希望 LLM 遵循的結構藍圖。

這就是事情真正開始發生的地方:

# Generate a JSON schema for a Pydantic model
response_model.model_json_schema()

賓果!現在您已經有了一個清晰的架構,它準確地定義了資料的外觀。這是我們可以發送給 LLM 的藍圖,因此它確切地知道如何建立其輸出。

將一切整合在一起

import instructor
from pydantic import BaseModel
from openai import OpenAI

在這裡,圖書館將模式傳遞給 LLM,要求它傳回符合該結構的資料。訊息很明確:「嘿 LLM,在生成輸出時請尊重此模式。」這就像給你的法學碩士一張詳細的地圖並說:「嚴格遵循這些指示。」

謝謝你對我的包容

因此,經過所有這些調查,我現在確信:Pydantic 的序列化和 JSON 模式生成使得 Instructor 庫能夠獲得遵循結構化資料格式的 LLM。

感謝您與我一起完成這個有趣(且有點複雜)的調查。誰知道透過 Python 庫的一點幫助和一點創造性的提示就可以馴服非結構化資料?

以上是探索教師庫:結構化非結構化資料(以及沿途的一些樂趣)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
通常使用哪種模塊在Python中創建數組?通常使用哪種模塊在Python中創建數組?May 05, 2025 am 12:02 AM

theSostCommonlyusedModuleForCreatingArraysInpyThonisnumpy.1)NumpyProvidEseffitedToolsForarrayOperations,Idealfornumericaldata.2)arraysCanbeCreatedDusingsnp.Array()for1dand2Structures.3)

您如何將元素附加到Python列表中?您如何將元素附加到Python列表中?May 04, 2025 am 12:17 AM

toAppendElementStoApythonList,usetheappend()方法forsingleements,Extend()formultiplelements,andinsert()forspecificpositions.1)useeAppend()foraddingoneOnelementAttheend.2)useextendTheEnd.2)useextendexendExendEnd(

您如何創建Python列表?舉一個例子。您如何創建Python列表?舉一個例子。May 04, 2025 am 12:16 AM

TocreateaPythonlist,usesquarebrackets[]andseparateitemswithcommas.1)Listsaredynamicandcanholdmixeddatatypes.2)Useappend(),remove(),andslicingformanipulation.3)Listcomprehensionsareefficientforcreatinglists.4)Becautiouswithlistreferences;usecopy()orsl

討論有效存儲和數值數據的處理至關重要的實際用例。討論有效存儲和數值數據的處理至關重要的實際用例。May 04, 2025 am 12:11 AM

金融、科研、医疗和AI等领域中,高效存储和处理数值数据至关重要。1)在金融中,使用内存映射文件和NumPy库可显著提升数据处理速度。2)科研领域,HDF5文件优化数据存储和检索。3)医疗中,数据库优化技术如索引和分区提高数据查询性能。4)AI中,数据分片和分布式训练加速模型训练。通过选择适当的工具和技术,并权衡存储与处理速度之间的trade-off,可以显著提升系统性能和可扩展性。

您如何創建Python數組?舉一個例子。您如何創建Python數組?舉一個例子。May 04, 2025 am 12:10 AM

pythonarraysarecreatedusiseThearrayModule,notbuilt-Inlikelists.1)importThearrayModule.2)指定tefifythetypecode,例如,'i'forineizewithvalues.arreaysofferbettermemoremorefferbettermemoryfforhomogeNogeNogeNogeNogeNogeNogeNATATABUTESFELLESSFRESSIFERSTEMIFICETISTHANANLISTS。

使用Shebang系列指定Python解釋器有哪些替代方法?使用Shebang系列指定Python解釋器有哪些替代方法?May 04, 2025 am 12:07 AM

除了shebang線,還有多種方法可以指定Python解釋器:1.直接使用命令行中的python命令;2.使用批處理文件或shell腳本;3.使用構建工具如Make或CMake;4.使用任務運行器如Invoke。每個方法都有其優缺點,選擇適合項目需求的方法很重要。

列表和陣列之間的選擇如何影響涉及大型數據集的Python應用程序的整體性能?列表和陣列之間的選擇如何影響涉及大型數據集的Python應用程序的整體性能?May 03, 2025 am 12:11 AM

ForhandlinglargedatasetsinPython,useNumPyarraysforbetterperformance.1)NumPyarraysarememory-efficientandfasterfornumericaloperations.2)Avoidunnecessarytypeconversions.3)Leveragevectorizationforreducedtimecomplexity.4)Managememoryusagewithefficientdata

說明如何將內存分配給Python中的列表與數組。說明如何將內存分配給Python中的列表與數組。May 03, 2025 am 12:10 AM

Inpython,ListSusedynamicMemoryAllocationWithOver-Asalose,而alenumpyArraySallaySallocateFixedMemory.1)listssallocatemoremoremoremorythanneededinentientary上,respizeTized.2)numpyarsallaysallaysallocateAllocateAllocateAlcocateExactMemoryForements,OfferingPrediCtableSageButlessemageButlesseflextlessibility。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。