在2024年8月,Openai宣布了其API的強大新功能 - 結構化輸出。顧名思義,使用此功能,您可以確保LLM僅以指定的格式生成響應。此功能將使需要精確數據格式的應用程序變得更加容易。
# List of hotel reviews reviews = [ "The room was clean and the staff was friendly.", "The location was terrible and the service was slow.", "The food was amazing but the room was too small.", ] # Classify sentiment for each review and print the results for review in reviews: sentiment = classify_sentiment(review) print(f"Review: {review}\nSentiment: {sentiment}\n")
Review: The room was clean and the staff was friendly. Sentiment: Positive Review: The location was terrible and the service was slow. Sentiment: Negative Review: The food was amazing but the room was too small. Sentiment: The sentiment of the review is neutral.即使前兩個響應是相同的單字格式,最後一個是整個句子。如果其他一些下游應用程序取決於上述代碼的輸出,則它將崩潰,因為它會期望單詞響應。
def classify_sentiment_with_structured_outputs(review): """Sentiment classifier with Structured Outputs""" ... # Classify sentiment for each review with Structured Outputs for review in reviews: sentiment = classify_sentiment_with_structured_outputs(review) print(f"Review: {review}\nSentiment: {sentiment}\n")
Review: The room was clean and the staff was friendly. Sentiment: {"sentiment":"positive"} Review: The location was terrible and the service was slow. Sentiment: {"sentiment":"negative"} Review: The food was amazing but the room was too small. Sentiment: {"sentiment":"neutral"}
3。驗證安裝:創建一個簡單的python腳本以驗證安裝: >運行腳本以確保正確設置所有內容。您應該在終端中看到模型的響應。
>: sentimentResponse是一個pydantic模型,它定義了輸出的預期結構。
如果您注意到,而不是使用client.chat.completions.create,我們使用的是client.beta.chat.completions.parse方法。 .parse()是專門為結構化輸出編寫的聊天完成API中的一種新方法。
如您所見,我們有一個sentermentresponse類的實例。這意味著我們可以使用.sentiment屬性以字符串而不是字典訪問情感: >
簡而言之,通過嵌套pydantic模型,您可以定義處理層次數據並為複雜輸出執行特定結構的複雜模式。 >新語言模型的廣泛特徵之一是函數調用(也稱為工具調用)。此功能使您可以將語言模型連接到用戶定義的功能,從而有效地(模型)訪問外部世界。
>重要的是,使用結構化輸出,使用OpenAI模型使用函數調用變得更加容易。過去,您將傳遞給OpenAI模型的功能將需要編寫複雜的JSON模式,並用類型提示概述每個功能參數。這是一個示例: >即使get_current_weather函數具有兩個參數,其JSON模式也變得巨大且容易出錯。
這是如何將此工具作為請求的一部分使用: >由於上面的查詢是“東京的天氣是什麼?”,我們在返回消息對象的tool_calls中看到了一個電話。
>由我們通過提供的參數調用該函數: 如果您希望該模型生成該功能的參數並同時調用它,則您正在尋找AI代理。 >
使用OpenAI結構化輸出 在使用結構化輸出時,請記住許多最佳實踐和建議。在本節中,我們將概述其中的一些。
這是一個示例pydantic模型,用於指定我們的評論情感分類器的格式:def classify_sentiment_with_structured_outputs(review):
"""Sentiment classifier with Structured Outputs"""
# Classify sentiment for each review with Structured Outputs
for review in reviews:
sentiment = classify_sentiment_with_structured_outputs(review)
print(f"Review: {review}\nSentiment: {sentiment}\n")
然後,我們編寫了一個使用.parse()助手方法的新功能:Review: The room was clean and the staff was friendly.
Sentiment: {"sentiment":"positive"}
Review: The location was terrible and the service was slow.
Sentiment: {"sentiment":"negative"}
Review: The food was amazing but the room was too small.
Sentiment: {"sentiment":"neutral"}
> UserInfo是一種pydantic模型,其中包含地址對象列表,以及用戶名稱,電子郵件和電話號碼的字段。
接下來,我們使用這些嵌套的pydantic模型來在OpenAI API調用中強制執行輸出結構:
>保持模式簡單明了,以獲得最準確的結果。 拒絕模型。使用新的.parse()方法時,消息對象具有新的.refusal屬性,以表示拒絕:
在本教程中,我們學會瞭如何使用新的OpenAI API功能開始:結構化輸出。我們已經看到該特徵是如何迫使語言模型以我們指定的格式產生輸出。我們已經學會瞭如何將其與函數調用結合使用,並探索了一些最佳實踐來充分利用該功能。 >使用OpenAI API課程