使用 OpenAI JSON 模式和 JSON 模式簡化資料擷取-js教程-PHP中文網

首頁

web前端

js教程

使用 OpenAI JSON 模式和 JSON 模式簡化資料擷取

Patricia Arquette

Jan 04, 2025 pm 12:59 PM

Simplifying Data Extraction with OpenAI JSON Mode and JSON Schemas

當我在 ChatGPT-3.5 發布後第一次嘗試它時，我對它在各種應用程式中的潛力感到興奮。然而，當我遇到一個主要障礙時，我的興奮很快就消失了：儘管它返回的有價值的資訊非常可讀，但它並不是應用程式可以可靠攝取的形式。諷刺的是，法學碩士擅長從非結構化文字中提取訊息，但只能以非結構化形式傳回訊息。試著以程式設計方式從法學碩士中提取結果感覺就像是在一家令人難以置信的餐廳，提供最美味的食物，但沒有任何器具- 你可以看到它並聞到它，但你就是無法到達它。

我嘗試了書中的每一個技巧來哄騙它給我一些類似的結構化資料。「請用橫線或新行分隔每個項目並跳過評論，」我懇求道。有時有效，有時無效。有時它會「有幫助地」對物品進行編號或重新排序，就像一個善意但有點困惑的助手。其他時候，它仍然會偷偷地加入一些評論，讓人想起一個健談的同事。我甚至明確要求它只返回 JSON，但有時它會遺漏一個逗號——幾乎就像是在進行被動攻擊一樣。最終，我放棄了，不情願地回到了傳統演算法的不太令人興奮但更可預測的範圍。

幸運的是，幾個月後，OpenAI 引入了 JSON 模式，該功能強制 LLM 返回有效的 JSON。我決定嘗試此功能，發現它對於處理應用程式中的結果更加有效。以下是啟用 JSON 模式的輸出範例：

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}

這個輸出無疑是個進步。但是，雖然輸出是有效的 JSON，但其結構可能會根據提示的內容而有所不同。更可預測的方法是指定所需的返回格式。實現這一目標的一種方法是提供一個範例 JSON 結構供 LLM 遵循。此方法涉及創建範例並編寫程式碼來解析它。如果結構發生變化，兩處都必須修改。

另一種方法是定義一個資料傳輸物件 (DTO) 來保存結果，並使用它來指示 LLM 並解析結果，從而避免同步問題。先定義DTO，例如：‍

record Entries(List<entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
</entry>

現在DTO可以在提示指令中使用，也可以在解析程式碼中使用：

// Construct the prompt with the output schema.
var prompt = MessageFormat.format("""
   Parse the following sentence into English and return the results
   in JSON according to the following JSON schema.

   人工智慧將引領未來，以智慧之光照亮人類無限可能的前程。
   --- output json schema ---
   {0}
   """, jsonSchemaOf(Entries.class));
   var result = sendPrompt(prompt, Entries.class);

這是使用 Jackson JSON Schema 產生器的程式碼：

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}

注意：預設情況下，產生的模式將包含用於引用的 ID 字段，這可能會浪費令牌。請參閱儲存庫 OpenAI JSON 模式範例，以了解刪除這些未使用的 ID 的程式碼。

最後，這是使用 Azure OpenAI Java SDK 向 OpenAI 發送提示的程式碼：

record Entries(List<entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
</entry>

該解決方案在大多數情況下都有效。 LLM 可以有效地理解 JSON 模式，但需要注意的是：我見過有時會出錯的情況。例如，如果欄位是字串且其名稱是複數（例如“exampleValues”），則 LLM 有時會堅持傳回字串陣列。

法學碩士可以產生顯著的成果，有時超越一般人的能力。然而，有趣的是，至少目前，他們正在努力完成可靠地格式化生成的輸出的更平凡的任務。

以上是使用 OpenAI JSON 模式和 JSON 模式簡化資料擷取的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

JavaScript數據類型：瀏覽器和nodejs之間是否有區別？May 14, 2025 am 12:15 AM

JavaScript核心數據類型在瀏覽器和Node.js中一致，但處理方式和額外類型有所不同。 1)全局對像在瀏覽器中為window，在Node.js中為global。 2)Node.js獨有Buffer對象，用於處理二進制數據。 3)性能和時間處理在兩者間也有差異，需根據環境調整代碼。

JavaScript評論：使用//和 / * * / * / * /May 13, 2025 pm 03:49 PM

JavaScriptusestwotypesofcomments:single-line(//)andmulti-line(//).1)Use//forquicknotesorsingle-lineexplanations.2)Use//forlongerexplanationsorcommentingoutblocksofcode.Commentsshouldexplainthe'why',notthe'what',andbeplacedabovetherelevantcodeforclari

Python vs. JavaScript：開發人員的比較分析May 09, 2025 am 12:22 AM

Python和JavaScript的主要區別在於類型系統和應用場景。 1.Python使用動態類型，適合科學計算和數據分析。 2.JavaScript採用弱類型，廣泛用於前端和全棧開發。兩者在異步編程和性能優化上各有優勢，選擇時應根據項目需求決定。

Python vs. JavaScript：選擇合適的工具May 08, 2025 am 12:10 AM

選擇Python還是JavaScript取決於項目類型：1)數據科學和自動化任務選擇Python；2)前端和全棧開發選擇JavaScript。 Python因其在數據處理和自動化方面的強大庫而備受青睞，而JavaScript則因其在網頁交互和全棧開發中的優勢而不可或缺。

Python和JavaScript：了解每個的優勢May 06, 2025 am 12:15 AM

Python和JavaScript各有優勢，選擇取決於項目需求和個人偏好。 1.Python易學，語法簡潔，適用於數據科學和後端開發，但執行速度較慢。 2.JavaScript在前端開發中無處不在，異步編程能力強，Node.js使其適用於全棧開發，但語法可能複雜且易出錯。

JavaScript的核心：它是在C還是C上構建的？May 05, 2025 am 12:07 AM

javascriptisnotbuiltoncorc; sanInterpretedlanguagethatrunsonenginesoftenwritteninc.1）JavascriptwasdesignedAsignedAsalightWeight，drackendedlanguageforwebbrowsers.2）Enginesevolvedfromsimpleterterpretpretpretpretpreterterpretpretpretpretpretpretpretpretpretcompilerers，典型地，替代品。

JavaScript應用程序：從前端到後端May 04, 2025 am 12:12 AM

JavaScript可用於前端和後端開發。前端通過DOM操作增強用戶體驗，後端通過Node.js處理服務器任務。 1.前端示例：改變網頁文本內容。 2.後端示例：創建Node.js服務器。

Python vs. JavaScript：您應該學到哪種語言？May 03, 2025 am 12:10 AM

選擇Python還是JavaScript應基於職業發展、學習曲線和生態系統：1)職業發展：Python適合數據科學和後端開發，JavaScript適合前端和全棧開發。 2)學習曲線：Python語法簡潔，適合初學者；JavaScript語法靈活。 3)生態系統：Python有豐富的科學計算庫，JavaScript有強大的前端框架。

See all articles