當我在 ChatGPT-3.5 發布後第一次嘗試它時,我對它在各種應用程式中的潛力感到興奮。然而,當我遇到一個主要障礙時,我的興奮很快就消失了:儘管它返回的有價值的資訊非常可讀,但它並不是應用程式可以可靠攝取的形式。諷刺的是,法學碩士擅長從非結構化文字中提取訊息,但只能以非結構化形式傳回訊息。試著以程式設計方式從法學碩士中提取結果感覺就像是在一家令人難以置信的餐廳,提供最美味的食物,但沒有任何器具- 你可以看到它並聞到它,但你就是無法到達它。
我嘗試了書中的每一個技巧來哄騙它給我一些類似的結構化資料。 「請用橫線或新行分隔每個項目並跳過評論,」我懇求道。有時有效,有時無效。有時它會「有幫助地」對物品進行編號或重新排序,就像一個善意但有點困惑的助手。其他時候,它仍然會偷偷地加入一些評論,讓人想起一個健談的同事。我甚至明確要求它只返回 JSON,但有時它會遺漏一個逗號——幾乎就像是在進行被動攻擊一樣。最終,我放棄了,不情願地回到了傳統演算法的不太令人興奮但更可預測的範圍。
幸運的是,幾個月後,OpenAI 引入了 JSON 模式,該功能強制 LLM 返回有效的 JSON。我決定嘗試此功能,發現它對於處理應用程式中的結果更加有效。以下是啟用 JSON 模式的輸出範例:
PROMPT: Parse the following sentence into words and then return the results as a list of the original word and the translation in English and return the results in JSON. -- sentence -- 早安 RESULTS: { "results": [ { "original": "早安", "translation": "Good morning" } ] }
這個輸出無疑是個進步。但是,雖然輸出是有效的 JSON,但其結構可能會根據提示的內容而有所不同。更可預測的方法是指定所需的返回格式。實現這一目標的一種方法是提供一個範例 JSON 結構供 LLM 遵循。此方法涉及創建範例並編寫程式碼來解析它。如果結構發生變化,兩處都必須修改。
另一種方法是定義一個資料傳輸物件 (DTO) 來保存結果,並使用它來指示 LLM 並解析結果,從而避免同步問題。先定義DTO,例如:
record Entries(List<Entry> entries) { record Entry(String originalWord, String wordInEnglish, String pronunciation) {} }
現在DTO可以在提示指令中使用,也可以在解析程式碼中使用:
// Construct the prompt with the output schema. var prompt = MessageFormat.format(""" Parse the following sentence into English and return the results in JSON according to the following JSON schema. 人工智慧將引領未來,以智慧之光照亮人類無限可能的前程。 --- output json schema --- {0} """, jsonSchemaOf(Entries.class)); var result = sendPrompt(prompt, Entries.class);
這是使用 Jackson JSON Schema 產生器的程式碼:
PROMPT: Parse the following sentence into words and then return the results as a list of the original word and the translation in English and return the results in JSON. -- sentence -- 早安 RESULTS: { "results": [ { "original": "早安", "translation": "Good morning" } ] }
注意:預設情況下,產生的模式將包含用於引用的 ID 字段,這可能會浪費令牌。請參閱儲存庫 OpenAI JSON 模式範例,以了解刪除這些未使用的 ID 的程式碼。
最後,這是使用 Azure OpenAI Java SDK 向 OpenAI 發送提示的程式碼:
record Entries(List<Entry> entries) { record Entry(String originalWord, String wordInEnglish, String pronunciation) {} }
該解決方案在大多數情況下都有效。 LLM 可以有效地理解 JSON 模式,但需要注意的是:我見過有時會出錯的情況。例如,如果欄位是字串且其名稱是複數(例如“exampleValues”),則 LLM 有時會堅持傳回字串陣列。
法學碩士可以產生顯著的成果,有時超越一般人的能力。然而,有趣的是,至少目前,他們正在努力完成可靠地格式化生成的輸出的更平凡的任務。
以上是使用 OpenAI JSON 模式和 JSON 模式簡化資料擷取的詳細內容。更多資訊請關注PHP中文網其他相關文章!