首頁 >後端開發 >Python教學 >如何從單一檔案中提取多個 JSON 物件:Pythonic 解決方案

如何從單一檔案中提取多個 JSON 物件:Pythonic 解決方案

Linda Hamilton
Linda Hamilton原創
2024-10-29 18:20:02839瀏覽

How to Extract Multiple JSON Objects from a Single File: A Pythonic Solution

從單一檔案中提取多個JSON 物件

當遇到包含大量JSON 物件的JSON 檔案時,必須有一個全面的方法來提取提取特定資料。本文深入研究了從此類文件中提取「時間戳記」和「有用性」值的解決方案。

提供的 JSON 檔案結構展示了堆疊的 JSON 物件。若要解析和檢索所需的數據,請考慮使用 json.JSONDecoder.raw_decode 函數。此函數允許解碼任意大的 JSON 字串,同時遵守記憶體限制。

但是,需要注意的是,Python json 模組不接受帶有空格前綴的字串。因此,使用正規表示式來搜尋第一個非空白字符,作為解析的起點。

以下是解決此問題的修訂解決方案:

<code class="python">from json import JSONDecoder, JSONDecodeError
import re

NOT_WHITESPACE = re.compile(r'\S')

def decode_stacked(document, pos=0, decoder=JSONDecoder()):
    while True:
        match = NOT_WHITESPACE.search(document, pos)
        if not match:
            return
        pos = match.start()
        
        try:
            obj, pos = decoder.raw_decode(document, pos)
        except JSONDecodeError:
            # do something sensible if there's some error
            raise
        yield obj</code>

修改後的程式碼片段可以有效地解析給定文件中堆疊的JSON 對象,並在遇到每個對象時傳回該物件。這種方法避免了傳統 JSON 解析的限制,使其適合處理大型且可能複雜的 JSON 檔案。

以上是如何從單一檔案中提取多個 JSON 物件:Pythonic 解決方案的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn