Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?

Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?

Patricia Arquette
Patricia Arquetteasal
2024-10-29 12:32:29522semak imbas

How to Efficiently Parse JSON Data with Multiple Embedded Objects in Python?

Cabaran Penghuraian JSON dengan Berbilang Objek Terbenam

Artikel ini menangani cabaran mengekstrak data daripada fail JSON yang mengandungi berbilang objek JSON bersarang. Fail sedemikian sering menimbulkan cabaran apabila berurusan dengan set data yang besar.

Pernyataan Masalah

Pertimbangkan fail JSON dengan berbilang objek JSON seperti berikut:

<code class="json">{"ID":"12345","Timestamp":"20140101", "Usefulness":"Yes",
 "Code":[{"event1":"A","result":"1"},…]}
{"ID":"1A35B","Timestamp":"20140102", "Usefulness":"No",
 "Code":[{"event1":"B","result":"1"},…]}
{"ID":"AA356","Timestamp":"20140103", "Usefulness":"No",
 "Code":[{"event1":"B","result":"0"},…]}
…</code>

Tugasnya adalah untuk mengekstrak nilai "Timestamp" dan "Kebergunaan" daripada setiap objek ke dalam bingkai data:

Timestamp Usefulness
20140101 Yes
20140102 No
20140103 No
... ...

Gambaran Keseluruhan Penyelesaian

Untuk menangani cabaran ini, kami menggunakan kaedah json.JSONDecoder.raw_decode dalam Python . Kaedah ini membolehkan penyahkodan rentetan besar objek JSON "bertindan". Ia mengembalikan kedudukan terakhir objek yang dihuraikan dan objek yang sah. Dengan menghantar kembali kedudukan yang dikembalikan kepada raw_decode, kita boleh menyambung semula penghuraian dari titik itu.

Pelaksanaan

<code class="python">from json import JSONDecoder, JSONDecodeError
import re

NOT_WHITESPACE = re.compile(r'\S')

def decode_stacked(document, pos=0, decoder=JSONDecoder()):
    while True:
        match = NOT_WHITESPACE.search(document, pos)
        if not match:
            return
        pos = match.start()
        
        try:
            obj, pos = decoder.raw_decode(document, pos)
        except JSONDecodeError:
            # Handle errors appropriately
            raise
        yield obj

s = """

{“a”: 1}  


[
1
,   
2
]


"""

for obj in decode_stacked(s):
    print(obj)</code>

Kod ini melelar melalui objek JSON dalam rentetan s dan mencetak setiap objek:

{'a': 1}
[1, 2]

Kesimpulan

Penyelesaian yang disediakan secara berkesan menangani cabaran mengekstrak data daripada berbilang objek JSON bersarang yang dibenamkan dalam satu fail. Dengan menggunakan kaedah json.JSONDecoder.raw_decode dan mengendalikan kemungkinan ralat, kami boleh memproses set data yang besar dengan cekap. Fungsi decode_stacked boleh digunakan sebagai alat boleh guna semula untuk mengendalikan format fail sedemikian.

Atas ialah kandungan terperinci Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn