Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?
Artikel ini menangani cabaran mengekstrak data daripada fail JSON yang mengandungi berbilang objek JSON bersarang. Fail sedemikian sering menimbulkan cabaran apabila berurusan dengan set data yang besar.
Pertimbangkan fail JSON dengan berbilang objek JSON seperti berikut:
<code class="json">{"ID":"12345","Timestamp":"20140101", "Usefulness":"Yes", "Code":[{"event1":"A","result":"1"},…]} {"ID":"1A35B","Timestamp":"20140102", "Usefulness":"No", "Code":[{"event1":"B","result":"1"},…]} {"ID":"AA356","Timestamp":"20140103", "Usefulness":"No", "Code":[{"event1":"B","result":"0"},…]} …</code>
Tugasnya adalah untuk mengekstrak nilai "Timestamp" dan "Kebergunaan" daripada setiap objek ke dalam bingkai data:
Timestamp | Usefulness |
---|---|
20140101 | Yes |
20140102 | No |
20140103 | No |
... | ... |
Untuk menangani cabaran ini, kami menggunakan kaedah json.JSONDecoder.raw_decode dalam Python . Kaedah ini membolehkan penyahkodan rentetan besar objek JSON "bertindan". Ia mengembalikan kedudukan terakhir objek yang dihuraikan dan objek yang sah. Dengan menghantar kembali kedudukan yang dikembalikan kepada raw_decode, kita boleh menyambung semula penghuraian dari titik itu.
<code class="python">from json import JSONDecoder, JSONDecodeError import re NOT_WHITESPACE = re.compile(r'\S') def decode_stacked(document, pos=0, decoder=JSONDecoder()): while True: match = NOT_WHITESPACE.search(document, pos) if not match: return pos = match.start() try: obj, pos = decoder.raw_decode(document, pos) except JSONDecodeError: # Handle errors appropriately raise yield obj s = """ {“a”: 1} [ 1 , 2 ] """ for obj in decode_stacked(s): print(obj)</code>
Kod ini melelar melalui objek JSON dalam rentetan s dan mencetak setiap objek:
{'a': 1} [1, 2]
Penyelesaian yang disediakan secara berkesan menangani cabaran mengekstrak data daripada berbilang objek JSON bersarang yang dibenamkan dalam satu fail. Dengan menggunakan kaedah json.JSONDecoder.raw_decode dan mengendalikan kemungkinan ralat, kami boleh memproses set data yang besar dengan cekap. Fungsi decode_stacked boleh digunakan sebagai alat boleh guna semula untuk mengendalikan format fail sedemikian.
Atas ialah kandungan terperinci Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!