Rumah >pembangunan bahagian belakang >Tutorial Python >Kemahiran membaca data JSON dalam Pandas

Kemahiran membaca data JSON dalam Pandas

WBOY
WBOYasal
2024-01-04 08:15:551877semak imbas

Kemahiran membaca data JSON dalam Pandas

Petua untuk membaca data JSON menggunakan Pandas

Ikhtisar:
Panda ialah alat analisis data yang berkuasa dan JSON ialah format pertukaran data biasa. Semasa proses analisis data, kita sering menghadapi situasi di mana kita perlu membaca data JSON. Artikel ini akan memperkenalkan beberapa teknik untuk membaca data JSON menggunakan Panda dan memberikan contoh kod khusus.

  1. Gunakan fungsi read_json() untuk membaca data JSON
    Pandas menyediakan fungsi read_json() untuk membaca data JSON. Fungsi ini memuatkan data JSON ke dalam Pandas DataFrame. Berikut ialah contoh kod untuk membaca data JSON menggunakan fungsi read_json():
import pandas as pd

# 读取JSON文件
df = pd.read_json('data.json')

# 打印DataFrame的前几行
print(df.head())

Dalam kod di atas, kami menggunakan fungsi read_json() untuk membaca fail JSON bernama "data.json" dan memuatkannya ke dalam df pembolehubah. Kemudian gunakan fungsi head() untuk mencetak beberapa baris pertama DataFrame.

  1. Memproses data JSON bersarang
    Kadangkala, terdapat struktur bersarang dalam data JSON Contohnya, nilai medan ialah objek JSON yang mengandungi berbilang medan. Apabila membaca data JSON bersarang tersebut, kita boleh menggunakan parameter "lines" bagi fungsi read_json() dalam kombinasi dengan fungsi json_normalize() untuk meratakan data bersarang. Berikut ialah contoh:
import pandas as pd
from pandas.io.json import json_normalize

# 读取包含嵌套JSON数据的文件
with open('data.json') as f:
    data = json.load(f)
    
# 使用json_normalize()函数展平嵌套的数据
df = pd.json_normalize(data)

# 打印DataFrame的前几行
print(df.head())

Dalam kod di atas, kami mula-mula menggunakan fungsi open() untuk membuka fail yang mengandungi data JSON bersarang dan menggunakan fungsi json.load() untuk memuatkan data. Kemudian gunakan fungsi json_normalize() untuk meratakan data bersarang dan menyimpan hasilnya ke dalam pembolehubah df.

  1. Baca data bersarang dalam tatasusunan JSON
    Kadangkala, nilai medan data JSON ialah tatasusunan JSON. Apabila membaca data dalam kes ini, kita boleh menukar tatasusunan JSON kepada Siri Pandas dan mengembangkan tatasusunan menggunakan fungsi explode(). Berikut ialah contoh:
import pandas as pd

# 读取包含嵌套JSON数组的文件
df = pd.read_json('data.json')

# 将JSON数组转换为Series,并使用explode()函数展开
df['array_field'] = df['array_field'].apply(pd.Series).explode('array_field')

# 打印DataFrame的前几行
print(df.head())

Dalam kod di atas, kami menggunakan fungsi read_json() untuk membaca fail yang mengandungi tatasusunan JSON bersarang dan memuatkannya ke dalam pembolehubah df. Tatasusunan JSON kemudiannya ditukar kepada Siri Pandas dan dikembangkan menggunakan fungsi explode(). Akhirnya cetak beberapa baris pertama DataFrame.

Ringkasan:
Artikel ini memperkenalkan beberapa teknik untuk membaca data JSON menggunakan Panda dan menyediakan contoh kod khusus. Dengan memahami petua ini, anda boleh bekerja dengan data JSON dengan lebih fleksibel dan menjadikan analisis data lebih pantas dan cekap. Semoga artikel ini bermanfaat kepada anda.

Atas ialah kandungan terperinci Kemahiran membaca data JSON dalam Pandas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn