Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Mengaitkan Nilai Hilang dalam Pandas DataFrames Menggunakan Cara Kumpulan?

Bagaimanakah Saya Boleh Mengaitkan Nilai Hilang dalam Pandas DataFrames Menggunakan Cara Kumpulan?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-12-16 12:34:15171semak imbas

How Can I Impute Missing Values in Pandas DataFrames Using Group Means?

Mengimput Nilai Hilang dengan Min Kumpulan dalam Pandas DataFrames

Dalam tugasan manipulasi data, adalah perkara biasa untuk menemui nilai hilang yang dilambangkan sebagai NaN. Untuk menangani isu ini, satu pendekatan ialah mengisi nilai yang hilang ini dengan nilai min yang dikira dalam kumpulan tertentu.

Pertimbangkan contoh rangka data:

name value
A 1
A NaN
B NaN
B 2
B 3
B 1
C 3
C NaN
C 3

Matlamat kami adalah untuk menggantikan NaN nilai dengan min kumpulan yang sepadan bagi 'nilai'. Untuk mencapai matlamat ini, kita boleh memanfaatkan kaedah transform():

mean_values = df.groupby('name').transform(lambda x: x.fillna(x.mean()))
df["value"] = mean_values

Selepas pelaksanaan, kerangka data dikemas kini:

name value
A 1
A 1
B 2
B 2
B 3
B 1
C 3
C 3
C 3

Setiap nilai NaN telah digantikan dengan min kumpulan masing-masing , memelihara integriti data untuk analisis lanjut.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengaitkan Nilai Hilang dalam Pandas DataFrames Menggunakan Cara Kumpulan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn