Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengisi Nilai yang Hilang dalam Pandas DataFrames menggunakan Group Means?

Bagaimana untuk Mengisi Nilai yang Hilang dalam Pandas DataFrames menggunakan Group Means?

Barbara Streisand
Barbara Streisandasal
2024-12-07 01:09:12953semak imbas

How to Fill Missing Values in Pandas DataFrames using Group Means?

Mengisi Nilai Hilang dalam Kumpulan dengan Min

Anda diberi DataFrame panda dengan nilai yang tiada, dan anda berhasrat untuk mengisi nilai ini dengan min setiap kumpulan ditakrifkan oleh lajur tertentu. Tugas biasa ini boleh diselesaikan menggunakan pelbagai kaedah.

Menggunakan GroupBy dan Transformasi

Pendekatan berkesan melibatkan penggunaan fungsi groupby() dan transform():

grouped = df.groupby('name')
df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))

Dalam kod ini, kami mula-mula mengumpulkan DataFrame mengikut lajur 'nama' menggunakan groupby(). Kemudian, kami menggunakan fungsi lambda menggunakan transform() pada lajur 'nilai'. Fungsi ini memeriksa setiap kumpulan dan mengisi nilai yang hilang dengan min kumpulan itu. Hasil akhir disimpan kembali dalam lajur 'nilai' asal.

Dengan menggunakan teknik ini, anda boleh mengendalikan nilai yang hilang dengan cekap dengan menggantikannya dengan nilai bermakna yang diperoleh daripada data setiap kumpulan.

Atas ialah kandungan terperinci Bagaimana untuk Mengisi Nilai yang Hilang dalam Pandas DataFrames menggunakan Group Means?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn