Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menggantikan Nilai NaN dalam Lajur Pandas DataFrame?
Apabila bekerja dengan DataFrames panda, adalah perkara biasa untuk menemui nilai yang tiada yang diwakili sebagai NaN (Bukan Nombor). Mengendalikan nilai ini adalah penting untuk memastikan analisis data yang tepat dan mengelakkan ralat. Artikel ini menyediakan panduan komprehensif tentang cara menggantikan nilai NaN dalam lajur DataFrame.
DataFrame berikut mengandungi lajur bernama "Amount" dengan beberapa nilai NaN:
Date Amount 67 2012-09-30 00:00:00 65211 68 2012-09-09 00:00:00 29424 69 2012-09-16 00:00:00 29877 70 2012-09-23 00:00:00 30990 71 2012-09-30 00:00:00 61303 72 2012-09-09 00:00:00 71781 73 2012-09-16 00:00:00 NaN 74 2012-09-23 00:00:00 11072 75 2012-09-30 00:00:00 113702 76 2012-09-09 00:00:00 64731 77 2012-09-16 00:00:00 NaN
Yang paling banyak kaedah mudah untuk menggantikan nilai NaN menggunakan kaedah fillna(). Ia membolehkan anda menentukan nilai atau fungsi untuk mengisi data yang hilang:
df['Amount'] = df['Amount'].fillna(0)
Ini akan menggantikan semua nilai NaN dalam lajur "Jumlah" dengan 0.
Untuk mengisi nilai NaN dengan nilai khusus, gunakan:
df['Amount'].fillna({NaN: 100})
Ini akan menggantikan nilai NaN dengan 100.
Anda juga boleh mengisi nilai NaN berdasarkan nilai dalam lajur lain:
df['Amount'].fillna(df['Amount'].mean())
Ini akan isikan nilai NaN dengan nilai min lajur "Amaun".
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai NaN dalam Lajur Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!