Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menggantikan Nilai NaN dengan Cekap dalam Pandas DataFrames menggunakan `ffil` dan `bfill`?

Bagaimana untuk Menggantikan Nilai NaN dengan Cekap dalam Pandas DataFrames menggunakan `ffil` dan `bfill`?

Patricia Arquette
Patricia Arquetteasal
2024-12-01 19:05:10973semak imbas

How to Efficiently Replace NaN Values in Pandas DataFrames using `ffill` and `bfill`?

Menggantikan NaN dengan Nilai Sebelum atau Seterusnya dalam Pandas DataFrames

Apabila berurusan dengan Pandas DataFrames, data yang hilang diwakili sebagai NaNs (Bukan Nombor) boleh menimbulkan cabaran untuk analisis data. Satu tugas biasa ialah menggantikan NaN ini dengan nilai yang sesuai yang diperoleh daripada data sedia ada. Pendekatan yang mudah adalah untuk melelaran melalui DataFrame dan mengubah suai nilai secara eksplisit. Walau bagaimanapun, Pandas menawarkan penyelesaian yang lebih cekap yang mengelakkan penggunaan gelung.

Pengisian Hadapan (isi)

Untuk menggantikan NaN dengan nilai bukan NaN pertama di atasnya dalam lajur yang sama, gunakan kaedah fillna dengan pilihan ffill (isi hadapan). Kaedah ini menyebarkan pemerhatian sah terakhir ke hadapan kepada pemerhatian sah seterusnya.

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
df.fillna(method='ffill')

Output:

   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

Pertimbangan Tambahan

  • Baris pertama dalam DataFrame tidak boleh mengandungi NaN kerana ia berfungsi sebagai titik rujukan untuk pengisian.
  • Kaedah ffill beroperasi mengikut lajur, bermakna ia mengisi NaN dalam setiap lajur secara berasingan.
  • Untuk melakukan pengisian ke belakang (menggantikan NaN dengan nilai bukan NaN seterusnya di bawahnya), gunakan pilihan bfill (isi belakang).
  • Untuk mengubah suai inplace DataFrame tanpa membuat pembolehubah baharu, tetapkan parameter inplace kepada Benar:
df.fillna(method='ffill', inplace=True)

Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai NaN dengan Cekap dalam Pandas DataFrames menggunakan `ffil` dan `bfill`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn