Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menggantikan Nilai Kosong dengan NaN dalam Pandas DataFrames?
Menggantikan Nilai Kosong dengan NaN dalam Panda
Dalam bingkai data Pandas, selalunya perlu mengenal pasti dan menggantikan nilai ruang kosong (" ") dengan nilai NaN. Operasi ini memastikan integriti data dan membolehkan analisis yang lancar.
Satu cara yang cekap untuk mencapainya ialah melalui kaedah Pandas replace(). Sintaksnya adalah seperti berikut:
<code class="python">df.replace(to_replace, value, regex=True)</code>
Dalam konteks ini:
Untuk menggantikan nilai kosong dengan NaN, anda boleh menggunakan kod berikut:
<code class="python">import pandas as pd import numpy as np # Create a sample dataframe df = pd.DataFrame({ "A": [-0.532681, 1.490752, -1.387326, 0.814772, -0.222552, -1.176781], "B": ['foo', 'bar', 'foo', 'baz', ' ','qux'], "C": [0, 1, 2, ' ', 4, ' '] }) # Replace blank values with NaN df = df.replace(r'^\s*$', np.nan, regex=True) # Display the updated dataframe print(df)</code>
Output:
A B C 0 -0.532681 foo 0 1 1.490752 bar 1 2 -1.387326 foo 2 3 0.814772 baz NaN 4 -0.222552 NaN 4 5 -1.176781 qux NaN
Kod ini berkesan menggantikan semua nilai kosong dalam bingkai data dengan NaN, memberikan perwakilan data anda yang lebih bersih dan tepat.
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai Kosong dengan NaN dalam Pandas DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!