Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?
Apabila cuba mencipta lajur baharu dalam DataFrame daripada hasil operasi jumlah kumpulan menggunakan panda, sesetengah pengguna menemui nilai NaN dalam lajur baharu. Isu utama timbul apabila cuba menetapkan jumlah khusus kumpulan kepada baris individu.
Kunci untuk menyelesaikan isu ini ialah menggunakan fungsi transformasi, yang mengembalikan Siri dengan indeksnya sejajar kepada DataFrame. Dengan menggunakan transformasi, anda boleh menambah hasil sebagai lajur baharu pada DataFrame anda.
Pertimbangkan coretan kod berikut:
import pandas as pd df = pd.DataFrame({ 'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05', '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'], 'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'], 'Data2': [11, 8, 10, 15, 110, 60, 100, 40], 'Data3': [5, 8, 6, 1, 50, 100, 60, 120] }) df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum') print(df)
Output:
Date Sym Data2 Data3 Data4 0 2015-05-08 aapl 11 5 55 1 2015-05-07 aapl 8 8 108 2 2015-05-06 aapl 10 6 66 3 2015-05-05 aapl 15 1 121 4 2015-05-08 aaww 110 50 55 5 2015-05-07 aaww 60 100 108 6 2015-05-06 aaww 100 60 66 7 2015-05-05 aaww 40 120 121
Sebagai digambarkan, setiap baris dalam lajur baharu, Data4, kini mencerminkan jumlah nilai Data3 untuk kumpulan tarikh yang sepadan, dengan berkesan menangani masalah awal nilai NaN.
Atas ialah kandungan terperinci Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!