Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?

Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?

Barbara Streisand
Barbara Streisandasal
2024-12-22 19:59:17700semak imbas

How to Avoid NaN Values When Adding Grouped Sums as a New Column in Pandas?

Mencipta Lajur Baharu daripada Penjumlahan Berkumpulan

Masalah

Apabila cuba mencipta lajur baharu dalam DataFrame daripada hasil operasi jumlah kumpulan menggunakan panda, sesetengah pengguna menemui nilai NaN dalam lajur baharu. Isu utama timbul apabila cuba menetapkan jumlah khusus kumpulan kepada baris individu.

Penyelesaian

Kunci untuk menyelesaikan isu ini ialah menggunakan fungsi transformasi, yang mengembalikan Siri dengan indeksnya sejajar kepada DataFrame. Dengan menggunakan transformasi, anda boleh menambah hasil sebagai lajur baharu pada DataFrame anda.

Pertimbangkan coretan kod berikut:

import pandas as pd

df = pd.DataFrame({
    'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05',
             '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'],
    'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'],
    'Data2': [11, 8, 10, 15, 110, 60, 100, 40],
    'Data3': [5, 8, 6, 1, 50, 100, 60, 120]
})

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')

print(df)

Output:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121

Sebagai digambarkan, setiap baris dalam lajur baharu, Data4, kini mencerminkan jumlah nilai Data3 untuk kumpulan tarikh yang sepadan, dengan berkesan menangani masalah awal nilai NaN.

Atas ialah kandungan terperinci Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn