Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk mengumpulkan Pandas DataFrame mengikut Dua Lajur dan Mengira Pemerhatian?
Frame Data Panda: Pengumpulan Mengikut Dua Lajur dan Pengiraan Pemerhatian
Dalam analisis data, selalunya menjadi perlu untuk mengumpulkan data berdasarkan lajur dan lajur tertentu. kira bilangan pemerhatian dalam setiap kumpulan. Untuk mencapai matlamat ini menggunakan Pandas DataFrame, mari kita teliti masalah berikut.
Pernyataan Masalah:
Pertimbangkan Pandas DataFrame dengan berbilang lajur. Matlamatnya adalah untuk mengumpulkan DataFrame berdasarkan dua lajur, iaitu 'col5' dan 'col2', dan mengira bilangan baris unik dalam setiap kumpulan. Selain itu, kami ingin menentukan kiraan terbesar bagi setiap nilai 'col2'.
Penyelesaian:
Untuk mengumpulkan DataFrame dan mengira baris dalam setiap kumpulan, kami boleh gunakan fungsi Pandas groupby(). Berikut ialah pendekatan langkah demi langkah:
Langkah 1: Himpunkan DataFrame
Kumpulkan DataFrame mengikut lajur 'col5' dan 'col2':
<code class="python">grouped_df = df.groupby(['col5', 'col2'])</code>
Langkah 2: Kira Baris
Gunakan fungsi size() pada DataFrame terkumpul untuk mengira bilangan baris unik dalam setiap kumpulan:
<code class="python">counts = grouped_df.size()</code>
Langkah 3: Cari Kiraan Maksimum untuk Setiap 'col2'
Untuk mencari kiraan terbesar bagi setiap nilai 'col2', kita boleh mengumpulkan lagi kiraan DataFrame mengikut 'col2' dan kemudian gunakan fungsi max():
<code class="python">max_counts = counts.groupby(level=1).max()</code>
Output:
Langkah di atas akan memberikan kita dua DataFrame berasingan:
Atas ialah kandungan terperinci Bagaimana untuk mengumpulkan Pandas DataFrame mengikut Dua Lajur dan Mengira Pemerhatian?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!