Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah saya boleh mengira kekerapan baris yang sama dalam DataFrame panda berdasarkan berbilang lajur?
Dapatkan Kiraan Frekuensi daripada Berbilang Lajur Bingkai Data
Untuk menentukan kekerapan baris yang sama dalam bingkai data, anda boleh menggunakan kaedah groupby() dengan fungsi saiz(). Teknik ini membolehkan anda mengira kejadian gabungan unik nilai merentas berbilang lajur.
Pertimbangkan bingkai data berikut:
Group | Size | ---------+------+ Short | Small | Short | Small | Moderate | Medium | Moderate | Small | Tall | Large |
Untuk mengira kekerapan setiap baris, kami boleh mengumpulkan bingkai data oleh lajur "Kumpulan" dan "Saiz" dan gunakan fungsi saiz() untuk menentukan bilangan kali setiap baris muncul:
<code class="python">import pandas as pd # Load the sample data data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data) # Option 1: dfg = df.groupby(by=["Group", "Size"]).size() # Option 2: Reset the index to convert the Series to a DataFrame dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time") # Option 3: Use as_index=False to create a DataFrame without an index dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
Bingkai data yang terhasil akan memberikan kiraan kekerapan untuk setiap gabungan "Kumpulan nilai " dan "Saiz". Sebagai contoh, output mungkin muncul seperti berikut:
Group | Size | Time --------+------+------ Moderate | Medium | 1 Moderate | Small | 1 Short | Small | 2 Tall | Large | 1
Atas ialah kandungan terperinci Bagaimanakah saya boleh mengira kekerapan baris yang sama dalam DataFrame panda berdasarkan berbilang lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!