Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk melakukan pengagregatan dan pengelompokan data dalam Python

Bagaimana untuk melakukan pengagregatan dan pengelompokan data dalam Python

WBOY
WBOYasal
2023-10-18 11:03:461107semak imbas

Bagaimana untuk melakukan pengagregatan dan pengelompokan data dalam Python

Cara mengagregat dan mengumpulkan data dalam Python

Dalam proses analisis dan pemprosesan data, selalunya perlu untuk mengagregat dan mengumpulkan data. Python menyediakan pelbagai perpustakaan dan alatan yang berkuasa untuk memudahkan pengagregatan data dan operasi pengelompokan. Artikel ini akan memperkenalkan cara menggunakan pustaka panda untuk pengagregatan dan pengelompokan data dalam Python, dan memberikan contoh kod khusus.

1. Pengagregatan data
Penggabungan data ialah operasi penggabungan berbilang data menjadi satu atau sebilangan kecil data. Dalam Python, anda boleh menggunakan fungsi groupby() dalam pustaka panda untuk pengagregatan data.

Kod sampel adalah seperti berikut:

import pandas as pd

# 创建一个示例数据集
data = pd.DataFrame({'A': ['apple', 'orange', 'banana', 'apple', 'banana'],
                     'B': ['red', 'orange', 'yellow', 'green', 'yellow'],
                     'C': [1, 2, 3, 4, 5]})

# 按照A列进行聚合,计算C列的总和
result = data.groupby('A')['C'].sum()

print(result)

Jalankan kod di atas dan hasil output adalah seperti berikut:

A
apple     5
banana    8
orange    2
Name: C, dtype: int64

Antaranya, fungsi groupby() menentukan pengagregatan mengikut lajur 'A', dan jumlah() fungsi mengira jumlah lajur 'C'.

2. Pengumpulan Data
Pengumpulan data ialah operasi pengelompokan data mengikut standard tertentu. Begitu juga, dalam Python, anda boleh menggunakan fungsi groupby() dalam perpustakaan panda untuk pengumpulan data.

Kod sampel adalah seperti berikut:

import pandas as pd

# 创建一个示例数据集
data = pd.DataFrame({'A': ['apple', 'orange', 'banana', 'apple', 'banana'],
                     'B': ['red', 'orange', 'yellow', 'green', 'yellow'],
                     'C': [1, 2, 3, 4, 5]})

# 按照A列进行分组
grouped_data = data.groupby('A')

# 遍历每个组
for name, group in grouped_data:
    print(name)
    print(group)
    print()

Jalankan kod di atas, hasil output adalah seperti berikut:

apple
       A      B  C
0  apple    red  1
3  apple  green  4

banana
        A       B  C
2  banana  yellow  3
4  banana  yellow  5

orange
        A       B  C
1  orange  orange  2

Gunakan fungsi groupby() untuk mengumpulkan data mengikut lajur 'A', ulangi setiap kumpulan dan keluaran. Seperti yang anda lihat, data berjaya dikumpulkan dan dikeluarkan mengikut nilai berbeza lajur 'A'.

3. Aplikasi gabungan pengagregatan dan pengelompokan data
Dalam pemprosesan data sebenar, selalunya perlu untuk menggabungkan pengagregatan dan pengelompokan. Contohnya, dalam set data jualan, anda boleh mengumpulkan mengikut kategori produk yang berbeza dan mengira jumlah jualan untuk setiap kategori.

Kod sampel adalah seperti berikut:

import pandas as pd

# 创建一个示例数据集
data = pd.DataFrame({'Category': ['Fruit', 'Vegetable', 'Fruit', 'Vegetable', 'Fruit'],
                     'Product': ['Apple', 'Carrot', 'Orange', 'Broccoli', 'Banana'],
                     'Sales': [100, 200, 150, 250, 120]})

# 按照Category列进行分组,并计算Sales列的总和
result = data.groupby('Category')['Sales'].sum()

print(result)

Jalankan kod di atas dan hasil output adalah seperti berikut:

Category
Fruit        370
Vegetable    450
Name: Sales, dtype: int64

Dalam kod di atas, data pertama kali dikumpulkan mengikut lajur 'Kategori' melalui fungsi groupby(), dan kemudian fungsi sum() digunakan untuk mengira setiap kategori jumlah jualan.

Ringkasan:
Artikel ini memperkenalkan cara menggunakan perpustakaan panda untuk pengagregatan dan pengelompokan data dalam Python. Fungsi groupby() boleh digunakan untuk mengagregat dan mengumpulkan data, dan boleh digabungkan dengan fungsi lain untuk melaksanakan operasi yang lebih kompleks. Pengumpulan dan pengelompokan data adalah langkah penting dalam pemprosesan data dan sangat berguna untuk analisis dan statistik data. Saya harap artikel ini akan membantu semua orang dalam pengagregatan dan pengelompokan data dalam Python.

Atas ialah kandungan terperinci Bagaimana untuk melakukan pengagregatan dan pengelompokan data dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn