Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?

Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?

Patricia Arquette
Patricia Arquetteasal
2024-12-14 14:05:13472semak imbas

How to Concatenate Strings from Multiple Pandas DataFrame Rows using GroupBy?

Menggabungkan Rentetan daripada Berbilang Baris menggunakan Pandas GroupBy

Untuk menggabungkan rentetan daripada berbilang baris dalam lajur menggunakan kumpulan Pandas, kita boleh memanfaatkan gabungan teknik kumpulan mengikut dan transformasi.

Pertimbangkan set data berikut, di mana kita mahu untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan":

import pandas as pd
from io import StringIO

data = StringIO(
    "\n".join([
        '"name1","hej","2014-11-01"',
        '"name1","du","2014-11-02"',
        '"name1","aj","2014-12-01"',
        '"name1","oj","2014-12-02"',
        '"name2","fin","2014-11-01"',
        '"name2","katt","2014-11-02"',
        '"name2","mycket","2014-12-01"',
        '"name2","lite","2014-12-01"'
    ])
)

# Load and process the data
df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"])
df["month"] = df["date"].apply(lambda x: x.month)

Untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan", kita boleh menggunakan fungsi groupby:

df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))

Sebagai alternatif, kita boleh menggunakan fungsi apply dan menetapkan semula indeks:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()

Ini akan menghasilkan lajur baharu yang mana nilai "teks" digabungkan untuk setiap kumpulan:

    name  month         text
0  name1     11           du
1  name1     12        aj,oj
2  name2     11     fin,katt
3  name2     12  mycket,lite

Dengan menggunakan teknik transformasi kumpulan mengikut, kami boleh menggabungkan rentetan daripada berbilang baris dengan cekap, meningkatkan analisis data dan pembentangan.

Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn