Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?

Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?

Barbara Streisand
Barbara Streisandasal
2024-11-25 15:25:16824semak imbas

How to Efficiently Merge Multiple Pandas DataFrames Based on a Common Column?

Menggabungkan Berbilang Bingkai Data pada Lajur dalam Panda dengan Gabungan Tiga Hala

Penggabungan data, tugas asas dalam analisis data, membolehkan anda menggabungkan data daripada pelbagai sumber. Dalam Pandas, fungsi join() ialah alat yang berkuasa untuk menggabungkan bingkai data. Walau bagaimanapun, apabila menyertai berbilang bingkai data, anda mungkin menghadapi cabaran yang berkaitan dengan skim pengindeksan hierarki.

Gabungan Tiga Hala Menggunakan Lajur Biasa

Pertimbangkan senario di mana anda mempunyai tiga Fail CSV, setiap satu mengandungi maklumat tentang kumpulan orang yang sama. Lajur pertama dalam setiap fail ialah nama orang itu, manakala lajur seterusnya mewakili atribut mereka. Matlamat anda adalah untuk menggabungkan fail ini menjadi satu CSV, dengan setiap baris mengandungi semua atribut untuk setiap orang yang unik.

Pengindeksan Hierarki dan Berbilang Indeks

Dalam Panda, multi-indeks merujuk kepada skema pengindeksan di mana setiap tahap indeks mewakili lajur yang berbeza. Apabila menyertai bingkai data, indeks berbilang digunakan untuk menjajarkan data berdasarkan nilai yang dikongsi. Dalam kes anda, fungsi "sertai" mungkin menyatakan bahawa anda memerlukan berbilang indeks kerana anda bergabung pada satu lajur (nama), yang merupakan indeks dalam setiap bingkai data.

Menggabungkan Bingkai Data tanpa Pengindeksan Hierarki

Walau bagaimanapun, sesetengah senario mungkin tidak memerlukan pengindeksan hierarki. Jika bingkai data mempunyai lajur biasa, anda boleh menggunakan fungsi lambda dan pakej functools untuk memudahkan proses penggabungan. Berikut ialah contoh:

import pandas as pd
import functools as ft

dfs = [df1, df2, df3, ..., dfN]

df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)

Dalam kod ini:

  • dfs ialah senarai yang mengandungi bingkai data yang akan digabungkan.
  • ft.reduce menggunakan fungsi lambda pada setiap pasangan bingkai data, menggabungkannya berdasarkan lajur "nama".
  • df_final ialah bingkai data yang terhasil, mengandungi semua atribut untuk setiap orang yang unik.

Pendekatan ini mudah untuk menggabungkan berbilang bingkai data tanpa perlu menentukan skim pengindeksan hierarki yang kompleks.

Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn