Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Menggabungkan Berbilang Fail CSV dengan Cekap ke dalam Bingkai Data Panda Tunggal?

Bagaimanakah Saya Boleh Menggabungkan Berbilang Fail CSV dengan Cekap ke dalam Bingkai Data Panda Tunggal?

Barbara Streisand
Barbara Streisandasal
2024-12-18 08:45:10449semak imbas

How Can I Efficiently Combine Multiple CSV Files into a Single Pandas DataFrame?

Membaca dan Menggabungkan Berbilang Fail CSV ke dalam Satu DataFrame

Senario Masalah

Tugasnya ialah membaca berbilang fail CSV daripada direktori ke dalam panda dan menggabungkannya menjadi satu DataFrame.

panda Metodologi

Panda menawarkan kaedah intuitif untuk menggabungkan berbilang bingkai data:

  • pd.concat(dfs, ignore_index=True): Menggabungkan bingkai data secara menegak, mengabaikan indeks asal.

Pelaksanaan

Untuk mencapai hasil yang diingini, setiap fail CSV dibaca ke dalam bingkai data. Kaedah concat kemudiannya digunakan untuk menggabungkan bingkai data individu ini menjadi satu DataFrame komprehensif.

Coretan Kod:

import glob
import pandas as pd

path = r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename, header=0))

big_frame = pd.concat(dfs, ignore_index=True)

print(big_frame)

Nota Tambahan

  • Pastikan semua fail CSV mempunyai lajur yang sama, kerana concat memerlukan lajur seragam struktur.
  • Pertimbangkan untuk menambah lajur untuk mengenal pasti setiap sumber data bagi tujuan kebolehkesanan.
  • Gunakan pathlib untuk keupayaan pengendalian fail yang lebih maju.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menggabungkan Berbilang Fail CSV dengan Cekap ke dalam Bingkai Data Panda Tunggal?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn