Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Menggabungkan Berbilang Fail CSV ke dalam Satu Pandas DataFrame dalam Python?
Matlamat tugas ini adalah untuk mengimport berbilang fail CSV daripada direktori ke dalam satu DataFrame panda. Begini cara untuk mencapainya:
Pertama, import perpustakaan yang diperlukan untuk pengendalian fail dan manipulasi data:
import pandas as pd import glob import os
Untuk membaca dan menggabungkan fail CSV, ikuti ini langkah:
Berikut ialah contoh kod yang menggabungkan kod ini langkah:
# Get file names path = r"C:\DRO\DCL_rawdata_files" filenames = glob.glob(os.path.join(path, "*.csv")) dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename, header=0)) # Concatenate data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True)
Untuk membezakan antara data daripada fail CSV yang berbeza, anda boleh menambah lajur baharu untuk mengenal pasti setiap fail. Berikut ialah beberapa pilihan untuk berbuat demikian:
Pilihan 1: Tambahkan Nama Fail sebagai Lajur
for df in dfs: df["file_name"] = df.file_name.str.split("\").str[-1].str.split(".")[0]
Pilihan 2: Tambah Sumber Fail sebagai Lajur
df["Source"] = np.repeat([f"File{i}" for i in range(len(dfs))], [len(df) for df in dfs])
Dengan mengikuti langkah-langkah ini, anda boleh mengimport berbilang fail CSV dengan cekap ke dalam satu DataFrame yang kohesif dalam Python, menjadikannya mudah untuk menganalisis dan memproses data daripada pelbagai sumber.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menggabungkan Berbilang Fail CSV ke dalam Satu Pandas DataFrame dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!