Menggabungkan Berbilang Fail CSV ke dalam Satu DataFrame
Mengimport berbilang fail CSV ke dalam panda dan menggabungkannya menjadi satu DataFrame yang besar boleh dicapai menggunakan langkah berikut:
-
Baca CSV Fail: Gunakan glob.glob() untuk mendapatkan senarai semua fail CSV dalam direktori yang ditetapkan. Kemudian, baca setiap fail CSV menggunakan pd.read_csv(), dan simpan DataFrames yang terhasil dalam senarai.
import glob
import pandas as pd
# Get data file names
path = r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
-
Sambungkan DataFrames: Gunakan pd. concat() untuk menggabungkan semua DataFrames dalam senarai menjadi satu DataFrame. Tetapkan ignore_index=True untuk mengelakkan konflik indeks semasa menggabungkan.
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Pertimbangan Tambahan:
- Pastikan semua fail CSV mempunyai lajur yang sama untuk penyatuan yang berjaya.
- Jika fail CSV mempunyai nama lajur yang berbeza atau format, pertimbangkan untuk menggunakan langkah prapemprosesan tambahan untuk menjajarkannya sebelum menggabungkan.
- Untuk mengenal pasti setiap sampel data, tambah lajur baharu pada DataFrame dengan maklumat seperti nama fail atau pengecam unik.
Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Berbilang Fail CSV ke dalam Satu Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!
Kenyataan:Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn