首頁 >後端開發 >Python教學 >如何將多個 CSV 檔案合併到單一 Pandas DataFrame 中?

如何將多個 CSV 檔案合併到單一 Pandas DataFrame 中?

DDD
DDD原創
2024-12-21 06:12:11272瀏覽

How to Combine Multiple CSV Files into a Single Pandas DataFrame?

將多個CSV 檔案串聯成一個DataFrame

將多個CSV 檔案匯入pandas 並將它們串聯成一個大DataFrame 可以使用以下步驟:

  1. 閱讀CSV檔案: 使用 glob.glob() 取得指定目錄下所有 CSV 檔案的清單。然後,使用 pd.read_csv() 讀取每個 CSV 文件,並將產生的 DataFrame 儲存在清單中。
import glob
import pandas as pd

# Get data file names
path = r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename))
  1. 連接 DataFrame: 使用 pd。 concat() 將清單中的所有 DataFrame 連接成一個 DataFrame。設定ignore_index=True以避免連線時出現索引衝突。
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)

其他注意事項:

  • 確保所有 CSV 檔案具有相同的欄位成功串聯。
  • 如果 CSV 檔案具有不同的列名稱或格式,請考慮在連接之前使用額外的預處理步驟來對齊它們。
  • 要識別每個資料樣本,請在 DataFrame 中新增一個資料列,其中包含檔案名稱或唯一識別碼等資訊。

以上是如何將多個 CSV 檔案合併到單一 Pandas DataFrame 中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn