首頁 >後端開發 >Python教學 >如何在 Python 的 For 迴圈中有效率地追加多個 DataFrame?

如何在 Python 的 For 迴圈中有效率地追加多個 DataFrame?

DDD
DDD原創
2024-10-28 02:54:30717瀏覽

How to Efficiently Append Multiple DataFrames within a For Loop in Python?

在Python 中的For 循環中附加多個DataFrame

處理儲存在多個Excel 檔案中的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集需要合併將所有資料放入單一DataFrame 中以進行進一步分析或處理。這可以在 for 迴圈中使用 Python 的 pandas 函式庫輕鬆實現。

要追加資料幀,請務必注意 DataFrame.append() 方法至少需要兩個參數。在提供的程式碼中,僅傳遞一個參數,即資料。正確的做法是在循環內將所有 DataFrame 儲存在一個清單中,然後使用 pd.concat 將清單合併為單一 DataFrame。

詳細說明如下:

<code class="python">import pandas as pd
import glob

# Initialize an empty list to store DataFrames
appended_data = []

# Iterate over Excel files in a specified directory
for infile in glob.glob("*.xlsx"):
    print("Processing file:", infile)
    
    # Read data from Excel file into a DataFrame
    data = pd.read_excel(infile)
    
    # Append DataFrame to the list
    appended_data.append(data)

# Concatenate DataFrames to create a consolidated DataFrame
final_df = pd.concat(appended_data, ignore_index=True)

# Save consolidated data to a new Excel file
final_df.to_excel('appended.xlsx', index=False)</code>

透過採用此方法,您可以無縫附加for 循環中產生的多個DataFrame,並將合併後的資料儲存到新的Excel文件中。這使您能夠有效率且有效地處理大型且脫節的資料集。

以上是如何在 Python 的 For 迴圈中有效率地追加多個 DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn