在Python 中的For 循環中附加多個DataFrame
處理儲存在多個Excel 檔案中的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集時,通常的大型資料集需要合併將所有資料放入單一DataFrame 中以進行進一步分析或處理。這可以在 for 迴圈中使用 Python 的 pandas 函式庫輕鬆實現。
要追加資料幀,請務必注意 DataFrame.append() 方法至少需要兩個參數。在提供的程式碼中,僅傳遞一個參數,即資料。正確的做法是在循環內將所有 DataFrame 儲存在一個清單中,然後使用 pd.concat 將清單合併為單一 DataFrame。
詳細說明如下:
<code class="python">import pandas as pd import glob # Initialize an empty list to store DataFrames appended_data = [] # Iterate over Excel files in a specified directory for infile in glob.glob("*.xlsx"): print("Processing file:", infile) # Read data from Excel file into a DataFrame data = pd.read_excel(infile) # Append DataFrame to the list appended_data.append(data) # Concatenate DataFrames to create a consolidated DataFrame final_df = pd.concat(appended_data, ignore_index=True) # Save consolidated data to a new Excel file final_df.to_excel('appended.xlsx', index=False)</code>
透過採用此方法,您可以無縫附加for 循環中產生的多個DataFrame,並將合併後的資料儲存到新的Excel文件中。這使您能夠有效率且有效地處理大型且脫節的資料集。
以上是如何在 Python 的 For 迴圈中有效率地追加多個 DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!