在 Python 中的 For 循环中附加多个 DataFrame
处理存储在多个 Excel 文件中的大型数据集时,通常需要合并将所有数据放入单个 DataFrame 中以供进一步分析或处理。这可以在 for 循环中使用 Python 的 pandas 库轻松实现。
要追加数据帧,请务必注意 DataFrame.append() 方法至少需要两个参数。在提供的代码中,仅传递一个参数,即数据。正确的做法是在循环内将所有 DataFrame 存储在一个列表中,然后使用 pd.concat 将列表合并为单个 DataFrame。
详细说明如下:
<code class="python">import pandas as pd import glob # Initialize an empty list to store DataFrames appended_data = [] # Iterate over Excel files in a specified directory for infile in glob.glob("*.xlsx"): print("Processing file:", infile) # Read data from Excel file into a DataFrame data = pd.read_excel(infile) # Append DataFrame to the list appended_data.append(data) # Concatenate DataFrames to create a consolidated DataFrame final_df = pd.concat(appended_data, ignore_index=True) # Save consolidated data to a new Excel file final_df.to_excel('appended.xlsx', index=False)</code>
通过采用这种方法,您可以无缝附加 for 循环中生成的多个 DataFrame,并将合并后的数据保存到新的 Excel 文件中。这使您能够高效且有效地处理大型且脱节的数据集。
以上是如何在 Python 的 For 循环中高效地追加多个 DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!