首页  >  文章  >  后端开发  >  如何在 Python 的 For 循环中高效地追加多个 DataFrame?

如何在 Python 的 For 循环中高效地追加多个 DataFrame?

DDD
DDD原创
2024-10-28 02:54:30558浏览

How to Efficiently Append Multiple DataFrames within a For Loop in Python?

在 Python 中的 For 循环中附加多个 DataFrame

处理存储在多个 Excel 文件中的大型数据集时,通常需要合并将所有数据放入单个 DataFrame 中以供进一步分析或处理。这可以在 for 循环中使用 Python 的 pandas 库轻松实现。

要追加数据帧,请务必注意 DataFrame.append() 方法至少需要两个参数。在提供的代码中,仅传递一个参数,即数据。正确的做法是在循环内将所有 DataFrame 存储在一个列表中,然后使用 pd.concat 将列表合并为单个 DataFrame。

详细说明如下:

<code class="python">import pandas as pd
import glob

# Initialize an empty list to store DataFrames
appended_data = []

# Iterate over Excel files in a specified directory
for infile in glob.glob("*.xlsx"):
    print("Processing file:", infile)
    
    # Read data from Excel file into a DataFrame
    data = pd.read_excel(infile)
    
    # Append DataFrame to the list
    appended_data.append(data)

# Concatenate DataFrames to create a consolidated DataFrame
final_df = pd.concat(appended_data, ignore_index=True)

# Save consolidated data to a new Excel file
final_df.to_excel('appended.xlsx', index=False)</code>

通过采用这种方法,您可以无缝附加 for 循环中生成的多个 DataFrame,并将合并后的数据保存到新的 Excel 文件中。这使您能够高效且有效地处理大型且脱节的数据集。

以上是如何在 Python 的 For 循环中高效地追加多个 DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn