组合在 For 循环中生成的 Pandas DataFrame:综合解决方案
在数据操作方面,Pandas 提供了一套强大的工具用于处理结构化数据。一项常见任务是合并来自多个来源的数据。实现此目的的一种方法是在 for 循环中生成数据帧,然后附加它们以创建统一的数据帧。
要附加在 for 循环中生成的数据帧,您需要使用与你尝试过的一个。您提供的代码:
appended_data = pandas.DataFrame.append(data) # requires at least two arguments
需要至少两个数据帧作为参数,这不适合逐一附加多个数据帧。相反,我们可以使用 pd.concat 将数据帧列表合并为一个更大的数据帧。
这是一个改进的解决方案:
<code class="python">appended_data = [] for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) # Store each dataframe in a list appended_data.append(data) # Concatenate the list of dataframes into a single dataframe appended_data = pd.concat(appended_data) # Write the resulting dataframe to a new Excel file appended_data.to_excel('appended.xlsx')</code>
在此修改后的代码中:
这种方法可确保循环中生成的所有数据帧合并为单个数据帧,为您提供统一的数据集。
以上是如何组合 For 循环中生成的 Pandas DataFrame:综合解决方案的详细内容。更多信息请关注PHP中文网其他相关文章!