ホームページ >バックエンド開発 >Python チュートリアル >Python の For ループ内に複数の DataFrame を効率的に追加するにはどうすればよいですか?

Python の For ループ内に複数の DataFrame を効率的に追加するにはどうすればよいですか?

DDD
DDDオリジナル
2024-10-28 02:54:30717ブラウズ

How to Efficiently Append Multiple DataFrames within a For Loop in Python?

Python の For ループ内で複数の DataFrame を追加する

複数の Excel ファイルに保存されている大規模なデータセットを操作する場合、多くの場合、統合する必要があります。すべてのデータを単一の DataFrame にまとめて、さらに分析または処理します。これは、for ループ内で Python の pandas ライブラリを使用すると簡単に実現できます。

データフレームを追加するには、DataFrame.append() メソッドに少なくとも 2 つの引数が必要であることに注意することが重要です。提供されたコードでは、引数 data が 1 つだけ渡されます。正しいアプローチは、すべての DataFrame をループ内のリストに格納し、pd.concat を使用してリストを 1 つの DataFrame にマージすることです。

詳細な説明は次のとおりです:

<code class="python">import pandas as pd
import glob

# Initialize an empty list to store DataFrames
appended_data = []

# Iterate over Excel files in a specified directory
for infile in glob.glob("*.xlsx"):
    print("Processing file:", infile)
    
    # Read data from Excel file into a DataFrame
    data = pd.read_excel(infile)
    
    # Append DataFrame to the list
    appended_data.append(data)

# Concatenate DataFrames to create a consolidated DataFrame
final_df = pd.concat(appended_data, ignore_index=True)

# Save consolidated data to a new Excel file
final_df.to_excel('appended.xlsx', index=False)</code>

このアプローチに従うことで、for ループ内で生成された複数の DataFrame をシームレスに追加し、統合されたデータを新しい Excel ファイルに保存できます。これにより、大規模でバラバラなデータセットを効率的かつ効果的に操作できるようになります。

以上がPython の For ループ内に複数の DataFrame を効率的に追加するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。