ホームページ >バックエンド開発 >Python チュートリアル >Python の For ループ内に複数の DataFrame を効率的に追加するにはどうすればよいですか?
Python の For ループ内で複数の DataFrame を追加する
複数の Excel ファイルに保存されている大規模なデータセットを操作する場合、多くの場合、統合する必要があります。すべてのデータを単一の DataFrame にまとめて、さらに分析または処理します。これは、for ループ内で Python の pandas ライブラリを使用すると簡単に実現できます。
データフレームを追加するには、DataFrame.append() メソッドに少なくとも 2 つの引数が必要であることに注意することが重要です。提供されたコードでは、引数 data が 1 つだけ渡されます。正しいアプローチは、すべての DataFrame をループ内のリストに格納し、pd.concat を使用してリストを 1 つの DataFrame にマージすることです。
詳細な説明は次のとおりです:
<code class="python">import pandas as pd import glob # Initialize an empty list to store DataFrames appended_data = [] # Iterate over Excel files in a specified directory for infile in glob.glob("*.xlsx"): print("Processing file:", infile) # Read data from Excel file into a DataFrame data = pd.read_excel(infile) # Append DataFrame to the list appended_data.append(data) # Concatenate DataFrames to create a consolidated DataFrame final_df = pd.concat(appended_data, ignore_index=True) # Save consolidated data to a new Excel file final_df.to_excel('appended.xlsx', index=False)</code>
このアプローチに従うことで、for ループ内で生成された複数の DataFrame をシームレスに追加し、統合されたデータを新しい Excel ファイルに保存できます。これにより、大規模でバラバラなデータセットを効率的かつ効果的に操作できるようになります。
以上がPython の For ループ内に複数の DataFrame を効率的に追加するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。