For ループで生成されたデータフレームの結合
複数のデータ ソースを操作する場合、多くの場合、データを 1 つの統合されたデータフレームに結合する必要があります。 。この質問は、pd.concat 関数を使用して for ループ内で生成されたデータフレームを追加しようとするときに直面する一般的な問題を示しています。
質問で示されている最初のアプローチでは、pd.append の呼び出しが間違っているため、エラーが発生します。この関数には少なくとも 2 つの引数が必要です。最初の引数は追加するデータフレームであり、2 番目の引数は追加するデータである必要があります。コードはそれ自体にデータを追加しようとしますが、これは無効です。
データフレームを追加する正しい方法は、データフレームをリストに保存し、pd.concat を使用して単一のデータフレームにマージすることです。改善されたソリューションは次のとおりです。
<code class="python">appended_data = [] for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data.append(data) # concatenate the list of dataframes appended_data = pd.concat(appended_data) # save the merged dataframe to an excel file appended_data.to_excel('appended.xlsx')</code>
このコードは、必要なライブラリをインポートし、Excel ファイルを反復処理し、各ファイルからデータを読み取り、データフレームをリストに保存します。最後に、pd.concat を使用してデータフレームのリストを連結し、結合されたデータフレームを新しい Excel ファイルにエクスポートします。このアプローチにより、ループ内で生成されたデータフレームをシームレスに追加できます。
以上がpd.concat を使用して For ループで生成された DataFrame を結合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。