ホームページ >バックエンド開発 >Python チュートリアル >重複する列を持つ複数の Pandas DataFrame を効率的にマージするにはどうすればよいですか?
Pandas で 3 方向結合を使用して複数のデータフレームを結合する
最初の列として重複する人物名を持つ複数の CSV ファイルを指定すると、タスクは次のようになります。これらのファイルを単一の CSV にマージし、各行に一意のすべての属性が含まれるようにします。 person.
Pandas の従来の join() 関数には階層インデックスが必要です。ただし、結合プロセスを簡素化するための別のアプローチも利用できます。
DataFrame Merging の Reduce 関数
データフレームを結合する効率的な方法の 1 つは、 functools.reduce 関数を使用することです。 pd.merge 関数と一緒に。コードは次のようになります。
import functools as ft dfs = [df0, df1, df2, ..., dfN] df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
このアプローチにより、任意の数のデータフレームを共通の 'name' 列と結合できます。
以上が重複する列を持つ複数の Pandas DataFrame を効率的にマージするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。