ホームページ >バックエンド開発 >Python チュートリアル >重複する列を持つ複数の Pandas DataFrame を効率的にマージするにはどうすればよいですか?

重複する列を持つ複数の Pandas DataFrame を効率的にマージするにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-11-28 17:44:10437ブラウズ

How Can I Efficiently Merge Multiple Pandas DataFrames with Overlapping Columns?

Pandas で 3 方向結合を使用して複数のデータフレームを結合する

最初の列として重複する人物名を持つ複数の CSV ファイルを指定すると、タスクは次のようになります。これらのファイルを単一の CSV にマージし、各行に一意のすべての属性が含まれるようにします。 person.

Pandas の従来の join() 関数には階層インデックスが必要です。ただし、結合プロセスを簡素化するための別のアプローチも利用できます。

DataFrame Merging の Reduce 関数

データフレームを結合する効率的な方法の 1 つは、 functools.reduce 関数を使用することです。 pd.merge 関数と一緒に。コードは次のようになります。

import functools as ft
dfs = [df0, df1, df2, ..., dfN]
df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)

このアプローチにより、任意の数のデータフレームを共通の 'name' 列と結合できます。

以上が重複する列を持つ複数の Pandas DataFrame を効率的にマージするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。