首頁 >後端開發 >Python教學 >如何有效合併多個具有重疊列的 Pandas DataFrame?

如何有效合併多個具有重疊列的 Pandas DataFrame?

Susan Sarandon
Susan Sarandon原創
2024-11-28 17:44:10506瀏覽

How Can I Efficiently Merge Multiple Pandas DataFrames with Overlapping Columns?

在Pandas 中使用三向連接組合多個資料幀

給定多個具有重疊人名作為第一列的CSV 檔案,任務是將這些檔案合併到單一CSV 中,每行包含唯一的所有屬性person.

Pandas 中傳統的join() 函數需要分層索引。但是,可以使用另一種方​​法來簡化加入過程。

用於資料幀合併的 Reduce 函數

合併資料幀的有效方法是使用 functools.reduce 函數以及 pd.merge 函數。程式碼如下所示:

import functools as ft
dfs = [df0, df1, df2, ..., dfN]
df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)

這種方法允許將任意數量的資料幀與公共「名稱」列合併。

以上是如何有效合併多個具有重疊列的 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn