在Pandas 中使用三向連接組合多個資料幀
給定多個具有重疊人名作為第一列的CSV 檔案,任務是將這些檔案合併到單一CSV 中,每行包含唯一的所有屬性person.
Pandas 中傳統的join() 函數需要分層索引。但是,可以使用另一種方法來簡化加入過程。
用於資料幀合併的 Reduce 函數
合併資料幀的有效方法是使用 functools.reduce 函數以及 pd.merge 函數。程式碼如下所示:
import functools as ft dfs = [df0, df1, df2, ..., dfN] df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
這種方法允許將任意數量的資料幀與公共「名稱」列合併。
以上是如何有效合併多個具有重疊列的 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!