首頁 >後端開發 >Python教學 >如何為 A 列中的重複值保留 B 列中具有最大值的行？

如何為 A 列中的重複值保留 B 列中具有最大值的行？

Mary-Kate Olsen原創: 2024-11-07 04:27:02750瀏覽

How to Keep Rows with Maximum Values in Column B for Duplicate Values in Column A?

針對重複的A列值找出B列值最大的行

在資料分析中，經常需要移除重複記錄，同時保留獨特的數據。常見的場景涉及特定列（A 列）中具有重複值的資料集，其目標是將具有最高值的行保留在另一列（B 列）中。

要實現此目的，第一個解決方案利用 drop_duplicates() 函數和 keep="last" 參數。這會根據 A 列刪除重複行，同時保留最後看到的行，而不管 B 列中的值如何。

但是，如果目標是保留 B 列中具有最大值的行，則上述解決方案不合適。相反，可以使用 groupby() 和 apply() 的組合，類似於提供的第二個解決方案。此方法按 A 列對行進行分組，對每個組套用一個函數，並選擇每個組內 B 列中具有最大值的行。

實作：

import pandas as pd

# Create data frame with duplicate values in column A
df = pd.DataFrame([[1, 10], [1, 20], [2, 30], [2, 40], [3, 10]], columns=['A', 'B'])

# Keep row with maximum value in column B for each duplicate in column A
max_b_rows = df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])

# Display resulting data frame
print(max_b_rows)

輸出：

以上是如何為 A 列中的重複值保留 B 列中具有最大值的行？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

if for while function this column

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：如何避免 Python 中空縮排區塊的縮排錯誤？下一篇：如何避免 Python 中空縮排區塊的縮排錯誤？

看更多