首页 >后端开发 >Python教程 >如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-11-08 09:46:021056浏览

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

删除 A 列中的重复项时保留具有最高 B 值的行

当前的任务涉及删除 A 列中的重复值一个数据框,同时保留 B 列中具有最高值的行。为了实现这一点,我们可以利用 Python 的 Pandas 中的内置函数库。

一种方法是按 A 列对数据帧进行排序,然后丢弃重复项,同时保留最后一次出现的值。这表示如下:

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')

或者,可以考虑不同标准的更灵活的解决方案是按 A 列对数据帧进行分组。在每个组中,B 列中具有最大值的行可以是提取的。这可以使用以下代码来实现:

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])

通过实现这两种方法之一,您可以有效消除 A 列中的重复值,同时确保保留 B 值最高的行。

以上是如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn