首页  >  文章  >  后端开发  >  如何在 Pandas DataFrame 中提取具有不同值的行?

如何在 Pandas DataFrame 中提取具有不同值的行?

Barbara Streisand
Barbara Streisand原创
2024-11-04 07:51:01176浏览

How to Extract Rows with Distinct Values in a Pandas DataFrame?

不同值行检索

要根据列(特别是 COL2)中的不同值提取行,可以使用以下方法:

  1. drop_duplicates with Keep First:

    df = df.drop_duplicates('COL2', keep='first')

    这将保留 COL2 中每个唯一值的第一次出现。

  2. drop_duplicates with Keep Last:

    df = df.drop_duplicates('COL2', keep='last')

    这会维护 COL2 中每个唯一值的最后一次出现。

  3. drop_duplicates with No Keep:

    df = df.drop_duplicates('COL2', keep=False)

    这会删除所有重复的行,从而在 COL2 中仅产生唯一值。

示例:

考虑以下数据帧:

COL1 COL2
a.com 22
b.com 45
c.com 34
e.com 45
f.com 56
g.com 22
h.com 45

使用 keep_first 方法产生:

COL1 COL2
a.com 22
b.com 45
c.com 34
f.com 56

keep_last 方法产生:

COL1 COL2
c.com 34
f.com 56
g.com 22
h.com 45

最后,使用 keep_false 方法会产生:

COL1 COL2
c.com 34
f.com 56

以上是如何在 Pandas DataFrame 中提取具有不同值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn