不同值行检索
要根据列(特别是 COL2)中的不同值提取行,可以使用以下方法:
drop_duplicates with Keep First:
df = df.drop_duplicates('COL2', keep='first')
这将保留 COL2 中每个唯一值的第一次出现。
drop_duplicates with Keep Last:
df = df.drop_duplicates('COL2', keep='last')
这会维护 COL2 中每个唯一值的最后一次出现。
drop_duplicates with No Keep:
df = df.drop_duplicates('COL2', keep=False)
这会删除所有重复的行,从而在 COL2 中仅产生唯一值。
示例:
考虑以下数据帧:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
使用 keep_first 方法产生:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
keep_last 方法产生:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
最后,使用 keep_false 方法会产生:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
以上是如何在 Pandas DataFrame 中提取具有不同值的行?的详细内容。更多信息请关注PHP中文网其他相关文章!