首页 >后端开发 >Python教程 >如何根据数据帧列中的不同值提取行?

如何根据数据帧列中的不同值提取行?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-11-04 10:41:30612浏览

How to Extract Rows Based on Distinct Values in a Dataframe Column?

查询数据帧列中的不同值

使用数据帧时,通常需要根据数据帧中的不同值检索行具体栏目。这使我们能够消除重复值并获得一组唯一的数据点。

考虑以下数据框:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

假设我们要提取与列中唯一值相对应的行COL2。为了实现这一点,我们可以利用 pandas 的 drop_duplicates 函数。此函数采用列名作为参数,并从数据框中删除重复的行。

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>

默认情况下,drop_duplicates 保留每个唯一值的第一次出现。或者,我们可以指定 keep='last' 来保留最后一次出现的位置,或指定 keep=False 来删除所有重复的行:

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>

执行上述任何命令后,数据帧 df 将仅包含行对应于列 COL2 中的不同值:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

以上是如何根据数据帧列中的不同值提取行?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn