查询数据帧列中的不同值
使用数据帧时,通常需要根据数据帧中的不同值检索行具体栏目。这使我们能够消除重复值并获得一组唯一的数据点。
考虑以下数据框:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
假设我们要提取与列中唯一值相对应的行COL2。为了实现这一点,我们可以利用 pandas 的 drop_duplicates 函数。此函数采用列名作为参数,并从数据框中删除重复的行。
<code class="python">import pandas as pd df = pd.DataFrame(...) # assuming the given dataframe df = df.drop_duplicates('COL2')</code>
默认情况下,drop_duplicates 保留每个唯一值的第一次出现。或者,我们可以指定 keep='last' 来保留最后一次出现的位置,或指定 keep=False 来删除所有重复的行:
<code class="python"># Keep first occurrence df = df.drop_duplicates('COL2', keep='first') # Keep last occurrence df = df.drop_duplicates('COL2', keep='last') # Remove all duplicates df = df.drop_duplicates('COL2', keep=False')</code>
执行上述任何命令后,数据帧 df 将仅包含行对应于列 COL2 中的不同值:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
以上是如何根据数据帧列中的不同值提取行?的详细内容。更多信息请关注PHP中文网其他相关文章!