首页 >后端开发 >Python教程 >如何根据列值选择 Pandas DataFrame 中的特定行?

如何根据列值选择 Pandas DataFrame 中的特定行?

Patricia Arquette
Patricia Arquette原创
2024-12-30 15:30:13220浏览

How to Select Specific Rows in a Pandas DataFrame Based on Column Values?

在 Pandas 中根据列值选择行

在 Pandas 中,过滤 DataFrame 以根据列值选择特定行可以使用比较运算符和布尔索引。

比较列值

选择行如果列值与特定标量值匹配,请使用 == 运算符:

df.loc[df['column_name'] == some_value]

要选择列值位于列表或其他可迭代值中的行,请使用 isin 运算符:

df.loc[df['column_name'].isin(some_values)]

组合条件

可以使用&运算符组合多个条件来选择满足所有条件的行条件:

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

请注意,括号是确保正确的运算符优先级所必需的。

否定条件

选择与特定值不匹配或不在其中的行特定列表,使用 != 或 ~:

df.loc[df['column_name'] != some_value]
df = df.loc[~df['column_name'].isin(some_values)] # In-place replacement requires `loc`

索引来否定条件优化

为了对常用条件进行有效过滤,在列上创建索引可能会很有帮助。这允许使用 df.loc 进行更快的查找:

df = df.set_index(['B'])
df.loc['one']

示例

考虑以下 DataFrame:

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.arange(8), 'D': np.arange(8) * 2})

选择列 'A' 等于 ' 的行foo':

print(df.loc[df['A'] == 'foo'])

选择列“B”所在的行['一', '三']:

print(df.loc[df['B'].isin(['one','three'])])

要选择“B”列为“一”或“二”的行:

df = df.set_index(['B'])
print(df.loc[df.index.isin(['one','two'])])

以上是如何根据列值选择 Pandas DataFrame 中的特定行?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn