ホームページ >バックエンド開発 >Python チュートリアル >列の値に基づいて Pandas データフレーム内の特定の行を選択する方法

列の値に基づいて Pandas データフレーム内の特定の行を選択する方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-12-30 15:30:13233ブラウズ

How to Select Specific Rows in a Pandas DataFrame Based on Column Values?

Pandas の列値に基づいた行の選択

Pandas では、比較演算子と比較演算子を組み合わせて使用​​して、列値に基づいて DataFrame をフィルタリングして特定の行を選択できます。ブール型インデックス。

列の比較値

列値が特定のスカラー値と一致する行を選択するには、== 演算子を使用します。

df.loc[df['column_name'] == some_value]

列値がリストまたはその他の反復可能な値に含まれる行を選択するには、isin 演算子を使用します:

df.loc[df['column_name'].isin(some_values)]

条件の結合

複数の条件& 演算子を使用して組み合わせて、すべての条件を満たす行を選択できます。

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

演算子の優先順位を適切に保つためにかっこが必要であることに注意してください。

条件の否定

するには特定の値に一致しない行、または特定のリストにない行を選択する、!= またはを使用して条件を無効にする~:

df.loc[df['column_name'] != some_value]
df = df.loc[~df['column_name'].isin(some_values)] # In-place replacement requires `loc`

インデックスの最適化

頻繁に使用される基準で効率的にフィルタリングするには、列にインデックスを作成すると効果的です。これにより、df.loc を使用した高速な検索が可能になります。

df = df.set_index(['B'])
df.loc['one']

次の DataFrame について考えてみましょう。

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.arange(8), 'D': np.arange(8) * 2})

列 'A' が ' に等しい行を選択するにはfoo':

print(df.loc[df['A'] == 'foo'])

列 'B' が存在する行を選択するにはin ['one', 'three']:

print(df.loc[df['B'].isin(['one','three'])])

列 'B' が 'one' または 'two' である行を選択するには:

df = df.set_index(['B'])
print(df.loc[df.index.isin(['one','two'])])

以上が列の値に基づいて Pandas データフレーム内の特定の行を選択する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。