ホームページ >バックエンド開発 >Python チュートリアル >列の値に基づいて Pandas DataFrame の特定の行を選択する方法

列の値に基づいて Pandas DataFrame の特定の行を選択する方法

Susan Sarandon
Susan Sarandonオリジナル
2024-12-26 13:20:10317ブラウズ

How to Select Specific Rows in Pandas DataFrames Based on Column Values?

Pandas DataFrame の列値に基づいた行の選択

Pandas DataFrame を使用する場合、特定の列の特定の値に基づいて行をフィルタリングする必要が生じることがよくあります。これは、WHERE column_name = some_value のようなフィルターを使用して行が取得される SQL クエリを模倣しています。

スカラー値

列の値がスカラー値 some_value と一致する行を選択するには、等価演算子 == を使用します。 :

df.loc[df['column_name'] == some_value]

反復可能値

列の値が配列 some_values にある行を選択するには、isin メソッドを使用します。

df.loc[df['column_name'].isin(some_values)]

条件の結合

複数の条件は、論理 & 演算子:

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

注:演算子の優先順位が正しいことを確認するには、かっこを使用します。

否定

列の値が some_value と等しくない行を選択するには、不等演算子 !=:

df.loc[df['column_name'] != some_value]

を使用します。 isin の場合、次を使用して結果を否定します。 ~:

df = df.loc[~df['column_name'].isin(some_values)]

次の DataFrame について考えます:

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.arange(8),
                   'D': np.arange(8) * 2})
print(df)

A が foo である行を選択します:

print(df.loc[df['A'] == 'foo'])

B が 1 である行を選択、または3 つ:

print(df.loc[df['B'].isin(['one', 'three'])])

インデックスを作成し、それを使用して行を選択します:

df = df.set_index(['B'])
print(df.loc['one'])

複数のインデックス値を持つ行を選択します:

print(df.loc[df.index.isin(['one', 'two'])])

以上が列の値に基づいて Pandas DataFrame の特定の行を選択する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。