ホームページ >バックエンド開発 >Python チュートリアル >複数の条件に基づいて Pandas DataFrame からデータを選択する方法

複数の条件に基づいて Pandas DataFrame からデータを選択する方法

Linda Hamilton
Linda Hamiltonオリジナル
2024-12-08 12:07:09611ブラウズ

How to Select Data from a Pandas DataFrame Based on Multiple Conditions?

Pandas.DataFrame からの複雑な基準による選択

Pandas の DataFrame は、データ操作のための強力なメソッドとイディオムを提供します。複雑な基準に基づいて値を選択する方法の例を次に示します。

問題:

列 "A"、"B"、および "C" を持つ DataFrame を考えてみましょう。 「A」から、「B」の対応する値が 50 より大きく、「C」の対応する値が 900 に等しくない値を選択します。

解決策:

  1. 作成のDataFrame:
import pandas as pd
from random import randint

df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
                   'B': [randint(1, 9)*10 for x in range(10)],
                   'C': [randint(1, 9)*100 for x in range(10)]})
  1. 条件のブール系列の作成:
b_criteria = df["B"] > 50
c_criteria = df["C"] != 900
  1. ブール値を使用して基準を結合する演算子:
selection_criteria = b_criteria & c_criteria
  1. .loc を使用して、選択:
selected_rows = df.loc[selection_criteria, "A"]

例:

print(selected_rows)
# Output:
# 2    5000
# 3    8000
# Name: A, dtype: int64

注:

.loc を使用すると、選択したデータはコピーにのみ影響し、元の DataFrame の整合性は維持されます。

以上が複数の条件に基づいて Pandas DataFrame からデータを選択する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。