ホームページ >バックエンド開発 >Python チュートリアル >複数の条件に基づいて Pandas DataFrame からデータを選択する方法
Pandas の DataFrame は、データ操作のための強力なメソッドとイディオムを提供します。複雑な基準に基づいて値を選択する方法の例を次に示します。
列 "A"、"B"、および "C" を持つ DataFrame を考えてみましょう。 「A」から、「B」の対応する値が 50 より大きく、「C」の対応する値が 900 に等しくない値を選択します。
import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C': [randint(1, 9)*100 for x in range(10)]})
b_criteria = df["B"] > 50 c_criteria = df["C"] != 900
selection_criteria = b_criteria & c_criteria
selected_rows = df.loc[selection_criteria, "A"]
print(selected_rows) # Output: # 2 5000 # 3 8000 # Name: A, dtype: int64
注:
.loc を使用すると、選択したデータはコピーにのみ影響し、元の DataFrame の整合性は維持されます。
以上が複数の条件に基づいて Pandas DataFrame からデータを選択する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。