pandas.DataFrame에서 복잡한 기준으로 선택
다음 DataFrame을 고려하세요.
import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C': [randint(1, 9)*100 for x in range(10)]})
에서 값을 선택하려면 'B'에 해당하는 값이 50보다 크고 'C'가 다음과 같지 않은 'A' 900, Pandas의 방법과 관용구를 활용할 수 있습니다.
열 연산을 적용하여 부울 시리즈 객체를 얻는 것으로 시작합니다.
df["B"] > 50 (df["B"] > 50) & (df["C"] != 900)
이 시리즈는 우리가 관심 있는 조건을 나타냅니다. 그런 다음 다음 조건을 사용하여 DataFrame에 인덱싱하여 데이터를 필터링합니다.
df["A"][(df["B"] > 50) & (df["C"] != 900)]
또는 다음을 사용할 수 있습니다. .loc을 사용하면 동일한 결과를 얻을 수 있습니다.
df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]
이 방법은 더 많은 제어 기능을 제공하고 더 많은 사용자 정의 가능한 색인 생성 환경을 허용합니다.
결과 DataFrame에는 다음과 같은 'A' 값만 포함됩니다. 지정된 기준을 충족합니다.
위 내용은 여러 복잡한 기준을 기반으로 팬더 DataFrame에서 데이터를 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!