Pandas의 DataFrame은 데이터 조작을 위한 강력한 방법과 관용구를 제공합니다. 다음은 복잡한 기준에 따라 값을 선택하는 방법에 대한 예입니다.
"A," "B" 및 "C" 열이 있는 DataFrame을 생각해 보세요. "B"에 해당하는 값이 50보다 크고 "C"에 해당하는 값이 900이 아닌 "A"에서 값을 선택합니다.
import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C': [randint(1, 9)*100 for x in range(10)]})
b_criteria = df["B"] > 50 c_criteria = df["C"] != 900
selection_criteria = b_criteria & c_criteria
selected_rows = df.loc[selection_criteria, "A"]
print(selected_rows) # Output: # 2 5000 # 3 8000 # Name: A, dtype: int64
참고:
.loc를 사용하면 선택한 데이터는 복사본에만 영향을 미치며 원본 DataFrame의 무결성은 유지됩니다.
위 내용은 여러 조건을 기반으로 Pandas DataFrame에서 데이터를 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!