>백엔드 개발 >파이썬 튜토리얼 >열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?

열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-19 22:30:29927검색

How to Split a Pandas DataFrame Based on a Column Value Threshold?

Pandas DataFrame을 열 값으로 분할

'Sales'라는 열이 있는 DataFrame이 있는 시나리오를 생각해 보세요. 첫 번째 DataFrame에는 'Sales'가 지정된 임계값보다 작은 데이터가 포함되고 두 번째 DataFrame에는 'Sales'가 지정된 임계값보다 큰 데이터가 포함되도록 'Sales' 열의 값을 기준으로 이 DataFrame을 두 개로 분리하려고 합니다. 또는 임계값과 같습니다.

이를 달성하려면 Pandas에서 부울 인덱싱을 활용할 수 있습니다. 예는 다음과 같습니다.

<code class="python">import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]})
print(df)

# Set the threshold (s)
s = 30

# Split the DataFrame based on the 'Sales' column
df1 = df[df['Sales'] >= s]
print(df1)

df2 = df[df['Sales'] < s]
print(df2)

출력:

   A  Sales
0  3     10
1  4     20
2  7     30
3  6     40
4  1     50

   A  Sales
2  7     30
3  6     40
4  1     50

   A  Sales
0  3     10
1  4     20

또는 역마스크 연산자(~)를 사용하여 동일한 결과를 얻을 수 있습니다.

<code class="python">mask = df['Sales'] >= s
df1 = df[mask]
df2 = df[~mask]
print(df1)
print(df2)</code>

이전 예와 동일한 효과가 나타납니다.

위 내용은 열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.