데이터 필터링에 Pandas를 사용하는 실용 팁
Pandas는 데이터 분석 및 데이터 과학에 널리 사용되는 강력한 데이터 처리 라이브러리입니다. 데이터 필터링은 데이터 처리 중 일반적인 작업입니다. 이 기사에서는 데이터 필터링에 Pandas를 사용하는 방법을 소개하고 구체적인 코드 예제를 제공합니다.
1. 조건에 따라 데이터 필터링
Pandas는 조건에 따라 데이터를 필터링할 수 있는 다양한 조건 연산자를 제공합니다. 일반적으로 사용되는 연산자에는 같음(==), 같지 않음(!=), 초과(>), 미만(=), 작거나 같음(
예를 들어, 학생의 이름(name), 나이(age) 및 점수(점수)가 포함된 DataFrame 개체 df가 있다고 가정합니다. 90점:
df_filtered = df[df['score'] >= 90]
Pandas는 단일 조건 외에도 데이터 필터링에 여러 조건 사용을 지원합니다. 조건은 논리 연산자 and, or, not을 사용하여 결합할 수 있습니다.
예를 들어, 18세에서 25세 사이이고 점수가 80점 이상인 학생의 데이터를 필터링한다고 가정해 보겠습니다.
df_filtered = df[(df['age'] >= 18) & (df['age'] <= 25) & (df['score'] >= 80)]
2. 다음을 기준으로 데이터를 필터링합니다. index
Pandas의 DataFrame 객체는 기본적으로 정수 인덱스가 자동으로 생성되어 데이터 필터링에 사용될 수 있습니다.
iloc 속성을 사용하면 행과 열의 위치 인덱스를 기반으로 데이터를 필터링할 수 있습니다.
예를 들어 행 2에서 5까지의 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.
df_filtered = df.iloc[2:6, :]
레이블 인덱스가 DataFrame 개체에 설정되어 있으면 태그 인덱스를 기반으로 loc 속성 필터 데이터를 사용할 수 있습니다.
예를 들어 20세 이상의 학생 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.
df_filtered = df.loc[df['age'] >= 20, :]
3. 필드를 기준으로 데이터 필터링
조건 및 인덱스를 사용하여 필터링하는 것 외에도, 필드를 기반으로 데이터를 필터링할 수도 있습니다.
열 이름을 사용하여 지정된 열 데이터를 필터링할 수 있습니다.
예를 들어 이름과 성적이라는 두 열의 데이터만 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.
df_filtered = df[['name', 'score']]
필드 값에 해당하는 데이터를 필터링합니다.
예를 들어 점수가 80점에서 90점 사이인 학생 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.
df_filtered = df[df['score'].between(80, 90)]
위는 조건, 인덱스 및 데이터 필터링을 유연하게 사용하여 Pandas를 사용하는 실용적인 팁입니다. 필드를 사용하면 필요한 데이터를 쉽게 필터링할 수 있습니다. 이 글이 귀하의 데이터 처리 과정에 도움이 되기를 바랍니다!
위 내용은 Pandas 데이터 필터링에 대한 실용적인 팁과 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!