Pandas를 사용하여 검증된 데이터를 필터링하는 방법
Pandas는 Python의 강력한 데이터 분석 라이브러리로, 풍부한 데이터 처리 및 작업 기능을 제공합니다. 실제 데이터 분석 및 처리 과정에서 특정 조건에 맞는 데이터를 찾기 위해 데이터를 필터링해야 하는 경우가 많습니다. 이 기사에서는 데이터 필터링에 Pandas를 사용하는 방법을 소개하고 특정 코드 예제를 제공합니다.
1. Pandas 라이브러리 가져오기
Pandas를 사용하기 전에 먼저 관련 라이브러리를 가져와야 합니다. 다음 명령을 사용하여 Pandas 라이브러리를 가져올 수 있습니다.
import pandas as pd
2. 데이터 프레임 생성
데이터를 필터링하기 전에 먼저 데이터 프레임을 생성해야 합니다. 데이터 프레임은 Excel의 테이블과 유사하게 Pandas에서 일반적으로 사용되는 데이터 구조로, 데이터를 쉽게 저장하고 처리할 수 있습니다. 다음은 간단한 데이터 프레임을 생성하는 예제 코드입니다:
data = {'Name': ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu'],
'Age': [25, 30, 35, 40], 'Gender': ['男', '女', '男', '女'], 'Salary': [5000, 6000, 7000, 8000]}
df = pd .DataFrame(데이터)
3. 조건에 따라 데이터 필터링
Pandas에서는 조건에 따라 데이터를 필터링하는 몇 가지 방법을 사용할 수 있습니다. 다음은 일반적으로 사용되는 몇 가지 방법입니다.
loc 방법은 행 및 열 레이블을 기반으로 데이터를 필터링할 수 있습니다. 다음은 loc 메소드를 사용하여 30년이 넘은 데이터를 필터링하는 샘플 코드입니다.
filtered_data = df.loc[df['Age'] > 30]
iloc 메소드는 다음과 같습니다. 행과 열 인덱스를 기준으로 데이터 필터링을 수행합니다. 다음은 iloc 메소드를 사용하여 행 3의 데이터를 필터링하는 샘플 코드입니다.
filtered_data = df.iloc[2]
위 방법 외에도 조건식을 사용할 수도 있습니다. 데이터를 필터링합니다. 다음은 조건부 필터링을 사용한 샘플 코드입니다.
filtered_data = df[df['Gender'] == 'Male' & df['Salary'] > 6000]
4. 필터링 후 출력합니다. 데이터 필터링 후 print 메소드를 사용하여 필터링된 결과를 출력할 수 있습니다. 다음은 필터링된 결과를 출력하는 샘플 코드입니다.
print(filtered_data)
위의 코드 예제를 사용하면 Pandas를 사용하여 기준에 맞는 데이터를 쉽게 필터링할 수 있습니다. 실제 데이터 분석 및 처리에 있어서 Pandas의 이러한 기능은 많은 시간과 에너지를 절약해 주고, 필요한 데이터를 빠르고 정확하게 찾을 수 있도록 도와줍니다.
요약: 이 글에서는 레이블 및 인덱스 기반 필터링, 조건식을 사용한 필터링 등 데이터 필터링에 Pandas를 사용하는 기본 방법을 소개합니다. 이 내용이 데이터 분석 및 처리에 Pandas를 더 잘 활용하는 데 도움이 되기를 바랍니다. 실제 애플리케이션에서는 특정 요구 사항에 따라 추가 데이터 처리 및 분석을 위해 Pandas의 다른 기능을 결합할 수도 있습니다.
위 내용은 Pandas를 사용하여 조건에 맞는 데이터를 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!