Pandas 필터링 방법: 1. Pandas 라이브러리를 가져옵니다. 3. 데이터를 필터링합니다. 5. 데이터를 그룹화하고 집계합니다. 자세한 소개: 1. Pandas 라이브러리 가져오기 먼저 Pandas 라이브러리가 설치되어 있는지 확인하세요. 설치되지 않은 경우 "pip install pandas" 명령을 사용하여 설치할 수 있습니다. 그런 다음 "import pandas as"를 사용할 수 있습니다. pd" 명령을 사용하여 Pandas 라이브러리를 가져옵니다. 2. Pandas 라이브러리 등을 사용하여 데이터를 읽습니다.
이 튜토리얼의 운영 체제: Windows 10 시스템, DELL G3 컴퓨터.
Pandas는 데이터를 쉽게 필터링, 처리 및 분석할 수 있는 많은 강력한 기능을 제공하는 인기 있는 Python 데이터 분석 라이브러리입니다. 다음은 Pandas를 사용하여 데이터를 필터링하는 몇 가지 일반적인 방법입니다.
1. Pandas 라이브러리 가져오기
먼저 Pandas 라이브러리가 설치되어 있는지 확인하세요. 설치되어 있지 않은 경우 다음 명령을 사용하여 설치할 수 있습니다.
pip install pandas
그런 다음 Pandas 라이브러리를 가져옵니다.
import pandas as pd
2. 데이터 읽기
Pandas 라이브러리의 read_csv() 함수를 사용하여 CSV 파일을 읽습니다. , Excel 파일 등을 읽는 read_excel() 함수 등이 있습니다. 예를 들어 data.csv라는 CSV 파일을 읽어보세요.
df = pd.read_csv('data.csv')
3. 데이터 필터링
Pandas는 데이터를 필터링하는 다양한 방법을 제공합니다. 다음은 몇 가지 일반적인 방법입니다.
(1) 조건에 따른 필터링
loc 및 iloc 속성과 논리 연산자(예: &, |, ~ 등)를 사용하여 데이터를 필터링합니다. 예를 들어 나이가 18세 이상이고 성별이 여성인 데이터를 필터링하려면:
df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
(2) 태그 기반 필터링
특정 태그에 대한 데이터를 필터링하려면 loc 속성을 사용하세요. 예를 들어 "Zhang"이라는 성이 있는 데이터를 필터링합니다.
df.loc[df['last_name'] == '张']
(3) 범위별 필터링
특정 범위 내의 데이터를 필터링하려면 loc 속성을 사용합니다. 예를 들어 18~30세 사이의 데이터를 필터링합니다.
df.loc[(df['age'] >= 18) & (df['age'] <= 30)]
(4) 여러 조건으로 필터링
여러 조건을 충족하는 데이터를 필터링하려면 쿼리 메서드를 사용하세요. 예를 들어, 나이가 18세 이상이고 성별이 여성인 데이터를 필터링합니다:
df.query('age >= 18 & gender == "female"')
4. 데이터 정렬
데이터를 정렬하려면 sort_values() 메서드를 사용하세요. 예를 들어 연령을 기준으로 오름차순으로 정렬합니다.
df.sort_values('age', ascending=True)
5. 데이터 그룹화 및 집계
groupby() 메서드를 사용하여 데이터를 그룹화하고 집계 함수(예: sum(), 평균(), count() 사용) 등)을 사용하여 각 그룹을 그룹화하여 계산합니다. 예를 들어 각 성별 그룹의 평균 연령을 계산해 보세요.
df.groupby('gender').mean()['age']
위 내용은 팬더에서 데이터를 필터링하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!