>  기사  >  백엔드 개발  >  Pandas 데이터 필터링에 대한 실용적인 팁과 예

Pandas 데이터 필터링에 대한 실용적인 팁과 예

PHPz
PHPz원래의
2024-01-24 09:23:151068검색

Pandas 데이터 필터링에 대한 실용적인 팁과 예

데이터 필터링에 Pandas를 사용하는 실용 팁

Pandas는 데이터 분석 및 데이터 과학에 널리 사용되는 강력한 데이터 처리 라이브러리입니다. 데이터 필터링은 데이터 처리 중 일반적인 작업입니다. 이 기사에서는 데이터 필터링에 Pandas를 사용하는 방법을 소개하고 구체적인 코드 예제를 제공합니다.

1. 조건에 따라 데이터 필터링

  1. 조건 연산자를 사용하여 필터링

Pandas는 조건에 따라 데이터를 필터링할 수 있는 다양한 조건 연산자를 제공합니다. 일반적으로 사용되는 연산자에는 같음(==), 같지 않음(!=), 초과(>), 미만(=), 작거나 같음(

예를 들어, 학생의 이름(name), 나이(age) 및 점수(점수)가 포함된 DataFrame 개체 df가 있다고 가정합니다. 90점:

df_filtered = df[df['score'] >= 90]
  1. 여러 조건을 사용하여 필터링

Pandas는 단일 조건 외에도 데이터 필터링에 여러 조건 사용을 지원합니다. 조건은 논리 연산자 and, or, not을 사용하여 결합할 수 있습니다.

예를 들어, 18세에서 25세 사이이고 점수가 80점 이상인 학생의 데이터를 필터링한다고 가정해 보겠습니다.

df_filtered = df[(df['age'] >= 18) & (df['age'] <= 25) & (df['score'] >= 80)]

2. 다음을 기준으로 데이터를 필터링합니다. index

Pandas의 DataFrame 객체는 기본적으로 정수 인덱스가 자동으로 생성되어 데이터 필터링에 사용될 수 있습니다.

  1. 위치 인덱스를 사용한 필터링

iloc 속성을 사용하면 행과 열의 위치 인덱스를 기반으로 데이터를 필터링할 수 있습니다.

예를 들어 행 2에서 5까지의 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.

df_filtered = df.iloc[2:6, :]
  1. 레이블 인덱스를 사용하여 필터링

레이블 인덱스가 DataFrame 개체에 설정되어 있으면 태그 인덱스를 기반으로 loc 속성 필터 데이터를 사용할 수 있습니다.

예를 들어 20세 이상의 학생 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.

df_filtered = df.loc[df['age'] >= 20, :]

3. 필드를 기준으로 데이터 필터링

조건 및 인덱스를 사용하여 필터링하는 것 외에도, 필드를 기반으로 데이터를 필터링할 수도 있습니다.

  1. 열 이름을 기준으로 데이터 필터링

열 이름을 사용하여 지정된 열 데이터를 필터링할 수 있습니다.

예를 들어 이름과 성적이라는 두 열의 데이터만 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.

df_filtered = df[['name', 'score']]
  1. 필드 값을 기준으로 데이터 필터링

필드 값에 해당하는 데이터를 필터링합니다.

예를 들어 점수가 80점에서 90점 사이인 학생 데이터를 필터링한다고 가정하면 다음 코드를 사용할 수 있습니다.

df_filtered = df[df['score'].between(80, 90)]

위는 조건, 인덱스 및 데이터 필터링을 유연하게 사용하여 Pandas를 사용하는 실용적인 팁입니다. 필드를 사용하면 필요한 데이터를 쉽게 필터링할 수 있습니다. 이 글이 귀하의 데이터 처리 과정에 도움이 되기를 바랍니다!

위 내용은 Pandas 데이터 필터링에 대한 실용적인 팁과 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.