>  기사  >  백엔드 개발  >  Pandas 데이터 필터링의 핵심 지식 포인트를 빠르게 마스터하세요

Pandas 데이터 필터링의 핵심 지식 포인트를 빠르게 마스터하세요

WBOY
WBOY원래의
2024-01-24 08:07:061223검색

Pandas 데이터 필터링의 핵심 지식 포인트를 빠르게 마스터하세요

Pandas 데이터 필터링의 핵심 지식 포인트를 빠르게 익히려면 구체적인 코드 예제가 필요합니다.

개요:
Pandas는 데이터를 처리하고 분석하기 위한 풍부한 기능과 도구를 제공하는 강력한 데이터 분석 라이브러리입니다. 그 중 데이터 필터링은 Pandas의 중요한 작업 중 하나로, 데이터에서 우리가 관심 있는 정보를 추출하는 데 도움을 줄 수 있습니다. 이 기사에서는 Pandas의 데이터 필터링에 대한 주요 지식 포인트를 소개하고 독자가 이 중요한 기술을 빠르게 익힐 수 있도록 구체적인 코드 예제를 제공합니다.

  1. 부울 인덱스를 사용하여 데이터 필터링
    부울 인덱스는 조건식을 기반으로 한 필터링 방법으로, 특정 조건에 따라 데이터를 필터링할 수 있습니다. 다음은 부울 인덱스를 사용하여 데이터를 필터링하는 샘플 코드입니다.
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选age大于30的数据
age_filter = df['age'] > 30
filtered_data = df[age_filter]
print(filtered_data)

출력 결과:

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. isin() 메서드를 사용하여 데이터 필터링
    isin() 메서드를 사용하여 열의 값이 다음과 같은지 확인할 수 있습니다. a 주어진 목록에는 각 값이 조건을 충족하는지 여부를 나타내는 일련의 부울 값이 반환됩니다. 다음은 isin() 메서드를 사용하여 데이터를 필터링하는 샘플 코드입니다.
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选name在给定列表中的数据
filter_names = ['Alice', 'Charlie']
filtered_data = df[df['name'].isin(filter_names)]
print(filtered_data)

출력 결과:

      name  age gender
0    Alice   25      F
2  Charlie   35      M
  1. 조건식을 사용하여 데이터 필터링
    위의 두 가지 일반적으로 사용되는 메서드 외에도 Pandas는 더 유연한 기능을 제공합니다. 조건식 데이터를 필터링하는 방법. 비교 연산자(예: >,
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 筛选年龄大于30且性别为男性的数据
filtered_data = df[(df['age'] > 30) & (df['gender'] == 'M')]
print(filtered_data)

출력 결과:

      name  age gender
2  Charlie   35      M
3    David   40      M
  1. query() 메서드를 사용하여 데이터 필터링
    query() 메서드는 SQL과 유사한 구문을 사용하여 데이터를 필터링할 수 있습니다. 직관적이고 간결하게 데이터를 필터링하세요. 다음은 query() 메서드를 사용하여 데이터를 필터링하는 샘플 코드입니다.
import pandas as pd

# 创建一个示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)

# 使用query()方法筛选年龄大于30且性别为男性的数据
filtered_data = df.query('age > 30 and gender == "M"')
print(filtered_data)

출력 결과:

      name  age gender
2  Charlie   35      M
3    David   40      M

요약:
이 문서에서는 Pandas의 데이터 필터링에 대한 주요 지식 포인트를 소개하고 구체적인 코드 예제를 제공합니다. 이러한 지식 포인트를 숙지함으로써 독자는 대량의 데이터에서 필요한 정보를 보다 효율적으로 추출할 수 있습니다. 이 글이 독자들이 Pandas 데이터 스크리닝 기술을 빠르게 익히고 데이터 분석 능력을 향상시키는 데 도움이 되기를 바랍니다.

위 내용은 Pandas 데이터 필터링의 핵심 지식 포인트를 빠르게 마스터하세요의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.