>백엔드 개발 >파이썬 튜토리얼 >Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

王林
王林원래의
2024-01-10 09:09:42696검색

Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

Pandas 실용 가이드: 데이터 행을 빠르게 삭제하기 위한 팁

개요:
Pandas는 강력한 데이터 처리 및 조작 기능을 갖춘 Python에서 일반적으로 사용되는 데이터 분석 라이브러리입니다. 데이터 처리 중에 불필요한 행 데이터를 삭제해야 하는 경우가 많습니다. 이 기사에서는 팬더를 사용하여 행 데이터를 삭제하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다.

1. 특정 조건에서 행 데이터 삭제

  1. 특정 값이 있는 행 삭제:
    Pandas에서는 DataFrame의 drop 메서드를 사용하여 특정 값이 있는 행을 삭제할 수 있습니다. 먼저 샘플 데이터 세트를 생성해야 합니다.
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

이제 성별이 남성인 행을 삭제하려면 다음 코드를 사용하면 됩니다.

df = df.drop(df[df['Gender'] == 'Male'].index)

실행 후 성별이 남성인 행 데이터가 삭제됩니다. df에서.
코드 분석:

  • df['Gender'] == 'Male'은 Gender 열에 Male 값이 있는 행을 나타내는 부울 계열 개체를 반환하는 조건부 판단문입니다. df['Gender'] == 'Male' 是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;
  • df[df['Gender'] == 'Male'].index 返回索引,即Gender为'Male'的行所在的索引位置;
  • df.drop() 方法可以根据索引删除行。
  1. 删除空值行:
    有时候需要删除包含空值的行数据,例如:
import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

我们可以使用dropna()方法删除包含空值的行:

df = df.dropna()

运行后,df将删除包含空值的行数据。

  1. 删除重复行:
    若数据集中包含重复的行,我们可以使用drop_duplicates()方法删除重复行数据:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

现在我们可以使用以下代码删除重复行:

df = df.drop_duplicates()

二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()df[df['Gender'] == 'Male'].index 성별이 'Male'인 행의 인덱스 위치, 즉 인덱스를 반환합니다.

df .drop() 메소드는 인덱스를 기반으로 행을 삭제할 수 있습니다.

    null 값이 있는 행 삭제:

    때때로 null 값이 포함된 행 데이터를 삭제해야 하는 경우가 있습니다. 예:


    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)

    dropna() null 값이 포함된 행을 삭제하는 방법: <p><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre></p>실행 후 df는 null 값이 포함된 행 데이터를 삭제합니다. <p></p> <ol start="3">중복 행 삭제: <p>데이터 세트에 중복 행이 포함된 경우 <code>drop_duplicates() 메서드를 사용하여 중복 행 데이터를 삭제할 수 있습니다.

    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)

    이제 우리는 다음 코드는 중복 행을 삭제합니다.

    df = df.drop([1, 2])
    🎜 2. 행 인덱스를 기준으로 행 삭제 🎜 행 인덱스를 기준으로 삭제해야 하는 경우가 있습니다. drop() 메서드를 사용하여 행 데이터를 삭제할 수 있습니다. 인덱스를 기준으로 합니다. 🎜
    df = df.drop(df.index[1:4])
    🎜 인덱스 2가 있는 행을 삭제한다고 가정하면 다음 코드를 사용할 수 있습니다. 🎜rrreee🎜실행 후 인덱스 2가 있는 행이 삭제됩니다. 🎜🎜3. 여러 행 삭제🎜 여러 행을 삭제해야 하는 경우가 있는데, 이는 인덱싱된 목록을 전달하거나 슬라이싱을 사용하여 수행할 수 있습니다. 🎜rrreee🎜예 1: 인덱스 1과 2가 있는 행 삭제🎜rrreee🎜예 2: 인덱스 1~3이 있는 행 삭제🎜rrreee🎜위의 두 방법 모두 여러 행을 빠르게 삭제할 수 있습니다. 🎜🎜결론: 🎜이 글에서는 Pandas를 사용하여 행 데이터를 삭제하는 기술을 소개하고 구체적인 코드 예제를 제공합니다. 데이터를 처리하는 동안 이러한 기술을 사용하면 불필요한 데이터 행을 빠르고 효율적으로 삭제하는 데 도움이 될 수 있습니다. 독자들이 실제 응용 분야에서 유연하게 활용하여 데이터 처리 속도와 정확성을 높일 수 있기를 바랍니다. 🎜

위 내용은 Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.