집 >백엔드 개발 >파이썬 튜토리얼 >Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

王林원래의: 2024-01-10 09:09:42786검색

Pandas 실용 가이드: 데이터 행을 빠르게 삭제하기 위한 팁

개요:
Pandas는 강력한 데이터 처리 및 조작 기능을 갖춘 Python에서 일반적으로 사용되는 데이터 분석 라이브러리입니다. 데이터 처리 중에 불필요한 행 데이터를 삭제해야 하는 경우가 많습니다. 이 기사에서는 팬더를 사용하여 행 데이터를 삭제하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다.

1. 특정 조건에서 행 데이터 삭제

특정 값이 있는 행 삭제:
Pandas에서는 DataFrame의 drop 메서드를 사용하여 특정 값이 있는 행을 삭제할 수 있습니다. 먼저 샘플 데이터 세트를 생성해야 합니다.

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

이제 성별이 남성인 행을 삭제하려면 다음 코드를 사용하면 됩니다.

df = df.drop(df[df['Gender'] == 'Male'].index)

실행 후 성별이 남성인 행 데이터가 삭제됩니다. df에서.
코드 분석:

df['Gender'] == 'Male'은 Gender 열에 Male 값이 있는 행을 나타내는 부울 계열 개체를 반환하는 조건부 판단문입니다. df['Gender'] == 'Male' 是一个条件判断语句，返回一个布尔类型的Series对象，表示Gender列中值为Male的行；
df[df['Gender'] == 'Male'].index 返回索引，即Gender为'Male'的行所在的索引位置；
df.drop() 方法可以根据索引删除行。

删除空值行：
有时候需要删除包含空值的行数据，例如：

import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

我们可以使用dropna()方法删除包含空值的行：

df = df.dropna()

运行后，df将删除包含空值的行数据。

删除重复行：
若数据集中包含重复的行，我们可以使用drop_duplicates()方法删除重复行数据：

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

现在我们可以使用以下代码删除重复行：

df = df.drop_duplicates()

二、根据行索引删除行
有时我们需要根据行索引进行删除，可以使用drop()df[df['Gender'] == 'Male'].index 성별이 'Male'인 행의 인덱스 위치, 즉 인덱스를 반환합니다.

df .drop() 메소드는 인덱스를 기반으로 행을 삭제할 수 있습니다.

null 값이 있는 행 삭제:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

dropna() null 값이 포함된 행을 삭제하는 방법: <p><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre></p>실행 후 df는 null 값이 포함된 행 데이터를 삭제합니다. <p></p>
<ol start="3">중복 행 삭제: <p>데이터 세트에 중복 행이 포함된 경우 <code>drop_duplicates()

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

df = df.drop([1, 2])

drop()

df = df.drop(df.index[1:4])

위 내용은 Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python pandas 布尔类型切片对象数据分析

성명：

이전 기사：matplotlib를 사용하여 처음부터 그리는 방법 알아보기다음 기사：matplotlib를 사용하여 처음부터 그리는 방법 알아보기