Pandas 실용 가이드: 데이터 행을 빠르게 삭제하기 위한 팁
개요:
Pandas는 강력한 데이터 처리 및 조작 기능을 갖춘 Python에서 일반적으로 사용되는 데이터 분석 라이브러리입니다. 데이터 처리 중에 불필요한 행 데이터를 삭제해야 하는 경우가 많습니다. 이 기사에서는 팬더를 사용하여 행 데이터를 삭제하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다.
1. 특정 조건에서 행 데이터 삭제
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
이제 성별이 남성인 행을 삭제하려면 다음 코드를 사용하면 됩니다.
df = df.drop(df[df['Gender'] == 'Male'].index)
실행 후 성별이 남성인 행 데이터가 삭제됩니다. df에서.
코드 분석:
df['Gender'] == 'Male'
은 Gender 열에 Male 값이 있는 행을 나타내는 부울 계열 개체를 반환하는 조건부 판단문입니다. df['Gender'] == 'Male'
是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;df[df['Gender'] == 'Male'].index
返回索引,即Gender为'Male'的行所在的索引位置;df.drop()
方法可以根据索引删除行。import pandas as pd import numpy as np data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, np.nan, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
我们可以使用dropna()
方法删除包含空值的行:
df = df.dropna()
运行后,df将删除包含空值的行数据。
drop_duplicates()
方法删除重复行数据:import pandas as pd data = {'Name': ['Alice', 'Bob', 'Bob', 'David'], 'Age': [25, 30, 30, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
现在我们可以使用以下代码删除重复行:
df = df.drop_duplicates()
二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()
df[df['Gender'] == 'Male'].index
성별이 'Male'인 행의 인덱스 위치, 즉 인덱스를 반환합니다.
df .drop()
메소드는 인덱스를 기반으로 행을 삭제할 수 있습니다.
null 값이 있는 행 삭제:
때때로 null 값이 포함된 행 데이터를 삭제해야 하는 경우가 있습니다. 예:import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
dropna() null 값이 포함된 행을 삭제하는 방법: <p><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre></p>실행 후 df는 null 값이 포함된 행 데이터를 삭제합니다. <p></p>
<ol start="3">중복 행 삭제: <p>데이터 세트에 중복 행이 포함된 경우 <code>drop_duplicates()
메서드를 사용하여 중복 행 데이터를 삭제할 수 있습니다.
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
df = df.drop([1, 2])🎜 2. 행 인덱스를 기준으로 행 삭제 🎜 행 인덱스를 기준으로 삭제해야 하는 경우가 있습니다.
drop()
메서드를 사용하여 행 데이터를 삭제할 수 있습니다. 인덱스를 기준으로 합니다. 🎜df = df.drop(df.index[1:4])🎜 인덱스 2가 있는 행을 삭제한다고 가정하면 다음 코드를 사용할 수 있습니다. 🎜rrreee🎜실행 후 인덱스 2가 있는 행이 삭제됩니다. 🎜🎜3. 여러 행 삭제🎜 여러 행을 삭제해야 하는 경우가 있는데, 이는 인덱싱된 목록을 전달하거나 슬라이싱을 사용하여 수행할 수 있습니다. 🎜rrreee🎜예 1: 인덱스 1과 2가 있는 행 삭제🎜rrreee🎜예 2: 인덱스 1~3이 있는 행 삭제🎜rrreee🎜위의 두 방법 모두 여러 행을 빠르게 삭제할 수 있습니다. 🎜🎜결론: 🎜이 글에서는 Pandas를 사용하여 행 데이터를 삭제하는 기술을 소개하고 구체적인 코드 예제를 제공합니다. 데이터를 처리하는 동안 이러한 기술을 사용하면 불필요한 데이터 행을 빠르고 효율적으로 삭제하는 데 도움이 될 수 있습니다. 독자들이 실제 응용 분야에서 유연하게 활용하여 데이터 처리 속도와 정확성을 높일 수 있기를 바랍니다. 🎜
위 내용은 Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!