>백엔드 개발 >파이썬 튜토리얼 >Pandas를 사용하여 행 데이터 삭제에 대한 자습서

Pandas를 사용하여 행 데이터 삭제에 대한 자습서

WBOY
WBOY원래의
2024-01-09 14:33:534815검색

Pandas를 사용하여 행 데이터 삭제에 대한 자습서

pandas 튜토리얼: 팬더를 사용하여 데이터 행을 삭제하는 방법, 구체적인 코드 예제가 필요합니다

소개:
데이터 분석 및 처리에서 데이터를 정리하고 처리해야 하는 경우가 많으며 불필요하거나 잘못된 데이터 행을 삭제해야 합니다. 데이터 세트에는 A 일반적인 작업이 있습니다. Python에서 pandas 라이브러리는 강력한 데이터 조작 도구를 제공합니다. 이 기사에서는 pandas를 사용하여 행 데이터를 삭제하는 방법을 소개하고 특정 코드 예제를 제공합니다.

  1. Pandas 라이브러리 가져오기
    시작하기 전에 먼저 Pandas 라이브러리를 가져와야 합니다.

Pandas를 pd로 가져오기

  1. 샘플 데이터 만들기
    먼저 일부 데이터 행이 포함된 샘플 데이터를 만들어 보겠습니다. 다음 코드는 "data"라는 DataFrame 개체를 만들고 일부 데이터 행을 추가합니다.

data = {'이름': ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu', 'Liu Qi'],

    '年龄': [20, 25, 30, 35, 40],
    '性别': ['男', '男', '女', '男', '女']}

df = pd.DataFrame(data)

print("원본 데이터:")
print(df)

출력 결과:
원본 데이터:
이름 나이 성별
0 Zhang San 20 남성
1 Li Si 25 남성
2 Wang Wu 30 여성
3 Zhao Liu 35 남성
4 Liu Qi 40 여성

  1. 조건을 사용하여 행 데이터 삭제
    pandas는 행 데이터를 삭제하는 다양한 방법을 제공합니다. 가장 일반적인 방법은 조건을 통해 행을 삭제하는 것, 즉 특정 조건을 만족하는 행 데이터만 삭제하는 것이다. 다음 샘플 코드는 기간이 30 이상인 행을 삭제하는 방법을 보여줍니다.

df = df[df['age']

print("30보다 크거나 같은 데이터 삭제:")
print(df)

출력 결과:
연령이 포함된 데이터 삭제 30 이상 :
이름 나이 성별
0 Zhang San 20 남자
1 Li Si 25 남자

  1. 인덱스를 사용하여 행 데이터 삭제
    조건을 사용하여 삭제하는 것 외에도 인덱스를 사용하여 행을 삭제할 수도 있습니다. 데이터 세트. 행의 인덱스 레이블을 지정하면 팬더는 지정된 데이터 행을 쉽게 삭제할 수 있습니다. 다음 샘플 코드는 데이터의 첫 번째 행과 마지막 행을 삭제하는 방법을 보여줍니다.

df = df.drop([0, 4])

print("데이터의 첫 번째 및 마지막 행 삭제:")
print(df)

출력 결과:
첫 번째 및 마지막 행 삭제 데이터:
이름 나이 성별
1 Li Si 25 남자
2 Wang Wu 30 여자
3 Zhao Liu 35 남자

  1. 행 번호를 사용하여 행 데이터 삭제
    색인 태그를 사용하는 것 외에도 행 번호를 사용하여 행 데이터를 삭제할 수도 있습니다 . Pandas는 행 번호를 설정하여 지정된 행 데이터를 삭제할 수 있는 "iloc" 메서드를 제공합니다. 다음 샘플 코드는 데이터의 두 번째 및 세 번째 행을 삭제하는 방법을 보여줍니다.

df = df.drop(df.index[[1, 2]])

print("두 번째 및 세 번째 행의 데이터 삭제:")
print(df)

출력 결과:
Delete Data 두 번째 및 세 번째 행:
이름 나이 성별
0 Zhang San 20 남성
3 Zhao Liu 35 남성

  1. 원본 데이터 수정
    위 예에서 행 데이터 삭제는 DataFrame 개체의 복사본에서 수행됩니다. 원본 데이터는 변경되지 않습니다. 원본 데이터를 수정하려면 "inplace=True" 매개변수를 추가해야 합니다. 아래 샘플 코드는 원본 데이터에서 직접 조건을 충족하는 행을 삭제하는 방법을 보여줍니다.

df.drop(df[df['age'] >= 30].index, inplace=True)

print("원본 데이터에서 직접 나이가 30 이상인 데이터를 삭제합니다." )
print( df)

출력 결과:
원본 데이터에서 직접 나이가 30세 이상인 데이터 삭제:
이름 연령 성별
0 Zhang San 20 남성
1 Li Si 25 남성

결론:
pandas 라이브러리와 위의 코드 예제를 사용하면 DataFrame 객체의 행 데이터를 쉽게 삭제할 수 있습니다. 조건, 인덱스 레이블 또는 행 번호를 통해 특정 조건을 충족하는 데이터 행을 선택적으로 삭제할 수 있습니다. 이는 데이터 정리 및 처리를 위한 매우 편리한 도구와 방법을 제공합니다.

위 내용은 Pandas를 사용하여 행 데이터 삭제에 대한 자습서의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.