>백엔드 개발 >파이썬 튜토리얼 >여러 열의 조합을 기반으로 데이터를 필터링하는 Pandas 방법

여러 열의 조합을 기반으로 데이터를 필터링하는 Pandas 방법

不言
不言원래의
2018-06-04 16:33:056468검색

이 글에서는 여러 열의 조합에 따라 데이터를 필터링하는 Pandas 방법을 주로 소개합니다. 이제 필요한 친구들이 참고할 수 있도록 공유하겠습니다.

A 파일:

예를 들어 "설계 우물 유형", "생산 우물 유형", "현재 우물 유형"의 세 열에 있는 데이터를 필터링하고 싶습니다.

물론 여기의 필터링 조건은 사용자 요구에 따라 자유롭게 조정할 수 있습니다. 코드는 다음과 같습니다.

# -*- coding: utf-8 -*-
"""
Created on Wed Nov 29 10:46:31 2017
@author: wq
"""
import pandas as pd
#input.csv是那个大文件,有很多很多行
df1 = pd.read_csv(u'input.csv', encoding='gbk')
#加encoding=‘gbk'是因为文件中存在中文,不加可能出现乱码
#这里的筛选条件可以根据用户需要进行修改
outfile = df1[(df1[u'设计井别']=='11') & (df1[u'投产井别']=='11') &(df1[u'目前井别']=='11')]
outfile.to_csv('outfile.csv', index=False, encoding='gbk')

때로는 반대 요구 사항이 있어 삭제해야 할 때도 있습니다. "설계 우물 카테고리", "생산 우물 카테고리" 및 "현재 우물 카테고리" "세 개의 데이터 열이 모두 11개인 행의 효과는 다음과 같습니다.

코드는 다음과 같습니다.

#input.csv是那个大文件,有很多很多行
df1 = pd.read_csv(u'input.csv', encoding='gbk')
df2 = pd.read_csv(u'outfile.csv', encoding='gbk')
#加encoding=‘gbk'是因为文件中存在中文,不加可能出现乱码
index = ~df1[u'汉字井号'].isin(df2[u'汉字井号'])
df4 = df1[index]
df4.to_csv('outfile1.csv', index=False, encoding='gbk')

관련 권장 사항: Pandas 데이터 샘플을 기반으로 행과 열을 선택하는 방법

,


Pandas 데이터 처리의 기본: 지정된 행 또는 열의 데이터 필터링

위 내용은 여러 열의 조합을 기반으로 데이터를 필터링하는 Pandas 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.