이 글에서는 여러 열의 조합에 따라 데이터를 필터링하는 Pandas 방법을 주로 소개합니다. 이제 필요한 친구들이 참고할 수 있도록 공유하겠습니다.
A 파일:
예를 들어 "설계 우물 유형", "생산 우물 유형", "현재 우물 유형"의 세 열에 있는 데이터를 필터링하고 싶습니다.
물론 여기의 필터링 조건은 사용자 요구에 따라 자유롭게 조정할 수 있습니다. 코드는 다음과 같습니다.# -*- coding: utf-8 -*- """ Created on Wed Nov 29 10:46:31 2017 @author: wq """ import pandas as pd #input.csv是那个大文件,有很多很多行 df1 = pd.read_csv(u'input.csv', encoding='gbk') #加encoding=‘gbk'是因为文件中存在中文,不加可能出现乱码 #这里的筛选条件可以根据用户需要进行修改 outfile = df1[(df1[u'设计井别']=='11') & (df1[u'投产井别']=='11') &(df1[u'目前井别']=='11')] outfile.to_csv('outfile.csv', index=False, encoding='gbk')때로는 반대 요구 사항이 있어 삭제해야 할 때도 있습니다. "설계 우물 카테고리", "생산 우물 카테고리" 및 "현재 우물 카테고리" "세 개의 데이터 열이 모두 11개인 행의 효과는 다음과 같습니다. 코드는 다음과 같습니다.
#input.csv是那个大文件,有很多很多行 df1 = pd.read_csv(u'input.csv', encoding='gbk') df2 = pd.read_csv(u'outfile.csv', encoding='gbk') #加encoding=‘gbk'是因为文件中存在中文,不加可能出现乱码 index = ~df1[u'汉字井号'].isin(df2[u'汉字井号']) df4 = df1[index] df4.to_csv('outfile1.csv', index=False, encoding='gbk')
관련 권장 사항: Pandas 데이터 샘플을 기반으로 행과 열을 선택하는 방법
, Pandas 데이터 처리의 기본: 지정된 행 또는 열의 데이터 필터링
위 내용은 여러 열의 조합을 기반으로 데이터를 필터링하는 Pandas 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!