ホームページ >バックエンド開発 >Python チュートリアル >Pythonでのpandas.DataFrameの基本操作について

Pythonでのpandas.DataFrameの基本操作について

Y2J
Y2Jオリジナル
2017-05-09 14:50:312543ブラウズ

この記事では、主に Python で pandas.DataFrame の特定の行を除外する方法を紹介します。この記事には詳細なサンプルコードが記載されているので、必要な方はぜひご参加ください。見てみましょう。

はじめに

Python をデータ分析に使用する場合、よく使用するデータ構造は pandas DataFrame です。Python での pandas.DataFrame の基本的な操作については、この記事を確認してください。

pandas.DataFrameは特定の行を除外します

Excelのように1つまたは特定の行のみをフィルタリングしたい場合は、isin()メソッドを使用して必要な行を追加できます値が渡されますリストとして渡すことも、フィルタリングする列を指定するために辞書を渡すこともできます。 isin()方法,将需要的行的值以列表方式传入,还可以传入字典,指定列进行筛选。

但是如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()方法。我今天的工作就遇到了这样的需求,经常查找之后,发现只能换种方式使用isin()来实现这个需求。

示例如下:

In [3]: df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB'
 ...: , 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2
 ...: ', 'p3'])

In [4]: df
Out[4]:
 p1 p2 p3
0 GD GX FJ
1 SD SX BJ
2 HN HB AH
3 HEN HEN HLJ
4 SH TJ CQ

如果只想要p1为GD和HN的两行,可以这么做:

In [8]: df[df.p1.isin(['GD', 'HN'])]
Out[8]:
 p1 p2 p3
0 GD GX FJ
2 HN HB AH

但是如果我们想要除了这两行之外的数据,就需要绕点路了。

原理是先把p1取出并转换为列表,然后再从列表中去不需要的行(值)去除,然后再在DataFrame中使用isin()

しかし、特定の行を含まないすべてのコンテンツのみが必要な場合は、isnotin() メソッドはありません。今日仕事でこのような要件に遭遇しました。頻繁に検索した結果、この要件を達成するには別の方法で isin() を使用するしかないことがわかりました。

例は次のとおりです:

In [9]: ex_list = list(df.p1)

In [10]: ex_list.remove('GD')

In [11]: ex_list.remove('HN')

In [12]: ex_list
Out[12]: ['SD', 'HEN', 'SH']

In [13]: df[df.p1.isin(ex_list)]
Out[13]:
 p1 p2 p3
1 SD SX BJ
3 HEN HEN HLJ
4 SH TJ CQ

p1がGDとHNである2つの行だけが必要な場合は、次のようにできます:

rrreeeしかし、これらの2つの行以外のデータが必要な場合は、次のようにする必要があります回り道。

原理としては、まずp1を取り出してリスト化し、リストから不要な行(値)を削除してからDataFrame内でisin()

rrreeeを使用します。 概要

【関連おすすめ】

1. 🎜Pythonの基本入門チュートリアル🎜🎜🎜3. 🎜Python meets データ収集のビデオチュートリアル🎜🎜

以上がPythonでのpandas.DataFrameの基本操作についての詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。