ホームページ  >  記事  >  バックエンド開発  >  Python は複数属性の重複データを重複排除します

Python は複数属性の重複データを重複排除します

不言
不言オリジナル
2018-04-18 15:29:532326ブラウズ

以下は、複数属性の重複データを重複排除する Python の例です。これは、優れた参考値であり、皆さんの役に立つことを願っています。一緒に見てみましょう

Pythonのpandasモジュールでデータを重複排除する手順:

1) DataFrameのduplicateメソッドを使用して、各行に重複行があるかどうかを示すブール系列を返します。重複行は FALSE として表示され、重複行は TRUE として表示されます。

2) DataFrame の Drop_duplicates メソッドを使用して、重複行が削除された DataFrame を返します。

注:

duplicateメソッドとdrop_duplicatesメソッドにパラメータが設定されていない場合、これら2つのメソッド名に指定された属性名(または列)が追加されている場合、これら2つのメソッドはデフォルトですべてを判定します。たとえば、frame.drop_duplicates(['state']) のように、いくつかの列 (状態列) を指定して重複を特定します。

具体的な例は次のとおりです。

以上がPython は複数属性の重複データを重複排除しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。