ホームページ >バックエンド開発 >Python チュートリアル >Pandas シリーズ内の連続する重複を削除するにはどうすればよいですか?

Pandas シリーズ内の連続する重複を削除するにはどうすればよいですか?

How to Remove Consecutive Duplicates in a Pandas Series?

Pandas での連続した重複の削除

Pandas シリーズから連続した重複を削除するには、いくつかの方法を使用できます。

方法 1: 使用するShift

最も効率的なアプローチは、shift() 関数を活用することです。

a.loc[a.shift() != a]

このメソッドは、シリーズをそれ自体のシフトされたバージョンと比較し、連続する重複が存在するブールマスクを作成します。

方法 2: を使用するDiff

別の方法は diff() 関数を使用することです:

a.loc[a.diff() != 0]

ただし、このアプローチは大規模なデータセットの場合は若干遅くなります。

更新:

shift() をデフォルトの期間で使用することに注意することが重要です。 1 は、shift(1) と同等です。したがって、次のコードでも目的の出力が生成されます。

a.loc[a.shift(1) != a]

これらのメソッドを利用すると、pandas シリーズから連続する重複を効果的に削除し、個別の値のみが保持されるようにすることができます。

以上がPandas シリーズ内の連続する重複を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

続きを見る