ホームページ >バックエンド開発 >Python チュートリアル >パンダで重複を削除する方法は何ですか?

パンダで重複を削除する方法は何ですか?

百草オリジナル: 2023-11-22 11:55:173980ブラウズ

パンダの重複排除メソッドは次のとおりです: 1. drop_duplicates() メソッドを使用します; 2. duplicated() メソッドを使用します; 3. unique() メソッドを使用します; 4. value_counts() メソッドを使用します。詳細な紹介: 1. Drop_duplicates() メソッドを使用して、データフレーム内の重複行を削除し、新しいデータフレームを返します。保持順序や重複排除後の重複排除の指定など、重複排除の実行方法を制御するパラメーターを設定できます。コラムなど。

パンダで重複を削除する方法は何ですか?

このチュートリアルのオペレーティングシステム: Windows 10 システム、DELL G3 コンピューター。

Pandas は、さまざまな重複削除方法を提供する強力な Python データ分析ライブラリです。 Pandas を使用して重複排除操作を実行する一般的な方法は次のとおりです:

1.drop_duplicates() メソッドを使用します

drop_duplicates() メソッドは、データフレーム内の重複行を削除して戻り値を返すために使用されます。新しいデータフレーム。パラメータを設定して、重複排除後の保持順序、重複排除中の比較列の指定など、重複排除の実行方法を制御できます。

サンプルコード:

import pandas as pd  
  
df = pd.DataFrame({&#39;A&#39;: [1, 2, 1, 2, 3], &#39;B&#39;: [4, 5, 6, 7, 8]})  
df_unique = df.drop_duplicates()  # 默认情况下，按行进行去重，返回新的数据框

2.duplicated() メソッドの使用

duplicated() メソッドは、データフレーム内の重複行を検索し、ブール系列を返すために使用されます。。パラメータを設定して、重複排除後の保持順序、重複排除中の比較列の指定など、重複排除の実行方法を制御できます。

サンプルコード:

import pandas as pd  
  
df = pd.DataFrame({&#39;A&#39;: [1, 2, 1, 2, 3], &#39;B&#39;: [4, 5, 6, 7, 8]})  
df_unique = df[~df.duplicated()]  # 使用duplicated()方法查找重复的行，并使用逻辑非运算符返回不重复的行

3. unique() メソッドを使用します

unique() メソッドは、データフレーム内のすべての一意の値を返し、リストまたは Series オブジェクト。単一または複数の列の重複排除に使用できます。

サンプルコード:

import pandas as pd  
  
df = pd.DataFrame({&#39;A&#39;: [1, 2, 1, 2, 3], &#39;B&#39;: [4, 5, 6, 7, 8]})  
df_unique = df.apply(lambda x: pd.Series(x.unique()))  # 使用apply()方法对每一列进行去重，并返回一个Series对象

4. value_counts() メソッドを使用する

value_counts() メソッドは、データフレーム内の各値の出現数をカウントするために使用されます。 Series オブジェクトを返します。単一または複数の列の重複排除に使用できます。

サンプルコード:

import pandas as pd  
  
df = pd.DataFrame({&#39;A&#39;: [1, 2, 1, 2, 3], &#39;B&#39;: [4, 5, 6, 7, 8]})  
df_unique = df.groupby(df.columns.tolist()).size().reset_index(name=&#39;counts&#39;)  # 对整个数据框进行分组计数，并返回一个Series对象，然后使用reset_index()方法转换为数据框格式，方便查看每个值的出现次数

以上がパンダで重複を削除する方法は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Python pandas 对象数据分析

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：numpyの次元を増やす方法次の記事：numpyの次元を増やす方法

続きを見る