ホームページ >バックエンド開発 >Python チュートリアル >パンダで重複を削除する方法は何ですか?
パンダの重複排除メソッドは次のとおりです: 1. drop_duplicates() メソッドを使用します; 2. duplicated() メソッドを使用します; 3. unique() メソッドを使用します; 4. value_counts() メソッドを使用します。詳細な紹介: 1. Drop_duplicates() メソッドを使用して、データ フレーム内の重複行を削除し、新しいデータ フレームを返します。保持順序や重複排除後の重複排除の指定など、重複排除の実行方法を制御するパラメーターを設定できます。コラムなど。
このチュートリアルのオペレーティング システム: Windows 10 システム、DELL G3 コンピューター。
Pandas は、さまざまな重複削除方法を提供する強力な Python データ分析ライブラリです。 Pandas を使用して重複排除操作を実行する一般的な方法は次のとおりです:
1.drop_duplicates() メソッドを使用します
drop_duplicates() メソッドは、データ フレーム内の重複行を削除して戻り値を返すために使用されます。新しいデータフレーム。パラメータを設定して、重複排除後の保持順序、重複排除中の比較列の指定など、重複排除の実行方法を制御できます。
サンプル コード:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.drop_duplicates() # 默认情况下,按行进行去重,返回新的数据框
2.duplicated() メソッドの使用
duplicated() メソッドは、データ フレーム内の重複行を検索し、ブール系列を返すために使用されます。 。パラメータを設定して、重複排除後の保持順序、重複排除中の比較列の指定など、重複排除の実行方法を制御できます。
サンプルコード:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df[~df.duplicated()] # 使用duplicated()方法查找重复的行,并使用逻辑非运算符返回不重复的行
3. unique() メソッドを使用します
unique() メソッドは、データ フレーム内のすべての一意の値を返し、リストまたは Series オブジェクト。単一または複数の列の重複排除に使用できます。
サンプル コード:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.apply(lambda x: pd.Series(x.unique())) # 使用apply()方法对每一列进行去重,并返回一个Series对象
4. value_counts() メソッドを使用する
value_counts() メソッドは、データ フレーム内の各値の出現数をカウントするために使用されます。 Series オブジェクトを返します。単一または複数の列の重複排除に使用できます。
サンプルコード:
import pandas as pd df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]}) df_unique = df.groupby(df.columns.tolist()).size().reset_index(name='counts') # 对整个数据框进行分组计数,并返回一个Series对象,然后使用reset_index()方法转换为数据框格式,方便查看每个值的出现次数
以上がパンダで重複を削除する方法は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。