Maison >développement back-end >Tutoriel Python >Qu'est-ce que la fonction de déduplication Python ?

Qu'est-ce que la fonction de déduplication Python ?

爱喝马黛茶的安东尼original: 2019-10-22 15:19:448842parcourir

La déduplication des données peut utiliser les méthodes duplicated() et drop_duplicates().

DataFrame.duplicate(subset=None, keep='first') renvoie une série booléenne représentant les lignes en double

Paramètres :

sous-ensemble : étiquette de colonne ou séquence d'étiquettes, facultatif

Seules certaines colonnes sont prises en compte pour identifier les doublons, toutes les colonnes sont utilisées par défaut

conserver : {'first', 'last', False}, par défaut 'first'

first : marque les doublons, True sauf pour la première occurrence.

last : marque les doublons, True sauf pour la dernière occurrence.

Erreur : marquez tous les doublons comme vrais.

Recommandations associées : "Tutoriel sur les bases de Python"

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
df = pd.read_csv(&#39;./demo_duplicate.csv&#39;)
print(df)
print(df[&#39;Seqno&#39;].unique()) # [0. 1.]
# 使用duplicated 查看重复值
# 参数 keep 可以标记重复值 {&#39;first&#39;，&#39;last&#39;，False}
print(df[&#39;Seqno&#39;].duplicated())
&#39;&#39;&#39;
0    False
1     True
2     True
3     True
4    False
Name: Seqno, dtype: bool
&#39;&#39;&#39;
# 删除 series 重复数据
print(df[&#39;Seqno&#39;].drop_duplicates())
&#39;&#39;&#39;
0    0.0
4    1.0
Name: Seqno, dtype: float64
&#39;&#39;&#39;
# 删除 dataframe 重复数据
print(df.drop_duplicates([&#39;Seqno&#39;])) # 按照 Seqno 来去重
&#39;&#39;&#39;
   Price     Seqno   Symbol   time
0  1623.0    0.0   APPL  1473411962
4  1649.0    1.0   APPL  1473411963
&#39;&#39;&#39;
# drop_dujplicates() 第二个参数 keep 包含的值 有： first、last、False
print(df.drop_duplicates([&#39;Seqno&#39;], keep=&#39;last&#39;)) # 保存最后一个
&#39;&#39;&#39;
   Price     Seqno   Symbol   time
3  1623.0    0.0   APPL  1473411963
4  1649.0    1.0   APPL  1473411963
&#39;&#39;&#39;

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Comment saisir π en pythonArticle suivant：Comment saisir π en python

Articles Liés

Voir plus