Comment supprimer les lignes en double dans des colonnes spécifiques dans Pandas ?-Tutoriel Python-php.cn

Maison

développement back-end

Tutoriel Python

Comment supprimer les lignes en double dans des colonnes spécifiques dans Pandas ?

Patricia Arquette

Dec 14, 2024 am 06:03 AM

How to Drop Duplicate Rows Across Specific Columns in Pandas?

Suppression de lignes avec des valeurs en double dans plusieurs colonnes à l'aide de Python Pandas

La fonction pandas drop_duplicates est un outil puissant pour supprimer les lignes en double d'un DataFrame, mais que se passe-t-il si vous seulement souhaitez supprimer les lignes qui sont des doublons dans un sous-ensemble de colonnes ?

Exemple

Considérez le DataFrame suivant :

A	B	C
foo	0	A
foo	1	A
foo	1	B
bar	1	A

Supposons que vous souhaitiez supprimer les lignes qui correspondent aux colonnes A et C. Dans ce cas, vous voudriez pour supprimer les lignes 0 et 1.

Utiliser drop_duplicates avec le keep Paramètre

Pour y parvenir, vous pouvez utiliser la fonction drop_duplicates avec le paramètre keep défini sur False. Ce paramètre spécifie comment gérer les lignes en double. Par défaut, keep est défini sur first, ce qui signifie que la première occurrence d'une ligne en double sera conservée. Définir keep sur False supprimera toutes les lignes en double.

Le code suivant montre comment supprimer les lignes avec des valeurs en double dans les colonnes A et C :

import pandas as pd

df = pd.DataFrame({"A": ["foo", "foo", "foo", "bar"], "B": [0, 1, 1, 1], "C": ["A", "A", "B", "A"]})

# Drop rows with duplicate values in columns 'A' and 'C'
df = df.drop_duplicates(subset=['A', 'C'], keep=False)

print(df)

Sortie :

  A  B  C
2 foo  1  B
3 bar  1  A

Comme vous pouvez le constater, les lignes 0 et 1 ont été supprimées, car elles sont en double par rapport aux colonnes A et C.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Comment coupez-vous une liste de python?May 02, 2025 am 12:14 AM

SlitingyPapyThonListIsDoneUsingTheSyntaxList [Démarrage: arrêt: étape] .He'showitworks: 1) startisheindexofthefirStelementoinclude.2) stopisTheIndexoftheFirstelementsoexclude.3) StepistheincrementBetweenselans.it'susefulfactingPortationSoListShsandCanusegeg

Quelles sont les opérations communes qui peuvent être effectuées sur des tableaux Numpy?May 02, 2025 am 12:09 AM

NumpyAllowsForvariousOperations ONARRAYS: 1) BasicarithmeticLikeaddition, Soustraction, Multiplication, anddivision; 2) AdvancedOperationSuchasmatrixMultiplication; 3) Element-Wiseoperations withoutExplicitloop

Comment les tableaux sont-ils utilisés dans l'analyse des données avec Python?May 02, 2025 am 12:09 AM

ArraySinpython, en particulier ThroughNumpyandPandas, aressentialfordataanalysis, offingspeeedAfficiency.1) numpyarrayablefficienthandlingoflargedatasetsandComplexOperationsLikEMoVingAverages.2)

Comment l'empreinte mémoire d'une liste se compare-t-elle à l'empreinte de la mémoire d'un tableau dans Python?May 02, 2025 am 12:08 AM

ListsandNumpyArraysInpythonHaveDidifferentMemoryfootprints: listsaRemoreFlexibles Butlessmemory économe, tandis que la liste de résensés est-ce qui

Comment gérez-vous les configurations spécifiques à l'environnement lors du déploiement de scripts Python exécutables?May 02, 2025 am 12:07 AM

ToenSurepythonscriptsBeHavecorrectlyAcrossDevelopment, mise en scène et production, catégories de type: 1) EnvironmentVariblesForsImplesettings, 2) ConfigurationFilesForComplexsetups et3) dynamicloadingforadaptability.eachMethodoffersNebeneFitsAndreCeresca

Comment trancher un tableau Python?May 01, 2025 am 12:18 AM

La syntaxe de base pour le découpage de la liste Python est la liste [Démarrage: arrêt: étape]. 1.Start est le premier index d'élément inclus, 2.STOP est le premier indice d'élément exclu et 3.StEP détermine la taille de l'étape entre les éléments. Les tranches sont non seulement utilisées pour extraire les données, mais aussi pour modifier et inverser les listes.

Dans quelles circonstances les listes pourraient-elles mieux fonctionner que les tableaux?May 01, 2025 am 12:06 AM

ListesoutPerformarRaySin: 1) dynamicingizingandfrequentinSertions / Deletions, 2) StoringheteroGeneousData, and3) MemoryEfficiencyForsparsedata, butmayhaveslightperformanceCostSincertorations.

Comment pouvez-vous convertir un tableau Python en une liste Python?May 01, 2025 am 12:05 AM

Toconvertapythonarraytoalist, usethelist () Constructororageneratorexpression.1) ImportTheArrayModuleandCreateArray.2) Uselist (Arr) ou [Xforxinarr] à Convertittoalist, considérant la performance et le domaine de l'émie-efficacité pour les étages.

See all articles