Comment puis-je faire pivoter efficacement les DataFrames dans Pandas ?-Tutoriel Python-php.cn

Maison

développement back-end

Tutoriel Python

Comment puis-je faire pivoter efficacement les DataFrames dans Pandas ?

DDD

Dec 25, 2024 pm 01:29 PM

How Can I Efficiently Pivot DataFrames in Pandas?

Pivoter un DataFrame

Introduction

Le pivotement, également connu sous le nom de transposition, est une opération courante dans la transformation de données où les lignes et les colonnes sont permutées. Cela peut être utile pour des tâches telles que la refonte des données dans un format plus approprié ou la création de rapports résumant les données sur plusieurs dimensions. En Python, pandas propose plusieurs méthodes pour faire pivoter un DataFrame, chacune avec ses propres forces et limites.

Pivot de base

Pour le pivotement de base, vous pouvez utiliser les méthodes suivantes :

pandas.pivot_table : Cette méthode fournit une interface flexible pour faire pivoter les données en spécifiant les colonnes à utiliser comme lignes, colonnes et valeurs. Prend en charge diverses fonctions d'agrégation comme la moyenne, la somme, le nombre, etc.

pandas.DataFrame.groupby pandas.unstack : Regroupez les données par les colonnes souhaitées à l'aide de groupby, puis dépilez le MultiIndex résultant à l'aide dépiler pour créer le DataFrame pivoté.

Avancé Pivotement

Pour des opérations de pivotement plus complexes, vous pouvez utiliser les méthodes suivantes :

pandas.DataFrame.set_index pandas.unstack :Semblable à groupby mais plus efficace si vous êtes pivotant sur un ensemble unique de lignes et columns.

pandas.DataFrame.pivot : Une version plus concise de pivot_table mais avec des fonctionnalités limitées.

Autres méthodes

pandas. crosstab : Utile pour créer un tableau de contingence (tabulation croisée), un type de pivot qui agrège les données sur deux variables catégorielles.

pandas.factorize numpy.bincount : Une technique plus avancée qui peut être plus rapide pour certaines opérations. Utilise la factorisation pour convertir les valeurs catégorielles en entiers uniques, puis utilise bincount pour compter les occurrences.

pandas.get_dummies pandas.DataFrame.dot : Une manière créative d'effectuer des tableaux croisés à l'aide de variables factices .

Exemples

Voici quelques exemples d'utilisation de ceux-ci méthodes :

# Import pandas
import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({
    "key": ["a", "b", "c", "a", "b"],
    "row": [1, 2, 3, 4, 5],
    "col": ["col1", "col2", "col3", "col1", "col2"],
    "val": [10, 20, 30, 40, 50]
})

# Pivot using pivot_table
pivoted_df = pd.pivot_table(
    df, index="row", columns="col", values="val", aggfunc='mean', fill_value=0
)

# Pivot using groupby and unstack
pivoted_df = df.groupby(['row', 'col'])['val'].mean().unstack(fill_value=0)

aplatissement

Pour aplatir le multi-index du DataFrame pivoté, vous pouvez utiliser différentes approches selon les types de colonnes :

Si les colonnes sont des chaînes :

pivoted_df.columns = pivoted_df.columns.map('|'.join)

Si les colonnes sont tuples :

pivoted_df.columns = pivoted_df.columns.map('{0[0]}|{0[1]}'.format)

Notes supplémentaires

Lors de la sélection des colonnes à faire pivoter, assurez-vous qu'elles sont catégoriques ou qu'elles ont un nombre limité de valeurs uniques pour éviter de créer un DataFrame large avec de nombreuses colonnes.
Faites attention aux valeurs de remplissage lorsque vous utilisez des fonctions d'agrégation pour gérer les valeurs manquantes. data.
Envisagez d'utiliser des techniques d'amélioration des performances telles que set_index et factorisez pour les grands ensembles de données.
Explorez d'autres options comme pandas.wide_to_long si vous devez transposer des données d'un format large à un format long.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Merger des listes dans Python: Choisir la bonne méthodeMay 14, 2025 am 12:11 AM

TomegelistSinpython, vous pouvez faire l'opérateur, ExtendMethod, ListComprehension, oriteroTools.chain, chacun avec des avantages spécifiques: 1) l'opératorissimplebutlessoficiesivetforlatelists; 2) ExtendisMemory-EfficientButmodifiestheoriginallist; 3)

Comment concaténer deux listes dans Python 3?May 14, 2025 am 12:09 AM

Dans Python 3, deux listes peuvent être connectées via une variété de méthodes: 1) Utiliser l'opérateur, qui convient aux petites listes, mais est inefficace pour les grandes listes; 2) Utiliser la méthode Extende, qui convient aux grandes listes, avec une efficacité de mémoire élevée, mais modifiera la liste d'origine; 3) Utiliser * l'opérateur, qui convient à la fusion de plusieurs listes, sans modifier la liste originale; 4) Utilisez Itertools.chain, qui convient aux grands ensembles de données, avec une efficacité de mémoire élevée.

Chaînes de liste de concaténate pythonMay 14, 2025 am 12:08 AM

L'utilisation de la méthode join () est le moyen le plus efficace de connecter les chaînes à partir des listes de Python. 1) Utilisez la méthode join () pour être efficace et facile à lire. 2) Le cycle utilise les opérateurs de manière inefficace pour les grandes listes. 3) La combinaison de la compréhension de la liste et de la jointure () convient aux scénarios qui nécessitent une conversion. 4) La méthode Reduce () convient à d'autres types de réductions, mais est inefficace pour la concaténation des cordes. La phrase complète se termine.

Exécution de Python, qu'est-ce que c'est?May 14, 2025 am 12:06 AM

PythonexecutionistheprocessoftransformingpythoncodeintoexecuableInstructions.1) the IntrepreterredSthecode, convertingitintoStecode, quithepythonvirtualmachine (pvm)

Python: quelles sont les principales caractéristiquesMay 14, 2025 am 12:02 AM

Les caractéristiques clés de Python incluent: 1. La syntaxe est concise et facile à comprendre, adaptée aux débutants; 2. Système de type dynamique, améliorant la vitesse de développement; 3. Rich Standard Library, prenant en charge plusieurs tâches; 4. Community et écosystème solide, fournissant un soutien approfondi; 5. Interprétation, adaptée aux scripts et au prototypage rapide; 6. Support multi-paradigme, adapté à divers styles de programmation.

Python: compilateur ou interprète?May 13, 2025 am 12:10 AM

Python est une langue interprétée, mais elle comprend également le processus de compilation. 1) Le code Python est d'abord compilé en bytecode. 2) ByteCode est interprété et exécuté par Python Virtual Machine. 3) Ce mécanisme hybride rend Python à la fois flexible et efficace, mais pas aussi rapide qu'une langue entièrement compilée.

Python pour Loop vs While Loop: Quand utiliser lequel?May 13, 2025 am 12:07 AM

Usaforloopwheniterating aepasquenceorfor pourpascific inumberoftimes; useawhileloopwencontinTutuntutilaconditioniseMet.ForloopsareIdealForkNown séquences, tandis que celle-ci, ce qui est en train de réaliser des étages.

Python Loops: les erreurs les plus courantesMay 13, 2025 am 12:07 AM

PythonloopscanleadtoerrorlikeInfiniteLoops, modificationlistDuringiteration, off-by-by-oneerrors, zéro-indexingisss et intestloopinefficisecy.toavoid this: 1) use'i

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

4 Il y a quelques semainesByDDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semainesByDDD

Nordhold: Système de fusion, expliqué

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

VSCode Windows 64 bits Télécharger

Un éditeur IDE gratuit et puissant lancé par Microsoft

PhpStorm version Mac

Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Afficher plus

Sujets chauds

1673

1429

1333

1278

1257