Maison >développement back-end >Tutoriel Python >Examen plus approfondi du tri des pandas : créer un aperçu ordonné de vos données

Examen plus approfondi du tri des pandas : créer un aperçu ordonné de vos données

WBOY
WBOYoriginal
2024-01-24 10:16:12654parcourir

Examen plus approfondi du tri des pandas : créer un aperçu ordonné de vos données

Explication détaillée du tri des pandas de l'outil d'analyse de données : rendez vos données ordonnées et impressionnantes

Introduction : Dans le processus d'analyse des données, le tri des données est une opération très courante et importante. Le tri peut rendre les données ordonnées et visibles, ce qui nous permet d'analyser et de visualiser plus facilement les données. En Python, la bibliothèque pandas fournit de puissantes fonctions de tri. Cet article présentera en détail la méthode de tri pandas et donnera des exemples de code spécifiques.

1. Concept de base du tri
Dans l'analyse des données, le tri peut être effectué par ordre croissant ou décroissant selon une certaine colonne ou plusieurs colonnes. Parmi eux, l'ordre croissant signifie le tri du petit au grand, et l'ordre décroissant signifie le tri du grand au petit.

2. Méthode de tri des pandas
Dans les pandas, il existe deux méthodes de tri couramment utilisées : sort_values() et sort_index(). La méthode

  1. sort_values()
    sort_values() est utilisée pour trier par valeur, c'est-à-dire trier par la valeur numérique dans la colonne. Cette méthode a les paramètres communs suivants :
  • by : le nom de la colonne à trier, qui peut être un nom de colonne unique ou une liste contenant plusieurs noms de colonnes.
  • ascendant : méthode de tri, True signifie ordre croissant, False signifie ordre décroissant, la valeur par défaut est True.
  • en place : s'il faut modifier les données d'origine. True signifie modifier les données d'origine. False signifie générer une nouvelle copie triée des données. La méthode
  1. sort_index()
    sort_index() est utilisée pour trier par index, c'est-à-dire trier par l'index de la ligne. Cette méthode a les paramètres communs suivants :
  • axis : direction de l'axe de tri, 0 signifie un tri par index de ligne, 1 signifie un tri par index de colonne, la valeur par défaut est 0.
  • ascendant : méthode de tri, True signifie ordre croissant, False signifie ordre décroissant, la valeur par défaut est True.
  • en place : s'il faut modifier les données d'origine. True signifie modifier les données d'origine. False signifie générer une nouvelle copie triée des données.

3. Exemple de tri des pandas
Ce qui suit utilise plusieurs exemples pour démontrer la fonction de tri des pandas.

  1. Trier par une seule colonne
    Supposons qu'il y ait l'ensemble de données suivant :
import pandas as pd

data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男']}
df = pd.DataFrame(data)
print(df)

Le résultat de sortie est :

     姓名  年龄 性别
0   Tom  20  男
1  Jerry  25  男
2  Spike  18  女
3   Tyke  30  男

Maintenant, nous trions par colonne d'âge dans l'ordre décroissant :

df.sort_values(by='年龄', ascending=False, inplace=True)
print(df)

Le résultat de sortie est :

     姓名  年龄 性别
3   Tyke  30  男
1  Jerry  25  男
0   Tom  20  男
2  Spike  18  女
  1. Trier sur plusieurs colonnes
    Dans certains cas, nous devrons peut-être trier sur plusieurs colonnes. Supposons que nous ajoutions une colonne « salaire » aux données ci-dessus et que nous triions par âge et salaire :
data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男'],
        '工资': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
print(df)

Le résultat est :

     姓名  年龄 性别   工资
0   Tom  20  男  5000
1  Jerry  25  男  6000
2  Spike  18  女  4000
3   Tyke  30  男  7000

Maintenant, nous trions par âge et salaire par ordre décroissant :

df.sort_values(by=['年龄', '工资'], ascending=False, inplace=True)
print(df)

Le résultat est :

     姓名  年龄 性别   工资
3   Tyke  30  男  7000
1  Jerry  25  男  6000
0   Tom  20  男  5000
2  Spike  18  女  4000
  1. Tri par index de ligne
    En plus du tri par colonne, nous pouvons également trier par index de ligne. Supposons que nous modifiions l'index de ligne des données ci-dessus en ['c', 'a', 'b', 'd'], puis que nous triions par index de ligne dans l'ordre croissant :
df.index = ['c', 'a', 'b', 'd']
df.sort_index(axis=0, ascending=True, inplace=True)
print(df)

Le résultat de sortie est :

     姓名  年龄 性别   工资
a  Jerry  25  男  6000
b  Spike  18  女  4000
c    Tom  20  男  5000
d   Tyke  30  男  7000

Ce qui précède est une introduction de base de pandas et des exemples de tri. Grâce aux méthodes sort_values() et sort_index(), nous pouvons facilement trier les données pour les rendre ordonnées et respectables. J'espère que cet article pourra vous aider à mieux appliquer les pandas pour l'analyse des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn