Maison >développement back-end >Tutoriel Python >Comment créer un DataFrame Pandas à partir d'un dictionnaire imbriqué avec des index hiérarchiques ?

Comment créer un DataFrame Pandas à partir d'un dictionnaire imbriqué avec des index hiérarchiques ?

DDD
DDDoriginal
2024-12-02 03:30:13220parcourir

How to Create a Pandas DataFrame from a Nested Dictionary with Hierarchical Indexes?

Construction d'un DataFrame Pandas à partir d'éléments dans des dictionnaires imbriqués avec des index hiérarchiques

Dans ce scénario, vous souhaitez créer un DataFrame pandas à partir d'un dictionnaire imbriqué où la hiérarchie se compose de :

  • Niveau 1 : Utilisateur ID
  • Niveau 2 : Catégorie
  • Niveau 3 : Attributs assortis

Le DataFrame souhaité doit avoir des ID utilisateur comme index et des catégories et attributs comme colonnes.

Exploiter Pandas MultiIndex

Une approche efficace utilise celle des pandas MultiIndex, qui permet la création d'une structure d'index multi-niveaux. Pour utiliser cette méthode :

  1. Remodelez le dictionnaire d'entrée pour utiliser des tuples comme clés, en les alignant sur les valeurs MultiIndex souhaitées.
  2. Construisez le DataFrame à l'aide de pd.DataFrame.from_dict, en spécifiant orient= 'index' pour aligner les données avec les clés de tuple définies.
user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'},
                  'Category 2': {'att_1': 23, 'att_2': 'another'}},
             15: {'Category 1': {'att_1': 10, 'att_2': 'foo'},
                  'Category 2': {'att_1': 30, 'att_2': 'bar'}}}

df = pd.DataFrame.from_dict({(i,j): user_dict[i][j] 
                           for i in user_dict.keys() 
                           for j in user_dict[i].keys()},
                       orient='index')

print(df)



               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

Méthode via Concaténation

Vous pouvez également créer le DataFrame de manière incrémentielle via la concaténation :

  1. Extraire les ID utilisateur et créer une liste vide pour stocker les dataframes des composants.
  2. Parcourir le dictionnaire, créant un dataframe pour chaque utilisateur et l'ajoutant à la liste.
  3. Concaténer le composant dataframes utilisant pd.concat, indexation par ID utilisateur.
user_ids = []
frames = []

for user_id, d in user_dict.iteritems():
    user_ids.append(user_id)
    frames.append(pd.DataFrame.from_dict(d, orient='index'))

df = pd.concat(frames, keys=user_ids)

print(df)


               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn