Maison >développement back-end >Tutoriel Python >Comment créer un DataFrame Pandas avec une indexation hiérarchique à partir d'un dictionnaire imbriqué ?

Comment créer un DataFrame Pandas avec une indexation hiérarchique à partir d'un dictionnaire imbriqué ?

Barbara Streisand
Barbara Streisandoriginal
2024-11-30 17:25:13533parcourir

How to Create a Pandas DataFrame with Hierarchical Indexing from a Nested Dictionary?

Construction d'un DataFrame Pandas à partir de valeurs de dictionnaire imbriquées avec indexation hiérarchique

Considérez un dictionnaire imbriqué, user_dict, où les clés de premier niveau représentent les ID utilisateur, les clés de deuxième niveau sont des catégories et les clés de troisième niveau sont divers attributs. Le but est de construire un DataFrame pandas avec un index hiérarchique en utilisant les valeurs du troisième niveau.

Pour y parvenir, nous devons remodeler les clés du dictionnaire en tuples représentant l'index hiérarchique. En utilisant pd.DataFrame.from_dict, nous pouvons créer un DataFrame avec la structure d'index correcte :

user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'},
                  'Category 2': {'att_1': 23, 'att_2': 'another'}},
             15: {'Category 1': {'att_1': 10, 'att_2': 'foo'},
                  'Category 2': {'att_1': 30, 'att_2': 'bar'}}}

pd.DataFrame.from_dict({(i,j): user_dict[i][j] 
                           for i in user_dict.keys() 
                           for j in user_dict[i].keys()},
                       orient='index')


               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

Une approche alternative consiste à concaténer des DataFrames individuels créés à partir de chaque entrée du dictionnaire :

user_ids = []
frames = []

for user_id, d in user_dict.iteritems():
    user_ids.append(user_id)
    frames.append(pd.DataFrame.from_dict(d, orient='index'))

pd.concat(frames, keys=user_ids)

               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

Les deux Les méthodes construisent efficacement un DataFrame avec un index hiérarchique en utilisant les valeurs du troisième niveau du dictionnaire imbriqué.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn