首頁 >後端開發 >Python教學 >如何從具有分層索引的嵌套字典創建 Pandas DataFrame?

如何從具有分層索引的嵌套字典創建 Pandas DataFrame?

DDD
DDD原創
2024-12-02 03:30:13220瀏覽

How to Create a Pandas DataFrame from a Nested Dictionary with Hierarchical Indexes?

從具有分層索引的嵌套字典中的項目構造Pandas DataFrame

在這種情況下,您希望從層次結構由以下內容組成的嵌套字典創建pandas DataFrame :

  • 1 級:用戶ID
  • 第 2等級:類別
  • 第 3 級:分類屬性

所需的 DataFrame 應該以使用者 ID 作為索引,以類別和屬性作為欄位。

利用 Pandas MultiIndex

一種有效的方法利用 pandas MultiIndex,可以創建多層索引結構。要使用此方法:

  1. 重塑輸入字典以使用元組作為鍵,與所需的 MultiIndex 值對齊。
  2. 使用 pd.DataFrame.from_dict 建構 DataFrame,指定 orient= 'index' 將資料與定義的元組鍵對齊。
user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'},
                  'Category 2': {'att_1': 23, 'att_2': 'another'}},
             15: {'Category 1': {'att_1': 10, 'att_2': 'foo'},
                  'Category 2': {'att_1': 30, 'att_2': 'bar'}}}

df = pd.DataFrame.from_dict({(i,j): user_dict[i][j] 
                           for i in user_dict.keys() 
                           for j in user_dict[i].keys()},
                       orient='index')

print(df)



               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

方法透過串聯

或者,您可以透過串聯逐步建立DataFrame:

  1. 提取使用者ID 並建立一個空列表來儲存組件資料幀。
  2. 迭代字典,為每個使用者建立一個資料框並將其新增至清單。
  3. 連接組件使用 pd.concat 的資料幀,依使用者 ID 進行索引。
user_ids = []
frames = []

for user_id, d in user_dict.iteritems():
    user_ids.append(user_id)
    frames.append(pd.DataFrame.from_dict(d, orient='index'))

df = pd.concat(frames, keys=user_ids)

print(df)


               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

以上是如何從具有分層索引的嵌套字典創建 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn