首頁  >  文章  >  後端開發  >  刪除 DF 中的重複項並在 python 中轉換為 JSON obj

刪除 DF 中的重複項並在 python 中轉換為 JSON obj

王林
王林轉載
2024-02-22 13:20:03691瀏覽

删除 DF 中的重复项并在 python 中转换为 JSON obj

問題內容

我有一個類似於下面的 df

name         series
=============================
a             a1
b             b1
a             a2
a             a1
b             b2

我需要將系列轉換為一個列表,該列表應分配給每個名稱,例如字典或 json obj,如下所示

{
   "a": ["a1", "a2"],
   "b": ["b1", "b2"]
}

到目前為止,我已經嘗試使用 groupby,但它只是將所有內容分組為單獨的字典

test = df.groupby("series")[["name"]].apply(lambda x: x)

上面的程式碼給了一個類似 df 的輸出

Series
Name
A     0   A1
      2   A2
      3   A1
B     1   B1
      4   B2

非常感謝任何幫助

謝謝


正確答案


首先#drop_duplicates 確保有,然後groupby. agg 作為列表:

out = df.drop_duplicates().groupby('name')['series'].agg(list).to_dict()

或撥打unique

out = df.groupby('name')['series'].agg(lambda x: x.unique().tolist()).to_dict()

輸出:{'a': ['a1', 'a2'], 'b': ['b1', 'b2']}

如果您還有其他列,請確保僅保留感興趣的列:

out = (df[['name', 'series']].drop_duplicates()
       .groupby('name')['series'].agg(list).to_dict()
      )

對清單進行排序:

out = (df.groupby('name')['series']
         .agg(lambda x: sorted(x.unique().tolist())).to_dict()
      )

範例:

# input
  Name Series
0    A     Z1
1    B     B1
2    A     A2
3    A     Z1
4    B     B2

# output
{'A': ['A2', 'Z1'], 'B': ['B1', 'B2']}

以上是刪除 DF 中的重複項並在 python 中轉換為 JSON obj的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:stackoverflow.com。如有侵權,請聯絡admin@php.cn刪除