我有一個類似於下面的 df
name series ============================= a a1 b b1 a a2 a a1 b b2
我需要將系列轉換為一個列表,該列表應分配給每個名稱,例如字典或 json obj,如下所示
{ "a": ["a1", "a2"], "b": ["b1", "b2"] }
到目前為止,我已經嘗試使用 groupby,但它只是將所有內容分組為單獨的字典
test = df.groupby("series")[["name"]].apply(lambda x: x)
上面的程式碼給了一個類似 df 的輸出
Series Name A 0 A1 2 A2 3 A1 B 1 B1 4 B2
非常感謝任何幫助
謝謝
首先#drop_duplicates
確保有,然後groupby. agg
作為列表:
out = df.drop_duplicates().groupby('name')['series'].agg(list).to_dict()
或撥打unique
:
out = df.groupby('name')['series'].agg(lambda x: x.unique().tolist()).to_dict()
輸出:{'a': ['a1', 'a2'], 'b': ['b1', 'b2']}
如果您還有其他列,請確保僅保留感興趣的列:
out = (df[['name', 'series']].drop_duplicates() .groupby('name')['series'].agg(list).to_dict() )
out = (df.groupby('name')['series'] .agg(lambda x: sorted(x.unique().tolist())).to_dict() )
範例:
# input Name Series 0 A Z1 1 B B1 2 A A2 3 A Z1 4 B B2 # output {'A': ['A2', 'Z1'], 'B': ['B1', 'B2']}
以上是刪除 DF 中的重複項並在 python 中轉換為 JSON obj的詳細內容。更多資訊請關注PHP中文網其他相關文章!