使用df.to_dict() 輕鬆共享資料樣本
儘管針對好問題有明確的指導方針並包含可重現的資料樣本,但許多使用者常常忽略提供足夠的數據進行分析。本文探討了使用 df.to_dict() 函數作為共享比隨機數更複雜的樣本資料幀的實用方法。
案例1:來自本地來源的資料幀
對於從本地來源取得的資料幀,這種方法很簡單:
案例2:其他表格應用程式
如果您的表格位於Excel等應用程式中,您可以使用以下步驟:
處理更大的Dataframe
對於較大的資料框,請考慮以下事項方法:
使用 Iris 的範例資料集
考慮 iris 資料集,該資料集以在plotly express 中可用而聞名。
import plotly.express as px import pandas as pd df = px.data.iris().head(10) sample = df.to_dict('split')
這將產生一個包含索引、列和資料鍵的字典,可以輕鬆重新建立資料框的使用:
df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
編輯
請注意,df.to_dict() 在沒有明確包含必要的導入(例如from pandas import Timestamp)的情況下無法讀取時間戳記。
以上是如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?的詳細內容。更多資訊請關注PHP中文網其他相關文章!