首頁 >後端開發 >Python教學 >如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?

如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?

Barbara Streisand
Barbara Streisand原創
2024-12-22 14:44:10781瀏覽

How Can I Easily Share Complex DataFrames for Reproducible Code Examples?

使用df.to_dict() 輕鬆共享資料樣本

儘管針對好問題有明確的指導方針並包含可重現的資料樣本,但許多使用者常常忽略提供足夠的數據進行分析。本文探討了使用 df.to_dict() 函數作為共享比隨機數更複雜的樣本資料幀的實用方法。

案例1:來自本地來源的資料幀

對於從本地來源取得的資料幀,這種方法很簡單:

  1. 執行df.to_dict() 產生資料幀的字典表示。
  2. 複製輸出,包括字典結構。
  3. 將內容貼到 pd.DataFrame() 中程式碼片段。

案例2:其他表格應用程式

如果您的表格位於Excel等應用程式中,您可以使用以下步驟:

  1. 複製表格內容。
  2. 執行df =pd.read_clipboard(sep='s ') 將內容讀入資料幀,其中s ' 表示任意space.
  3. 執行df.to_dict() 並將結果包含在df=pd.DataFrame() 中。

處理更大的Dataframe

對於較大的資料框,請考慮以下事項方法:

  • 使用df .head(20).to_dict() 僅包含前20 行。
  • 使用 df.to_dict('split') 重塑輸出提高了更少行數的可讀性。

使用 Iris 的範例資料集

考慮 iris 資料集,該資料集以在plotly express 中可用而聞名。

import plotly.express as px
import pandas as pd

df = px.data.iris().head(10)
sample = df.to_dict('split')

這將產生一個包含索引、列和資料鍵的字典,可以輕鬆重新建立資料框的使用:

df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])

編輯

請注意,df.to_dict() 在沒有明確包含必要的導入(例如from pandas import Timestamp)的情況下無法讀取時間戳記。

以上是如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn