首頁 >後端開發 >Python教學 >創建 Pandas DataFrame 最有效的方法是什麼?

創建 Pandas DataFrame 最有效的方法是什麼?

Susan Sarandon
Susan Sarandon原創
2024-11-27 16:49:11818瀏覽

What's the Most Efficient Way to Create a Pandas DataFrame?

建立空DataFrame:方法比較

建立空pandas DataFrame 並逐漸填充它的傳統方法可能效率低下且佔用記憶體-密集的。更最佳化的方法是在清單中累積數據,必要時轉換為DataFrame

列表累積的優點:

  • 記憶體效率:清單是輕量級資料結構,與相比,它消耗的記憶體更少DataFrames。
  • 效能:追加到清單比重複追加到DataFrame快得多。
  • 自動資料型別推論:當清單轉換為DataFrame,pandas會自動判斷適當的資料
  • 自動建立索引: 自動為資料建立RangeIndex,無需手動分配索引。

範例程式碼清單累積:

data = []
for row in some_function_that_yields_data():
    data.append(row)

df = pd.DataFrame(data)

注意應避免的方法:

  • 迭代追加到DataFrame:
  • 出於效能原因,避免在循環中使用 df.append 或 pd.concat。這種方法會導致二次複雜度運算。
  • 在循環中使用 loc:
  • 使用 df.loc[len(df)] 追加也會導致記憶體分配效率低。
  • 空的NaN DataFrame:
  • 創建一個充滿NaN 的DataFrame 可以創建對象列,這可能會阻礙

基準結果:

基準結果顯示列表累積明顯快於傳統的迭代追加法。隨著 DataFrame 變大,時間差異變得更加明顯。

以上是創建 Pandas DataFrame 最有效的方法是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn