Pandas 中高效的 DataFrame 行迭代
迭代 DataFrame 行是資料分析中的常見任務。本文探討了兩種方法:DataFrame.T.iteritems() 和 DataFrame.iterrows(),清楚地解釋了 row 物件及其用法。
Row 物件
DataFrame.iterrows() 傳回的 row 物件是代表 DataFrame 的單行的 Series。它透過列名稱提供對各個單元格值的存取:
for index, row in df.iterrows(): print(row['c1'], row['c2'])
範例
考慮以下DataFrame:
c1 | c2 |
---|---|
10 | 100 |
11 | 110 |
12 | 120 |
迭代使用上述方法的rows將產生以下結果輸出:
10 100 11 110 12 120
效能注意事項
需要注意的是,迭代 DataFrame 行可能需要大量計算。文件建議盡可能使用向量化操作或 apply() 函數以避免效能瓶頸。
Iterrows 的替代品
對於進階操作,您可以考慮使用以下iter* 函數的替代品:
透過了解如何使用行物件並考慮效能影響,您可以有效地迭代DataFrame 行以執行各種資料分析任務。
以上是迭代 Pandas DataFrame 行的有效方法是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!