Pandas 中高效的 DataFrame 行迭代
迭代 DataFrame 行是数据分析中的常见任务。本文探讨了两种方法:DataFrame.T.iteritems() 和 DataFrame.iterrows(),清晰地解释了 row 对象及其用法。
Row 对象
DataFrame.iterrows() 返回的 row 对象是一个代表 DataFrame 的单行的 Series。它通过列名称提供对各个单元格值的访问:
for index, row in df.iterrows(): print(row['c1'], row['c2'])
示例
考虑以下 DataFrame:
c1 | c2 |
---|---|
10 | 100 |
11 | 110 |
12 | 120 |
迭代使用上述方法的 rows 将产生以下结果输出:
10 100 11 110 12 120
性能注意事项
需要注意的是,迭代 DataFrame 行可能需要大量计算。文档建议尽可能使用向量化操作或 apply() 函数以避免性能瓶颈。
Iterrows 的替代品
对于高级操作,您可以考虑使用以下iter* 函数的替代品:
通过了解如何使用行对象并考虑性能影响,您可以可以有效地迭代 DataFrame 行以执行各种数据分析任务。
以上是迭代 Pandas DataFrame 行的有效方法是什么?的详细内容。更多信息请关注PHP中文网其他相关文章!