创建一个空的 Pandas DataFrame 并迭代填充它是数据操作中的常见任务。然而,理想的方法可能不会立即显现出来。
您提供的代码片段是创建空 DataFrame 并迭代填充它的一种方法。然而,这种方法效率低下,并且可能会导致与内存相关的问题。原因是您要为每次迭代创建一个新行,这需要重新分配内存。随着 DataFrame 的增长,这一过程变得越来越繁琐。
首选方法是在列表中累积数据,然后使用一步创建 DataFrame pd.DataFrame() 函数。这种方法明显更有效并且更节省内存。它的工作原理如下:
# Accumulate data in a list data = [] for row in some_function_that_yields_data(): data.append(row) # Create the DataFrame from the list df = pd.DataFrame(data)
处理大型数据集时,建议将数据累积到列表中并一步创建 DataFrame。它计算效率高、内存友好,并且简化了数据操作过程。
以上是迭代创建和填充 Pandas DataFrame 的最有效方法是什么?的详细内容。更多信息请关注PHP中文网其他相关文章!