首页 >后端开发 >Python教程 >如何在 Python 中高效地向 Pandas DataFrame 添加新列?

如何在 Python 中高效地向 Pandas DataFrame 添加新列?

DDD
DDD原创
2024-12-22 11:32:09369浏览

How to Efficiently Add a New Column to a Pandas DataFrame in Python?

向现有 DataFrame 添加新列

在数据操作任务中,通常需要使用附加列来扩充现有 DataFrame。在这里,我们解决如何使用 Pandas 在 Python 中实现此目的的问题。

问题陈述

考虑以下具有索引列和非连续数字的行的 DataFrame :

          a         b         c         d
2  0.671399  0.101208 -0.181532  0.241273
3  0.446172 -0.243316  0.051767  1.577318
5  0.614758  0.075793 -0.451460 -0.012493

我们的目标是在不改变的情况下向此 DataFrame 添加一个新列“e”现有数据。新列应与 DataFrame 具有相同的长度。

解决方案

方法 1(分配):

将一系列值作为新列添加到 DataFrame 的最有效方法是使用 assign function:

df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)

其中:

  • df1 是原始 DataFrame
  • sLength 是原始 DataFrame 的长度
  • np.random .randn(sLength) 生成一系列随机数value

方法 2 (loc):

另一种方法是使用 loc 访问器来设置 new 的值column:

df1.loc[:,'f'] = pd.Series(np.random.randn(sLength), index=df1.index)

其中:

  • df1 是原始 DataFrame
  • 'f' 是新列的名称
  • pd .Series(np.random.randn(sLength)) 生成一系列随机value
  • df1.index 设置新列的索引以匹配原始 DataFrame

两种方法都有效地将所需的新列 'e' 添加到 DataFrame,保留现有数据.

以上是如何在 Python 中高效地向 Pandas DataFrame 添加新列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn