首页 >后端开发 >Python教程 >如何有效地向 Pandas DataFrame 添加新列?

如何有效地向 Pandas DataFrame 添加新列?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-12-17 06:41:25807浏览

How Can I Efficiently Add a New Column to a Pandas DataFrame?

向现有 DataFrame 添加新列

使用 pandas DataFrame 时,通常需要向现有 DataFrame 添加新列。有多种方法可以实现这一目标,每种方法都有自己的优点和缺点。

1.使用分配(推荐 Pandas 0.17 及以上版本):

import pandas as pd
import numpy as np

# Generate a sample DataFrame
df1 = pd.DataFrame({
    'a': [0.671399, 0.446172, 0.614758],
    'b': [0.101208, -0.243316, 0.075793],
    'c': [-0.181532, 0.051767, -0.451460],
    'd': [0.241273, 1.577318, -0.012493]
})

# Add a new column 'e' with random values
sLength = len(df1['a'])
df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)

2.使用 loc[row_index, col_indexer] = value:

# Add a new column 'f' using loc
df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)

3.使用 df[new_column_name] = pd.Series(values, index=df.index):

# Add a new column 'g' using the old method
df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)

请记住,后一种方法可能会在较新版本的 pandas 中触发SettingWithCopyWarning。为了提高效率和清晰度,通常建议使用 allocate 或 loc。

以上是如何有效地向 Pandas DataFrame 添加新列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn