ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame に新しい列を効率的に追加するにはどうすればよいですか?

Pandas DataFrame に新しい列を効率的に追加するにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-17 06:41:25875ブラウズ

How Can I Efficiently Add a New Column to a Pandas DataFrame?

既存の DataFrame への新しい列の追加

pandas DataFrame を使用する場合、多くの場合、既存のデータフレームに新しい列を追加する必要があります。これを実現するには複数のアプローチがあり、それぞれに独自の長所と短所があります。

1. assign の使用 (Pandas 0.17 以降で推奨):

import pandas as pd
import numpy as np

# Generate a sample DataFrame
df1 = pd.DataFrame({
    'a': [0.671399, 0.446172, 0.614758],
    'b': [0.101208, -0.243316, 0.075793],
    'c': [-0.181532, 0.051767, -0.451460],
    'd': [0.241273, 1.577318, -0.012493]
})

# Add a new column 'e' with random values
sLength = len(df1['a'])
df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)

2. loc[row_index,col_indexer] = value:

# Add a new column 'f' using loc
df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)

3 を使用します。 df[new_column_name] = pd.Series(values,index=df.index):

# Add a new column 'g' using the old method
df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)

の使用 新しいバージョンの pandas では、後者のメソッドにより SettingWithCopyWarning がトリガーされる可能性があることに注意してください。一般に、効率性と明確さのために assign または loc を使用することをお勧めします。

以上がPandas DataFrame に新しい列を効率的に追加するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。