기존 DataFrame에 새 열 추가
pandas DataFrames로 작업할 때 기존 데이터 프레임에 새 열을 추가해야 하는 경우가 많습니다. 이를 달성하기 위한 접근 방식에는 여러 가지가 있으며 각각 고유한 장점과 단점이 있습니다.
1. 할당 사용(Pandas 0.17 이상에 권장):
import pandas as pd import numpy as np # Generate a sample DataFrame df1 = pd.DataFrame({ 'a': [0.671399, 0.446172, 0.614758], 'b': [0.101208, -0.243316, 0.075793], 'c': [-0.181532, 0.051767, -0.451460], 'd': [0.241273, 1.577318, -0.012493] }) # Add a new column 'e' with random values sLength = len(df1['a']) df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
2. loc[row_index, col_indexer] = 값 사용:
# Add a new column 'f' using loc df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
3. df[new_column_name] = pd.Series(values, index=df.index) 사용:
# Add a new column 'g' using the old method df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)
후자의 방법은 최신 버전의 Pandas에서 SettingWithCopyWarning을 트리거할 수 있다는 점을 기억하세요. 일반적으로 효율성과 명확성을 위해 할당 또는 위치를 사용하는 것이 좋습니다.
위 내용은 Pandas DataFrame에 새 열을 효율적으로 추가하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!