Pandas Dataframe에서 여러 열 선택
Python의 Pandas 라이브러리에서는 데이터 프레임에서 특정 열을 선택하는 것이 일반적인 작업입니다. 그러나 특정 방식으로 이 작업을 수행하려고 하면 오류가 발생할 수 있습니다.
실패한 시도:
df['a':'b'] 또는 df와 같은 슬라이스 표기법 사용 .ix[:, 'a':'b'] 'a'와 'b' 사이의 열을 선택하는 작업은 열 이름이 문자열이므로 실패합니다. 그런 방식으로 슬라이스됩니다.
성공적인 옵션:
열 이름 사용:
해당 이름을 사용하여 특정 열을 선택하려면 , 사각형 안에 원하는 열 이름 목록을 제공하십시오. 대괄호:
df1 = df[['a', 'b']]
열 인덱스 사용:
(이름이 아닌) 인덱스로 열을 선택해야 하는 경우 다음을 사용하세요. iloc:
df1 = df.iloc[:, 0:2] # Note: Python slicing is exclusive of the ending index.
고려 사항:
보기 및 복사:
위에 설명된 방법은 다음의 보기를 반환합니다. 복사본이 아닌 원하는 열. 메모리에 새 복사본을 생성하려면 .copy() 메서드를 사용하세요.
df1 = df.iloc[0, 0:2].copy() # Ensures modifications to df1 do not alter df
get_loc와 함께 열 인덱스 사용:
특정 열의 인덱스를 얻으려면 , columns 메소드의 get_loc 함수를 사용하십시오.
column_indices = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)}
이것은 다음과 같은 사전을 반환합니다. 키는 열 인덱스이고 값은 열 이름입니다. 그런 다음 iloc과 함께 이러한 인덱스를 사용하여 원하는 열을 선택할 수 있습니다.
위 내용은 Pandas DataFrame에서 여러 열을 효율적으로 선택하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!