>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrames에서 특정 열을 프로그래밍 방식으로 어떻게 선택합니까?

Pandas DataFrames에서 특정 열을 프로그래밍 방식으로 어떻게 선택합니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-20 21:08:15177검색

How Do I Programmatically Select Specific Columns in Pandas DataFrames?

Pandas Dataframes에서 프로그래밍 방식으로 특정 열 선택

Pandas Dataframe으로 작업할 때 다양한 작업을 위해 특정 열 하위 집합을 선택해야 할 필요성이 발생합니다. 이 문서에서는 이전에 실패한 시도에서 직면한 문제를 해결하면서 열 선택의 미묘한 차이를 살펴봅니다.

실패한 접근 방식 및 함정

문자열 이름을 기준으로 열을 분할하려는 초기 시도 (예: df['a':'b'])은 열 이름을 그런 방식으로 분할할 수 없기 때문에 실패합니다. 이 함정은 Pandas가 열을 인덱싱하는 방법을 이해하는 것이 중요하다는 것을 강조합니다.

열 이름을 통해 열 검색

이름으로 특정 열을 검색하려면 __getitem__ 구문을 활용할 수 있습니다. 원하는 열 목록으로 이름:

df1 = df[['a', 'b']]

또는 열을 숫자로 인덱싱해야 하는 경우:

df1 = df.iloc[:, 0:2] # Note: Python slicing is exclusive of the last index.

뷰와 복사본 이해

Pandas에서 뷰와 복사본을 구별하는 데 중요합니다. 첫 번째 방법은 분할된 열의 새 복사본을 만드는 반면, 두 번째 방법은 원본 개체와 동일한 메모리를 참조하는 뷰를 만듭니다. 이러한 구별은 성능과 메모리 사용량에 영향을 미칠 수 있습니다.

열 선택의 미묘함

이름으로 열을 지정하고 iloc을 활용하려면 열 속성의 get_loc 함수를 활용할 수 있습니다. :

column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)}

# Use the dictionary to access columns by name using iloc
df1 = df.iloc[:, [column_dict['a'], column_dict['b']]]

개발자는 이러한 미묘한 차이를 이해함으로써 Pandas 데이터 프레임에서 열을 효과적으로 선택할 수 있습니다. 데이터 분석 및 조작 작업의 특정 요구 사항을 충족합니다.

위 내용은 Pandas DataFrames에서 특정 열을 프로그래밍 방식으로 어떻게 선택합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.