>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?

Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-27 20:00:18701검색

How Can I Efficiently Iterate Through Pandas DataFrame Rows?

Pandas DataFrame 행 순회

Pandas DataFrame의 행에 대한 반복은 표 형식 데이터를 조작할 때 일반적으로 발생합니다. 이 기사에서는 이 작업을 수행하는 두 가지 방법을 탐색하고 행 객체의 구성을 조명합니다.

iterrows() 사용

Pandas는 인덱스와 행을 모두 반환하는 효율적인 DataFrame.iterrows 생성기를 제공합니다. 각 관찰에 대한 시리즈로. 이 방법을 사용하면 행의 인덱스를 사용하여 열 값에 직접 액세스할 수 있습니다.

import pandas as pd

df = pd.DataFrame({'c1': [10, 11, 12], 'c2': [100, 110, 120]})

for index, row in df.iterrows():
    print(row['c1'], row['c2'])

이 스니펫 출력은 다음과 같습니다.

10 100
11 110
12 120

성능 고려 사항에 대한 참고

Pandas 객체를 반복하는 동안 일반적으로 편리한 접근 방식이지만 벡터화된 작업에 비해 속도가 느릴 수 있습니다. 성능을 최대화하려면 다음과 같은 대체 기술을 고려하십시오.

  • 벡터화된 계산을 위해 내장된 메서드 및 NumPy 함수를 활용합니다.
  • 효율적인 데이터 하위 집합을 위해 부울 인덱싱을 활용합니다.
  • 직접 수정이 필요한 반복 작업에는 apply()를 사용합니다. 필요합니다.
  • cython 또는 numba를 사용하여 성능이 중요한 루프를 최적화합니다.

추가 반복 방법

iterrows() 외에도 Pandas는 다음과 같은 다른 행 반복 방법을 제공합니다. as:

  • itertuples(): 각 행에 대해 명명된 튜플을 반환합니다.
  • iterrows(ignore_index=True): 반복 행을 제외하고 index.
  • itertuples(ignore_index=True): itertuples()와 유사하지만 인덱스를 제외합니다.

위 내용은 Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.