>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?

Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-26 22:08:10253검색

What are the Efficient Ways to Iterate Over Pandas DataFrame Rows?

Pandas의 효율적인 DataFrame 행 반복

DataFrame 행 반복은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 DataFrame.T.iteritems() 및 DataFrame.iterrows()라는 두 가지 방법을 살펴보고 행 객체와 그 사용법에 대한 명확한 설명을 제공합니다.

행 객체

DataFrame.iterrows()에서 반환된 행 개체는 DataFrame의 단일 행을 나타내는 시리즈입니다. 열 이름으로 개별 셀 값에 대한 액세스를 제공합니다.

for index, row in df.iterrows():
    print(row['c1'], row['c2'])

다음 DataFrame을 고려하세요.

c1 c2
10 100
11 110
12 120

위의 방법을 사용하는 행은 다음을 생성합니다 출력:

10 100
11 110
12 120

성능 고려 사항

DataFrame 행을 반복하는 것은 계산 집약적일 수 있다는 점에 유의하는 것이 중요합니다. 문서에서는 성능 병목 현상을 피하기 위해 가능할 때마다 벡터화된 작업이나 apply() 함수를 사용할 것을 권장합니다.

Iterrows의 대안

고급 작업의 경우 다음을 사용하는 것이 좋습니다. iter* 함수의 대안:

  • 내장 메소드를 사용한 벡터화된 연산 또는 NumPy 함수
  • apply()를 사용한 함수 적용
  • 성능 향상을 위한 Cython 또는 Numba

행 객체 작업 방법을 이해하고 성능에 미치는 영향을 고려하여, DataFrame 행을 효과적으로 반복하여 다양한 데이터 분석 작업을 수행할 수 있습니다.

위 내용은 Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.