집 >백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?

Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?

What are the Efficient Ways to Iterate Over Pandas DataFrame Rows?

Pandas의 효율적인 DataFrame 행 반복

DataFrame 행 반복은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 DataFrame.T.iteritems() 및 DataFrame.iterrows()라는 두 가지 방법을 살펴보고 행 객체와 그 사용법에 대한 명확한 설명을 제공합니다.

행 객체

DataFrame.iterrows()에서 반환된 행 개체는 DataFrame의 단일 행을 나타내는 시리즈입니다. 열 이름으로 개별 셀 값에 대한 액세스를 제공합니다.

for index, row in df.iterrows():
    print(row['c1'], row['c2'])

예

다음 DataFrame을 고려하세요.

위의 방법을 사용하는 행은 다음을 생성합니다 출력:

10 100
11 110
12 120

성능 고려 사항

DataFrame 행을 반복하는 것은 계산 집약적일 수 있다는 점에 유의하는 것이 중요합니다. 문서에서는 성능 병목 현상을 피하기 위해 가능할 때마다 벡터화된 작업이나 apply() 함수를 사용할 것을 권장합니다.

Iterrows의 대안

고급 작업의 경우 다음을 사용하는 것이 좋습니다. iter* 함수의 대안:

행 객체 작업 방법을 이해하고 성능에 미치는 영향을 고려하여, DataFrame 행을 효과적으로 반복하여 다양한 데이터 분석 작업을 수행할 수 있습니다.

위 내용은 Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：