>백엔드 개발 >파이썬 튜토리얼 >사전을 통해 값을 바꿀 때 Pandas 시리즈 `s.replace`가 `s.map`보다 느린 이유는 무엇입니까?

사전을 통해 값을 바꿀 때 Pandas 시리즈 `s.replace`가 `s.map`보다 느린 이유는 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-11-13 16:21:02224검색

Why is Pandas series `s.replace` slower than `s.map` for replacing values through dictionaries?

사전을 통해 Pandas 시리즈의 값을 효율적으로 바꾸기

사전(s.replace(d))을 통해 Pandas 시리즈의 값을 자주 바꾸기 성능 병목 현상이 발생하여 목록 이해 접근 방식보다 속도가 상당히 느려집니다. s.map(d)는 허용 가능한 성능을 제공하지만 모든 계열 값이 사전 키에서 발견되는 경우에만 적합합니다.

성능 격차 이해

주된 이유 s.replace가 느린 이유는 다각적인 기능 때문입니다. s.map과 달리 일반적으로 더 세심한 처리가 필요한 극단적인 경우와 드문 상황을 처리합니다.

최적화 전략

성능을 최적화하려면 다음 지침을 고려하세요.

일반 사례:

  • 모든 값을 매핑할 수 있는 경우 s.map(d)를 활용하세요.
  • s.map(d).fillna(s['A'] 사용 ).astype(int) 값의 5% 이상이 될 수 있는 경우

사전에 값이 거의 없음:

  • 값이 5% 미만인 경우 s.replace(d)를 사용하세요. 사전.

벤치마킹 결과

광범위한 테스트를 통해 성능 차이가 확인되었습니다.

전체 맵:

  • s.replace: 1.98초
  • s.map: 84.3 밀리초
  • 목록 이해: 134밀리초

부분 맵:

  • s.replace: 20.1밀리초
  • s.map.fillna.astype: 111밀리초
  • 목록 이해: 243밀리초

설명

s.replace의 느린 속도는 복잡한 내부 아키텍처에서 비롯됩니다. 여기에는 다음이 포함됩니다.

  • 사전을 목록으로 변환
  • 목록을 반복하고 중첩된 사전 확인
  • 키와 값의 반복자를 교체 함수에 전달

반대로 s.map의 코드는 훨씬 가벼워서 뛰어난 성능을 제공합니다. 공연.

위 내용은 사전을 통해 값을 바꿀 때 Pandas 시리즈 `s.replace`가 `s.map`보다 느린 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.