>백엔드 개발 >파이썬 튜토리얼 >Python은 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있나요?

Python은 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있나요?

Susan Sarandon
Susan Sarandon원래의
2024-12-14 01:07:11864검색

How Can Python Efficiently Count Lines in Very Large Files?

Python을 사용하여 대용량 파일의 효율적인 줄 수 계산

대량 파일의 줄 수를 결정하는 것은 다양한 애플리케이션에서 매우 중요합니다. for 루프를 사용하는 기존 접근 방식은 시간이 많이 걸리고 메모리 집약적일 수 있지만 Python은 최적화된 솔루션을 제공합니다.

간결하고 효율적인 줄 계산

다음 코드 조각은 줄 계산, 질문에 제시된 루프 방법보다 성능이 뛰어남:

num_lines = sum(1 for _ in open('myfile.txt'))

이 코드는 Python의 생성기 표현식을 활용합니다. 메모리에 모든 줄을 유지하지 않고 파일의 각 줄을 반복합니다. sum(1 for _ in ...) 구성은 줄 수를 계산합니다.

성능 향상

속도를 더욱 최적화하고 견고성을 높이려면 다음 개선 사항을 고려하세요.

  • 바이너리 모드에서 읽기: rb 모드는 바이너리 데이터를 효율적으로 읽도록 보장합니다. file.
  • with 블록 활용: with 블록은 파일 핸들을 자동으로 닫아 적절한 정리를 보장합니다.

다음과 같이 개선된 업데이트된 코드 조각:

with open("myfile.txt", "rb") as f:
    num_lines = sum(1 for _ in f)

참고

지원 중단된 rbU의 경우 Python 3.3 이상에서는 모드를 대신 사용하세요. 이 모드는 Python 3.11에서 제거되었습니다.

위 내용은 Python은 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.