>백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있습니까?

Python을 사용하여 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있습니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-11 12:53:10204검색

How Can I Efficiently Count Lines in a Large File Using Python?

향상된 효율성으로 Python에서 대용량 파일의 줄 수 확인

대용량 파일의 줄 수를 계산하면 메모리와 시간 측면에서 문제가 발생합니다. 소비. 이 기사에서는 리소스 사용량을 최소화하면서 줄 계산에 대한 솔루션을 제공하여 이 문제를 해결하기 위한 최적화된 접근 방식을 제공합니다.

메모리 효율적인 접근 방식

다음과 같은 기존 방법이 예시됩니다. 제공된 코드는 파일의 행을 열거하여 순차적으로 계산합니다. 이 접근 방식은 기능적이지만 메모리의 전체 파일을 반복해야 하며 상당한 메모리 리소스를 소비합니다.

합산을 통한 더 빠른 접근 방식

더 빠른 접근 방식에는 생성기 표현식을 활용하는 것이 포함됩니다. 직접 줄을 센다. 다음 코드 조각은 이 방법을 보여줍니다.

num_lines = sum(1 for _ in open('myfile.txt'))

이 접근 방식은 한 번에 한 줄씩 파일을 반복하여 발생하는 각 줄에 대해 카운터를 증가시키는 방식으로 작동합니다. 생성기 표현식은 한 번에 한 줄만 생성하므로 과도한 메모리 소비를 제거합니다.

버퍼 읽기 기능을 갖춘 성능 부스터

버퍼를 활용하여 속도와 견고성을 더욱 향상합니다. 읽기를 권장합니다.

with open("myfile.txt", "rbU") as f:
    num_lines = sum(1 for _ in f)

버퍼 읽기는 데이터를 더 큰 청크로 가져와서 파일 액세스를 최적화합니다. 반복되는 파일 작업의 오버헤드를 줄입니다. 그러나 "rbU" 모드의 'U' 문자는 Python 3.3부터 더 이상 사용되지 않으므로 대신 "rb"를 사용해야 합니다(Python 3.11에서는 제거됨).

이러한 기술을 사용하면 효율적으로 다음을 수행할 수 있습니다. 메모리를 절약하고 실행 시간을 최소화하면서 대용량 파일의 라인 수를 계산합니다.

위 내용은 Python을 사용하여 대용량 파일의 줄 수를 어떻게 효율적으로 계산할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.