Python에서 대용량 파일을 효율적으로 읽기 위한 게으른 방법
Python에서 대용량 파일을 읽으면 계산 집약적일 수 있으며 시스템 속도가 저하될 수 있습니다. 이 문제를 해결하려면 관리 가능한 청크로 파일을 읽고 처리하는 게으른 방법이 권장됩니다. 게으른 메서드 구현을 위한 몇 가지 옵션은 다음과 같습니다.
지연 평가에 Yield 사용:
yield 키워드를 사용하면 요청 시 요소를 반환하는 게으른 함수를 만들 수 있습니다. . 다음 코드는 Yield를 사용하여 파일을 청크로 읽는 방법을 보여줍니다.
def read_in_chunks(file_object, chunk_size=1024): """Lazy function (generator) to read a file piece by piece. Default chunk size: 1k.""" while True: data = file_object.read(chunk_size) if not data: break yield data
이 기능을 사용하려면 생성된 청크를 반복하고 처리할 수 있습니다.
with open('really_big_file.dat') as f: for piece in read_in_chunks(f): process_data(piece)
Iter 및 도우미 함수 사용:
또는 다음을 결합할 수도 있습니다. 생성기를 생성하기 위한 도우미 함수가 있는 iter 함수:
f = open('really_big_file.dat') def read1k(): return f.read(1024) for piece in iter(read1k, ''): process_data(piece)
이 접근 방식은 이전 접근 방식과 유사하지만 별도의 함수를 사용하여 청크를 생성합니다.
행 읽기 -기반 파일:
파일에 데이터 줄이 포함된 경우 파일 개체의 게으른 특성을 활용할 수 있습니다. 자체:
for line in open('really_big_file.dat'): process_data(line)
이 방법은 줄이 독립적이고 하나씩 처리할 수 있는 파일에 적합합니다.
지연 평가 기술을 사용하면 대용량 파일을 효율적으로 읽고 처리할 수 있습니다. 시스템 리소스를 과도하게 사용하지 않고. 이러한 방법을 사용하면 메모리 사용량과 처리 시간을 제어할 수 있어 대용량 파일도 원활하게 처리할 수 있습니다.
위 내용은 지연 평가를 사용하여 Python에서 대용량 파일을 효율적으로 읽고 처리하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!