큰 텍스트 파일에서 줄 건너뛰기 최적화
특정 줄을 찾을 때 대용량 텍스트 파일을 한 줄씩 처리하는 것은 비효율적일 수 있습니다. 제공된 코드는 15MB 파일의 모든 줄을 반복하여 원하는 줄 번호에 도달하며 필요한 줄이 파일의 훨씬 앞에 위치할 수 있다는 사실을 무시합니다.
대체 접근 방식
이 문제를 해결하려면 라인 오프셋을 활용하는 최적화 기술을 사용하는 것이 좋습니다. 여기에는 전체 파일을 한 번 읽어 각 줄의 시작 오프셋을 포함하는 목록을 구성하는 작업이 포함됩니다.
구현
<code class="python">line_offset = [] # List to store line offsets offset = 0 # Current offset # Loop through each line in the file for line in file: line_offset.append(offset) # Store the current line offset offset += len(line) # Update the offset for the next line file.seek(0) # Reset the file pointer to the beginning</code>
사용법
특정 줄(n)로 건너뛰려면 해당 오프셋을 찾으면 됩니다.
<code class="python">line_number = n file.seek(line_offset[line_number])</code>
이 접근 방식을 사용하면 중간 줄을 모두 처리할 필요가 없어져 대용량 파일의 성능이 크게 향상됩니다.
위 내용은 라인 오프셋은 대용량 텍스트 파일에서 라인 점프를 어떻게 최적화할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!