>백엔드 개발 >C++ >C#에서 10GB 텍스트 파일의 마지막 10줄을 효율적으로 추출하려면 어떻게 해야 합니까?

C#에서 10GB 텍스트 파일의 마지막 10줄을 효율적으로 추출하려면 어떻게 해야 합니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-30 06:28:11175검색

How Can I Efficiently Extract the Last 10 Lines from a 10GB  Text File in C#?

대용량 텍스트 파일(10GB 이상)의 마지막 10줄 가져오기: 효율적인 C# 접근 방식

10GB, 마지막 줄을 추출하면 성능 문제가 발생할 수 있습니다. C#을 사용하여 이를 효과적으로 달성하는 방법은 다음과 같습니다.

코드 구현:

이 일반화된 접근 방식을 사용하면 추출할 토큰 수(numberOfTokens), 파일 경로 (경로), 인코딩(인코딩) 및 토큰 구분 기호 (tokenSeparator):

public static string ReadEndTokens(string path, Int64 numberOfTokens, Encoding encoding, string tokenSeparator) {

    int sizeOfChar = encoding.GetByteCount("\n");
    byte[] buffer = encoding.GetBytes(tokenSeparator);

    using (FileStream fs = new FileStream(path, FileMode.Open)) {
        Int64 tokenCount = 0;
        Int64 endPosition = fs.Length / sizeOfChar;

        for (Int64 position = sizeOfChar; position < endPosition; position += sizeOfChar) {
            fs.Seek(-position, SeekOrigin.End);
            fs.Read(buffer, 0, buffer.Length);

            if (encoding.GetString(buffer) == tokenSeparator) {
                tokenCount++;
                if (tokenCount == numberOfTokens) {
                    byte[] returnBuffer = new byte[fs.Length - fs.Position];
                    fs.Read(returnBuffer, 0, returnBuffer.Length);
                    return encoding.GetString(returnBuffer);
                }
            }
        }

        // handle case where number of tokens in file is less than numberOfTokens
        fs.Seek(0, SeekOrigin.Begin);
        buffer = new byte[fs.Length];
        fs.Read(buffer, 0, buffer.Length);
        return encoding.GetString(buffer);
    }
}

작동 방식:

  1. 지정된 인코딩에서 문자 크기를 계산합니다.
  2. 검색 파일 끝까지 가서 뒤로 이동하기 시작하여 토큰 구분 기호를 읽습니다. bytes.
  3. 발견된 토큰을 세고 원하는 토큰 수에 도달하면 중지합니다.
  4. 현재 위치부터 파일 끝까지 남은 바이트를 읽습니다.
  5. 파일의 토큰 수가 예상보다 적은 경우를 처리합니다.

이 접근 방식을 활용하면 효율적으로 다음을 수행할 수 있습니다. 대용량 텍스트 파일의 마지막 줄을 추출하여 대용량으로 인한 문제를 해결합니다.

위 내용은 C#에서 10GB 텍스트 파일의 마지막 10줄을 효율적으로 추출하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.