집 >백엔드 개발 >C++ >Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?

Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?

Mary-Kate Olsen원래의: 2024-11-05 22:09:02289검색

How to efficiently read a UTF-8 file into a wstring on Windows?

Windows에서 wstring을 통해 유니코드 데이터에 액세스

Windows에서 유니코드 텍스트를 처리할 때 유니코드(UTF)를 효율적으로 읽는 방법에 대한 의문이 생깁니다. -8) 파일을 wstring(s)으로 변환합니다. 다행스럽게도 C 11은 std::codecvt_utf8 패싯을 통해 다양한 솔루션을 제공합니다.

codecvt_utf8 패싯은 UTF-8 바이트 문자열과 UCS2 또는 UCS4 문자열 사이의 브리지 역할을 하여 두 텍스트에 대한 읽기 및 쓰기 작업을 가능하게 합니다. 및 바이너리 UTF-8 파일. 이 패싯을 활용하려면 필요한 UTF-8 패싯을 캡슐화하는 로캘 개체를 만드는 것이 좋습니다. 그런 다음 이 로케일 객체를 사용하여 스트림 버퍼를 주입함으로써 UTF-8 파일을 효율적으로 처리할 수 있습니다.

다음 코드 조각은 이 기술을 사용하여 UTF-8 파일을 wstring으로 읽는 방법을 보여줍니다.

<code class="cpp">#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename) {
    std::wifstream wif(filename);
    wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
    std::wstringstream wss;
    wss << wif.rdbuf();
    return wss.str();
}</code>

이 함수를 사용하려면 파일 이름을 인수로 전달하고 반환된 wstring을 변수에 할당하면 됩니다.

<code class="cpp">std::wstring wstr = readFile("a.txt");</code>

또는 전역 C 로캘을 UTF-8로 설정할 수도 있습니다. 문자열 스트림으로 작업하기 전에 codecvt_utf8 패싯을 사용하세요. 이렇게 하면 std::locale 기본 생성자에 대한 호출이 원하는 코덱이 포함된 전역 C 로케일을 반환하게 됩니다.

<code class="cpp">std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));</code>

이 전역 설정을 사용하면 스트림 버퍼에 로케일을 명시적으로 포함할 필요가 없습니다. C 코드에서 UTF-8 파일 처리 프로세스를 단순화합니다.

위 내용은 Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

String Object for using function default constructor this windows

성명：

이전 기사：Qt 프로젝트에서 \"vtable에 대한 정의되지 않은 참조\" 오류가 발생하는 이유는 무엇입니까?다음 기사：Qt 프로젝트에서 \"vtable에 대한 정의되지 않은 참조\" 오류가 발생하는 이유는 무엇입니까?