>백엔드 개발 >C++ >C 11을 사용하는 Windows에서 유니코드(UTF-8) 파일을 wstring으로 읽는 방법은 무엇입니까?

C 11을 사용하는 Windows에서 유니코드(UTF-8) 파일을 wstring으로 읽는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-11-06 07:26:02992검색

How to Read Unicode (UTF-8) Files into wstrings on Windows with C  11?

Windows에서 유니코드 UTF-8 파일을 Wstring으로 읽기

Windows에서 유니코드(UTF-8) 파일을 wstring으로 읽으면 C 11의 std::codecvt_utf8 패싯을 사용하여 효율적으로 달성할 수 있습니다.

std::codecvt_utf8을 사용하면 UTF-8 바이트 문자열과 UCS2 또는 UCS4 문자열 간의 변환이 단순화됩니다. 이 패싯을 사용하면 텍스트와 바이너리 모두 UTF-8 파일을 읽고 쓸 수 있습니다.

패싯을 활용하려면 원하는 현지화된 환경을 정의하는 패싯을 캡슐화하는 로케일 개체를 생성하세요. 로케일 객체가 생성되면 이를 스트림 버퍼에 추가합니다.

imbuing을 사용한 구현은 다음과 같습니다.

#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename)
{
    std::wifstream wif(filename);
    wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
    std::wstringstream wss;
    wss << wif.rdbuf();
    return wss.str();
}

스트림 버퍼를 추가한 후 파일을 wstring으로 읽는 것은 간단합니다.

std::wstring wstr = readFile("a.txt");

또는 문자열 스트림으로 작업하기 전에 전역 C 로케일을 설정하면 명시적 임뷰가 필요하지 않습니다.

std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));

이렇게 하면 전역 로케일이 기본값으로 설정되고 향후 스트림 버퍼에 적용됩니다.

위 내용은 C 11을 사용하는 Windows에서 유니코드(UTF-8) 파일을 wstring으로 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.