首頁 >後端開發 >C++ >如何將 Unicode UTF-8 檔案讀取到 C 11 中的 wstring 中?

如何將 Unicode UTF-8 檔案讀取到 C 11 中的 wstring 中?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-11-06 01:02:03352瀏覽

How can I read Unicode UTF-8 files into wstrings in C  11?

將Unicode UTF-8 檔案讀取到WStrings

在Windows 環境中,使用C 11 提供了讀取Unicode (UTF- 8) 的功能檔轉換為wstrings。這是透過使用 std::codecvt_utf8 方面來實現的。

std::codecvt_utf8 方面

std::codecvt_utf8 方面有助於 UTF-8 之間的轉換。 8 編碼位元組字串和 UCS2 或 UCS4 字串。這種多功能性支援讀取和寫入文字和二進位 UTF-8 檔案。

用法

使用構面的實作涉及建立封裝構面的語言環境物件和特定於區域設定的資訊。透過在流緩衝區中註入此語言環境,可以讀取 UTF-8 檔案。

使用此方法的範例實作是:

#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename)
{
    std::wifstream wif(filename);
    wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
    std::wstringstream wss;
    wss << wif.rdbuf();
    return wss.str();
}

int main()
{
    std::wstring wstr = readFile("a.txt");
    // Do something with your wstring
    return 0;
}

全域語言環境設定

或者,可以使用std::codecvt_utf8 方面設定全域全域全域C 語言環境。此方法確保所有 std::locale 預設建構函式將傳回全域區域設定的副本,從而消除明確流緩衝區注入的需要。

設定全域區域設定:

std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));

透過此設置,您可以將檔案讀取操作簡化為:

std::wifstream wif("a.txt");
std::wstringstream wss;
wss << wif.rdbuf();
std::wstring wstr = wss.str();

以上是如何將 Unicode UTF-8 檔案讀取到 C 11 中的 wstring 中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn