ホームページ  >  記事  >  バックエンド開発  >  Windows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?

Windows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-11-06 21:35:03737ブラウズ

How to Load UTF-8 Content into Wstrings on Windows?

Windows の Wstring への UTF-8 コンテンツのロード

Windows プラットフォームで Unicode (UTF-8) ファイルを wstring に読み取るには、慎重な処理が必要です

C 11 の出現により、std::codecvt_utf8 ファセットは、UTF-8 でエンコードされたバイト文字列を UCS2 または UCS4 文字列に変換するための堅牢なソリューションを提供します。このファセットにより、UTF-8 ファイルの読み取りと書き込みの両方が容易になります。

std::codecvt_utf8 ファセットの使用

std::codecvt_utf8 ファセットを効果的に使用するには、次の手順が必要です:

  1. カルチャ固有の情報をカプセル化し、UTF-8 変換ファセットを含むロケール オブジェクトを作成します。
  2. ローカライズされた情報を ifstream のストリーム バッファーに埋め込みます。 .
  3. 埋め込まれたストリーム バッファを使用して UTF-8 ファイルを読み取ります。

このアプローチの実装例の概要を以下に示します。

#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename) {
  std::wifstream wif(filename);
  wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
  std::wstringstream wss;
  wss << wif.rdbuf();
  return wss.str();
}

この関数UTF-8 コンテンツを wstring 変数に簡単にロードするために利用できます。

代替: グローバル C ロケールの設定

代わりに、グローバル C ロケールを設定することもできます。文字列ストリームを操作する前に、ロケールを UTF-8 に変更してください。これにより、ストリーム バッファーを手動で埋め込む必要がなくなります。

std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));

このアプローチを使用すると、後続のすべての標準ロケール コンストラクターは、変更されたグローバル C ロケールのコピーを返し、UTF-8 エンコーディングの自動処理が可能になります。

以上がWindows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。