Windows の Wstring への UTF-8 コンテンツのロード
Windows プラットフォームで Unicode (UTF-8) ファイルを wstring に読み取るには、慎重な処理が必要です
C 11 の出現により、std::codecvt_utf8 ファセットは、UTF-8 でエンコードされたバイト文字列を UCS2 または UCS4 文字列に変換するための堅牢なソリューションを提供します。このファセットにより、UTF-8 ファイルの読み取りと書き込みの両方が容易になります。
std::codecvt_utf8 ファセットの使用
std::codecvt_utf8 ファセットを効果的に使用するには、次の手順が必要です:
このアプローチの実装例の概要を以下に示します。
#include <sstream> #include <fstream> #include <codecvt> std::wstring readFile(const char* filename) { std::wifstream wif(filename); wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>)); std::wstringstream wss; wss << wif.rdbuf(); return wss.str(); }
この関数UTF-8 コンテンツを wstring 変数に簡単にロードするために利用できます。
代替: グローバル C ロケールの設定
代わりに、グローバル C ロケールを設定することもできます。文字列ストリームを操作する前に、ロケールを UTF-8 に変更してください。これにより、ストリーム バッファーを手動で埋め込む必要がなくなります。
std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
このアプローチを使用すると、後続のすべての標準ロケール コンストラクターは、変更されたグローバル C ロケールのコピーを返し、UTF-8 エンコーディングの自動処理が可能になります。
以上がWindows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。