Windows 中的 UTF-8 输出:综合指南
在使用 C 语言编写依赖于 C 语言的跨平台应用程序时,Windows 提出了独特的挑战UTF-8 编码的字符串。与 Unix 系统自动将 8 位字符串解释为 UTF-8 不同,Windows 需要特定配置才能执行相同操作。
考虑以下代码:
<code class="cpp">#include <string> #include <iostream> int main() { std::string test = u8"Greek: αβγδ; German: Übergrößenträger"; std::cout << test; return 0; }</code>
在 Unix 系统上,此代码将正确呈现所需的字符。但是,在 Windows 上,由于 std::cout 默认期望 Latin-1 或类似非 Unicode 格式的 8 位字符串,它将显示乱码。
要解决此问题,Windows 需要两个配置步骤:
1。将控制台代码页设置为 UTF-8
这会通知控制台将其接收到的字节流解释为 UTF-8:
<code class="cpp">SetConsoleOutputCP(CP_UTF8);</code>
2。在 std::cout
std::basic_filebuf 的 Visual Studio STL 实现中启用缓冲可以将 UTF-8 序列作为单个字节传递,从而导致控制台解释不正确。通过启用缓冲,我们确保字符串完整地传递:
<code class="cpp">setvbuf(stdout, nullptr, _IOFBF, 1000);</code>
通过这些配置,UTF-8 字符串将准确地显示在 Windows 控制台上。但是,需要注意的是,Windows 控制台仍然存在遗留问题:
通过这个修订后的答案结合了代码和上下文,提供了在 Windows 上打印 UTF-8 字符串的全面的分步解决方案,解决了历史和现代的考虑。
以上是如何在 Windows 控制台上正确显示 UTF-8 字符串:综合指南?的详细内容。更多信息请关注PHP中文网其他相关文章!