首頁  >  文章  >  後端開發  >  如何在 Windows 控制台上正確顯示 UTF-8 字串:綜合指南?

如何在 Windows 控制台上正確顯示 UTF-8 字串:綜合指南?

Susan Sarandon
Susan Sarandon原創
2024-10-29 18:41:03352瀏覽

How to Display UTF-8 Strings Correctly on Windows Console: A Comprehensive Guide?

Windows 中的UTF-8 輸出:綜合指南

使用C 語言編寫依賴C 語言的跨平台應用程式時, Windows 提出了獨特的挑戰UTF-8 編碼的字串。與 Unix 系統自動將 8 位元字串解釋為 UTF-8 不同,Windows 需要特定配置才能執行相同操作。

考慮以下程式碼:

<code class="cpp">#include <string>
#include <iostream>

int main() {
    std::string test = u8"Greek: αβγδ; German: Übergrößenträger";
    std::cout << test;
    return 0;
}</code>

在 Unix 系統上,此程式碼將正確呈現所需的字元。但是,在 Windows 上,由於 std::cout 預設期望 Latin-1 或類似非 Unicode 格式的 8 位元字串,它將顯示亂碼。

要解決此問題,Windows 需要兩個設定步驟:

1。將控制台代碼頁設定為UTF-8

這會通知控制台將其接收到的位元組流解釋為UTF-8:

<code class="cpp">SetConsoleOutputCP(CP_UTF8);</code>

2。在 std::cout

std::basic_filebuf 的 Visual Studio STL 實作中啟用緩衝可以將 UTF-8 序列作為單一位元組傳遞,導致控制台解釋不正確。透過啟用緩衝,我們確保字串完整地傳遞:

<code class="cpp">setvbuf(stdout, nullptr, _IOFBF, 1000);</code>

透過這些配置,UTF-8 字串將準確地顯示在 Windows 控制台上。但是,需要注意的是,Windows 控制台仍然存在遺留問題:

  • 光柵字體: 這些字體會忽略控制台的代碼頁,需要對非ASCII 使用TrueType 字體Unicode 字元。
  • Windows 7 預設字型:在 Windows 10 之前,預設字型是光柵字體,需要手動設定為 TrueType 字型。

透過這個修訂後的答案結合了程式碼和上下文,提供了在 Windows 上列印 UTF-8 字串的全面的分步解決方案,解決了歷史和現代的考慮。

以上是如何在 Windows 控制台上正確顯示 UTF-8 字串:綜合指南?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn