Windows 中的UTF-8 輸出:綜合指南
使用C 語言編寫依賴C 語言的跨平台應用程式時, Windows 提出了獨特的挑戰UTF-8 編碼的字串。與 Unix 系統自動將 8 位元字串解釋為 UTF-8 不同,Windows 需要特定配置才能執行相同操作。
考慮以下程式碼:
<code class="cpp">#include <string> #include <iostream> int main() { std::string test = u8"Greek: αβγδ; German: Übergrößenträger"; std::cout << test; return 0; }</code>
在 Unix 系統上,此程式碼將正確呈現所需的字元。但是,在 Windows 上,由於 std::cout 預設期望 Latin-1 或類似非 Unicode 格式的 8 位元字串,它將顯示亂碼。
要解決此問題,Windows 需要兩個設定步驟:
1。將控制台代碼頁設定為UTF-8
這會通知控制台將其接收到的位元組流解釋為UTF-8:
<code class="cpp">SetConsoleOutputCP(CP_UTF8);</code>
2。在 std::cout
std::basic_filebuf 的 Visual Studio STL 實作中啟用緩衝可以將 UTF-8 序列作為單一位元組傳遞,導致控制台解釋不正確。透過啟用緩衝,我們確保字串完整地傳遞:
<code class="cpp">setvbuf(stdout, nullptr, _IOFBF, 1000);</code>
透過這些配置,UTF-8 字串將準確地顯示在 Windows 控制台上。但是,需要注意的是,Windows 控制台仍然存在遺留問題:
透過這個修訂後的答案結合了程式碼和上下文,提供了在 Windows 上列印 UTF-8 字串的全面的分步解決方案,解決了歷史和現代的考慮。
以上是如何在 Windows 控制台上正確顯示 UTF-8 字串:綜合指南?的詳細內容。更多資訊請關注PHP中文網其他相關文章!