標準C 庫中的Unicode 檔案處理
使用C 標準庫開啟檔案的任務對於Windows 應用程式和Unicode 來說尤其具有挑戰性檔案名稱。在這種情況下,Unicode 通常指的是 UTF-8。
C 標準函式庫缺乏內在的 Unicode 支援。 char 和 wchar_t 本質上不是 Unicode 編碼。在 Windows 上,wchar_t 表示 UTF-16,但標準函式庫缺乏 UTF-8 檔案名稱的明確支援(char 在 Windows 上是非 Unicode)。
Microsoft STL 為接受const wchar_t 的檔案流提供了一個建構函式* 檔案名,允許以下列方式建立檔案:
wchar_t const name[] = L"filename.txt"; std::fstream file(name);
但是,此重載不符合C 11 標準(僅保證基於字元的版本)。它在替代 STL 實作中也不存在,例如從 g 4.8.x 開始,GCC 的 MinGW(-w64) libstdc。
請注意,平台差異會影響編碼解釋。 Windows 上的 char 不是 UTF-8,而其他作業系統上的 wchar_t 可能不是 UTF-16。因此,可移植性是一個問題。標準未定義從 wchar_t 檔案名稱開啟流,並且由於作業系統相關的編碼變化,在 char 中指定檔案名稱可能會出現問題。
以上是如何在標準 C 中可靠地處理 Unicode 檔名?的詳細內容。更多資訊請關注PHP中文網其他相關文章!