首頁 >後端開發 >C++ >如何在 C# 中將 UTF-8 字串正確轉換為 ISO-8859-1?

如何在 C# 中將 UTF-8 字串正確轉換為 ISO-8859-1?

Patricia Arquette
Patricia Arquette原創
2025-01-08 14:34:40300瀏覽

How to Correctly Convert a UTF-8 String to ISO-8859-1 in C#?

在 C# 中正確將 UTF-8 字串轉換為 ISO-8859-1

直接將 UTF-8 字串轉換為 ISO-8859-1 可能會導致資料遺失或結果不正確。 關鍵是正確處理字串的位元組數組表示形式。 一個常見的錯誤是使用 ISO-8859-1 編碼錯誤解碼 UTF-8 位元組。

此解決方案涉及兩個步驟:首先將 UTF-8 位元組數組轉換為 ISO-8859-1 位元組數組,然後使用 ISO-8859-1 編碼對該位元組數組進行解碼。 這可以避免誤解位元組。

這是修正後的 C# 程式碼:

<code class="language-csharp">Encoding iso = Encoding.GetEncoding("ISO-8859-1");
Encoding utf8 = Encoding.UTF8;
byte[] utfBytes = utf8.GetBytes(Message);
byte[] isoBytes = Encoding.Convert(utf8, iso, utfBytes);
string msg = iso.GetString(isoBytes);</code>

此方法使用Encoding.Convert 執行正確的逐位元組轉換,確保產生的字串在ISO-8859-1 編碼(僅支援目前字元的子集)的限制內準確反映原始資料以UTF-8 編碼)。 請記住,在此轉換過程中,ISO-8859-1 中無法表示的字元將會遺失或被取代。

以上是如何在 C# 中將 UTF-8 字串正確轉換為 ISO-8859-1?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn