在 C# 中正確將 UTF-8 字串轉換為 ISO-8859-1
直接將 UTF-8 字串轉換為 ISO-8859-1 可能會導致資料遺失或結果不正確。 關鍵是正確處理字串的位元組數組表示形式。 一個常見的錯誤是使用 ISO-8859-1 編碼錯誤解碼 UTF-8 位元組。
此解決方案涉及兩個步驟:首先將 UTF-8 位元組數組轉換為 ISO-8859-1 位元組數組,然後使用 ISO-8859-1 編碼對該位元組數組進行解碼。 這可以避免誤解位元組。
這是修正後的 C# 程式碼:
<code class="language-csharp">Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(Message); byte[] isoBytes = Encoding.Convert(utf8, iso, utfBytes); string msg = iso.GetString(isoBytes);</code>
此方法使用Encoding.Convert
執行正確的逐位元組轉換,確保產生的字串在ISO-8859-1 編碼(僅支援目前字元的子集)的限制內準確反映原始資料以UTF-8 編碼)。 請記住,在此轉換過程中,ISO-8859-1 中無法表示的字元將會遺失或被取代。
以上是如何在 C# 中將 UTF-8 字串正確轉換為 ISO-8859-1?的詳細內容。更多資訊請關注PHP中文網其他相關文章!