C#에서 UTF-8 문자열을 ISO-8859-1로 올바르게 변환
UTF-8 문자열을 ISO-8859-1로 직접 변환하면 데이터가 손실되거나 잘못된 결과가 발생할 수 있습니다. 핵심은 문자열의 바이트 배열 표현을 올바르게 처리하는 것입니다. 일반적인 실수는 ISO-8859-1 인코딩을 사용하여 UTF-8 바이트를 잘못 디코딩하는 것입니다.
이 솔루션에는 2단계 프로세스가 포함됩니다. 먼저 UTF-8 바이트 배열을 ISO-8859-1 바이트 배열로 변환한 다음 ISO-8859-1 인코딩을 사용하여 해당 바이트 배열을 디코딩합니다. 이렇게 하면 바이트를 잘못 해석하는 것을 방지할 수 있습니다.
수정된 C# 코드는 다음과 같습니다.
<code class="language-csharp">Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(Message); byte[] isoBytes = Encoding.Convert(utf8, iso, utfBytes); string msg = iso.GetString(isoBytes);</code>
이 접근 방식은 Encoding.Convert
을 사용하여 적절한 바이트별 변환을 수행하여 결과 문자열이 ISO-8859-1 인코딩 제한 내에서 원본 데이터를 정확하게 반영하도록 합니다(현재 문자의 하위 집합만 지원함). UTF-8). ISO-8859-1에서 표현할 수 없는 문자는 변환 중에 손실되거나 대체된다는 점을 기억하세요.
위 내용은 C#에서 UTF-8 문자열을 ISO-8859-1로 올바르게 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!