UTF-8에서 ISO-8859-1 인코딩 변환 문제 해결
특히 ASCII가 아닌 문자가 포함된 경우 서로 다른 인코딩 간에 문자열을 변환하는 데 어려움이 있는 경우가 많습니다. 자주 발생하는 문제는 UTF-8에서 ISO-8859-1(Latin-1)로 변환하는 것입니다. 잘못된 변환은 "ääÖöÕõÜü"를 "Ã?äÃ?öÃ?ÃμÃ?ü"와 같은 것으로 변환할 수 있습니다.
이는 UTF-8이 가변 길이 인코딩을 사용하는 반면 ISO-8859-1은 고정 단일 바이트 인코딩을 사용하기 때문에 발생합니다. GetString()
과 같은 방법을 사용한 직접 변환은 ASCII가 아닌 문자를 손상시킬 수 있습니다.
해결책은 Encoding.Convert
메소드를 사용하는 것입니다. 이는 변환 프로세스를 올바르게 처리합니다. UTF-8 바이트 배열을 가져와 ISO-8859-1 바이트 배열로 변환한 다음 대상 인코딩을 사용하여 이 배열을 디코딩합니다.
수정된 코드 조각은 다음과 같습니다.
<code class="language-csharp">Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(Message); byte[] isoBytes = Encoding.Convert(utf8, iso, utfBytes); string msg = iso.GetString(isoBytes);</code>
이 접근 방식은 ASCII가 아닌 문자의 정확한 변환을 보장하여 예제 입력에서 예상되는 "ääÖöÕõÜü" 출력을 생성합니다. 핵심은 최종 디코딩 전 Encoding.Convert
에서 제공하는 중간 바이트 배열 조작입니다.
위 내용은 데이터 손실 없이 UTF-8을 ISO-8859-1 인코딩으로 올바르게 변환하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!