>백엔드 개발 >C++ >데이터 손실 없이 UTF-8을 ISO-8859-1 인코딩으로 올바르게 변환하려면 어떻게 해야 합니까?

데이터 손실 없이 UTF-8을 ISO-8859-1 인코딩으로 올바르게 변환하려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2025-01-08 14:27:41901검색

How Can I Correctly Convert UTF-8 to ISO-8859-1 Encoding Without Data Loss?

UTF-8에서 ISO-8859-1 인코딩 변환 문제 해결

특히 ASCII가 아닌 문자가 포함된 경우 서로 다른 인코딩 간에 문자열을 변환하는 데 어려움이 있는 경우가 많습니다. 자주 발생하는 문제는 UTF-8에서 ISO-8859-1(Latin-1)로 변환하는 것입니다. 잘못된 변환은 "ääÖöÕõÜü"를 "Ã?äÃ?öÃ?ÃμÃ?ü"와 같은 것으로 변환할 수 있습니다.

이는 UTF-8이 가변 길이 인코딩을 사용하는 반면 ISO-8859-1은 고정 단일 바이트 인코딩을 사용하기 때문에 발생합니다. GetString()과 같은 방법을 사용한 직접 변환은 ASCII가 아닌 문자를 손상시킬 수 있습니다.

해결책은 Encoding.Convert 메소드를 사용하는 것입니다. 이는 변환 프로세스를 올바르게 처리합니다. UTF-8 바이트 배열을 가져와 ISO-8859-1 바이트 배열로 변환한 다음 대상 인코딩을 사용하여 이 배열을 디코딩합니다.

수정된 코드 조각은 다음과 같습니다.

<code class="language-csharp">Encoding iso = Encoding.GetEncoding("ISO-8859-1");
Encoding utf8 = Encoding.UTF8;
byte[] utfBytes = utf8.GetBytes(Message);
byte[] isoBytes = Encoding.Convert(utf8, iso, utfBytes);
string msg = iso.GetString(isoBytes);</code>

이 접근 방식은 ASCII가 아닌 문자의 정확한 변환을 보장하여 예제 입력에서 예상되는 "ääÖöÕõÜü" 출력을 생성합니다. 핵심은 최종 디코딩 전 Encoding.Convert에서 제공하는 중간 바이트 배열 조작입니다.

위 내용은 데이터 손실 없이 UTF-8을 ISO-8859-1 인코딩으로 올바르게 변환하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.