>백엔드 개발 >Golang >Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?

Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-26 03:28:151008검색

How to Handle Non-UTF-8 Encoded XML in Go?

Go에서 UTF-8이 아닌 XML 입력 처리

Go의 xml 패키지에서 Unmarshal 함수를 사용하여 XML 입력을 역마샬링하려고 할 때, 입력이 UTF-8로 인코딩되지 않으면 문제가 발생할 수 있습니다. 이 문제를 해결하려면 CharsetReader가 필요합니다.

CharsetReader를 찾을 수 있는 위치

다행히 Go의 net/html 패키지는 charset.NewReaderLabel 형식의 솔루션을 제공합니다. 이 리더는 UTF-8로 인코딩되지 않은 입력을 UTF-8로 변환하는 작업을 처리할 수 있습니다.

2015년 이후 업데이트된 솔루션

이전 버전의 Go에서는 사용자 정의 CharsetReader를 구현해야 했습니다. 그러나 최신 버전의 Go에서는 charset.NewReaderLabel을 사용하여 더 간단한 솔루션을 제공합니다. 업데이트된 코드 조각은 다음과 같습니다.

import (
    "encoding/xml"
    "bytes"
    "golang.org/x/net/html/charset"
)

// ...
reader := bytes.NewReader(theXml)
decoder := xml.NewDecoder(reader)
decoder.CharsetReader = charset.NewReaderLabel
err = decoder.Decode(&parsed)

charset.NewReaderLabel을 CharsetReader로 사용하면 이제 Unmarshal 함수가 수동 변환이나 사용자 지정 구현 없이 UTF-8로 인코딩되지 않은 XML 입력을 성공적으로 처리할 수 있습니다.

위 내용은 Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.