Go에서 UTF-8이 아닌 XML 입력 처리
Go의 xml 패키지에서 Unmarshal 함수를 사용하여 XML 입력을 역마샬링하려고 할 때, 입력이 UTF-8로 인코딩되지 않으면 문제가 발생할 수 있습니다. 이 문제를 해결하려면 CharsetReader가 필요합니다.
CharsetReader를 찾을 수 있는 위치
다행히 Go의 net/html 패키지는 charset.NewReaderLabel 형식의 솔루션을 제공합니다. 이 리더는 UTF-8로 인코딩되지 않은 입력을 UTF-8로 변환하는 작업을 처리할 수 있습니다.
2015년 이후 업데이트된 솔루션
이전 버전의 Go에서는 사용자 정의 CharsetReader를 구현해야 했습니다. 그러나 최신 버전의 Go에서는 charset.NewReaderLabel을 사용하여 더 간단한 솔루션을 제공합니다. 업데이트된 코드 조각은 다음과 같습니다.
import ( "encoding/xml" "bytes" "golang.org/x/net/html/charset" ) // ... reader := bytes.NewReader(theXml) decoder := xml.NewDecoder(reader) decoder.CharsetReader = charset.NewReaderLabel err = decoder.Decode(&parsed)
charset.NewReaderLabel을 CharsetReader로 사용하면 이제 Unmarshal 함수가 수동 변환이나 사용자 지정 구현 없이 UTF-8로 인코딩되지 않은 XML 입력을 성공적으로 처리할 수 있습니다.
위 내용은 Go에서 UTF-8로 인코딩되지 않은 XML을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!