首頁 >後端開發 >Golang >如何在 Go 中解組 ISO-8859-1 編碼的 XML?

如何在 Go 中解組 ISO-8859-1 編碼的 XML?

Patricia Arquette
Patricia Arquette原創
2024-12-12 19:18:11900瀏覽

How Can I Unmarshal ISO-8859-1 Encoded XML in Go?

使用Go 解組以ISO-8859-1 編碼的XML

如果您的XML 輸入,Go 的xml 包中流行的Unmarshal 函數可能會具有挑戰性不是以UTF-8 編碼的。為了處理這類輸入,Go 需要一個 CharsetReader。

哪裡可以找到 CharsetReader?

在 Go 的最新版本(2015 年起)中,golang.org/x /net/html/charset 套件提供了必要的功能。此套件中的 NewReaderLabel 函數可以執行必要的轉換。

程式碼範例

以下程式碼片段示範如何使用NewReaderLabel 正確解組以ISO 編碼的XML 輸入-8859-1:

import (
    "encoding/xml"
    "golang.org/x/net/html/charset"
    "bytes"
)

var theXml = [...]byte{byte(0x3C), byte(0x3F), byte(0x78), byte(0x6D), /* ... */}

reader := bytes.NewReader(theXml)
decoder := xml.NewDecoder(reader)
decoder.CharsetReader = charset.NewReaderLabel
err := decoder.Decode(&parsed)

透過合併此代碼,Go 可以成功解組以ISO-8859-1 編碼的XML 輸入。

以上是如何在 Go 中解組 ISO-8859-1 編碼的 XML?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn