Maison >développement back-end >Golang >Comment convertir efficacement les séquences d'échappement HTML dans Go ?
Conversion des caractères d'échappement dans les balises HTML
Dans Go, la conversion des balises HTML contenant des caractères d'échappement n'est pas aussi simple que souhaité. Alors que json.Marshal() peut facilement convertir des chaînes avec des caractères comme "<" à sa séquence d'échappement "u003chtmlu003e", json.Unmarshal() ne fournit pas de méthode directe et efficace pour l'opération inverse.
Utilisation de strconv.Unquote()
La fonction strconv.Unquote() peut être utilisée pour effectuer la conversion. Cependant, cela nécessite que la chaîne soit placée entre guillemets. Par conséquent, l'ajout manuel de ces caractères englobants est nécessaire.
import ( "fmt" "strconv" ) func main() { // Important to use backtick ` (raw string literal) // else the compiler will unquote it (interpreted string literal)! s := `\u003chtml\u003e` fmt.Println(s) s2, err := strconv.Unquote(`"` + s + `"`) if err != nil { panic(err) } fmt.Println(s2) }
Sortie :
\u003chtml\u003e <html></p> <p><strong>Remarque :</strong></p> <p>Le package html est également disponible pour l'échappement et la déséchappement du texte HTML. Cependant, il ne décode pas les séquences Unicode de la forme uxxxx, seulement decimal; ou HH;.</p> <pre class="brush:php;toolbar:false">import ( "fmt" "html" ) func main() { fmt.Println(html.UnescapeString(`\u003chtml\u003e`)) // wrong fmt.Println(html.UnescapeString(`&#60;html&#62;`)) // good fmt.Println(html.UnescapeString(`&#x3c;html&#x3e;`)) // good }
Sortie :
\u003chtml\u003e <html> <html>
Remarque 2 :
N'oubliez pas que les chaînes entre guillemets utilisent le guillemet double ( ") sont des chaînes interprétées, qui ne sont pas mises entre guillemets par le compilateur. Pour spécifier une chaîne avec ses guillemets intacts, utilisez des guillemets pour créer une chaîne brute littéral.
s := "\u003chtml\u003e" // Interpreted string literal (unquoted by the compiler!) fmt.Println(s) s2 := `\u003chtml\u003e` // Raw string literal (no unquoting will take place) fmt.Println(s2) s3 := "\u003chtml\u003e" // Double quoted interpreted string literal // (unquoted by the compiler to be "single" quoted) fmt.Println(s3)
Sortie :
<html> \u003chtml\u003e
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!