Maison >développement back-end >Golang >Comment convertir efficacement les séquences d'échappement HTML dans Go ?

Comment convertir efficacement les séquences d'échappement HTML dans Go ?

Susan Sarandon
Susan Sarandonoriginal
2024-12-17 15:22:16650parcourir

How to Efficiently Convert HTML Escape Sequences in Go?

Conversion des caractères d'échappement dans les balises HTML

Dans Go, la conversion des balises HTML contenant des caractères d'échappement n'est pas aussi simple que souhaité. Alors que json.Marshal() peut facilement convertir des chaînes avec des caractères comme "<" à sa séquence d'échappement "u003chtmlu003e", json.Unmarshal() ne fournit pas de méthode directe et efficace pour l'opération inverse.

Utilisation de strconv.Unquote()

La fonction strconv.Unquote() peut être utilisée pour effectuer la conversion. Cependant, cela nécessite que la chaîne soit placée entre guillemets. Par conséquent, l'ajout manuel de ces caractères englobants est nécessaire.

import (
    "fmt"
    "strconv"
)

func main() {
    // Important to use backtick ` (raw string literal)
    // else the compiler will unquote it (interpreted string literal)!

    s := `\u003chtml\u003e`
    fmt.Println(s)
    s2, err := strconv.Unquote(`"` + s + `"`)
    if err != nil {
        panic(err)
    }
    fmt.Println(s2)
}

Sortie :

\u003chtml\u003e
<html></p>
<p><strong>Remarque :</strong></p>
<p>Le package html est également disponible pour l'échappement et la déséchappement du texte HTML. Cependant, il ne décode pas les séquences Unicode de la forme uxxxx, seulement decimal; ou HH;.</p>
<pre class="brush:php;toolbar:false">import (
    "fmt"
    "html"
)

func main() {
    fmt.Println(html.UnescapeString(`\u003chtml\u003e`)) // wrong
    fmt.Println(html.UnescapeString(`&amp;#60;html&amp;#62;`))   // good
    fmt.Println(html.UnescapeString(`&amp;#x3c;html&amp;#x3e;`)) // good
}

Sortie :

\u003chtml\u003e
<html>
<html>

Remarque 2 :

N'oubliez pas que les chaînes entre guillemets utilisent le guillemet double ( ") sont des chaînes interprétées, qui ne sont pas mises entre guillemets par le compilateur. Pour spécifier une chaîne avec ses guillemets intacts, utilisez des guillemets pour créer une chaîne brute littéral.

s := "\u003chtml\u003e" // Interpreted string literal (unquoted by the compiler!)
fmt.Println(s)

s2 := `\u003chtml\u003e` // Raw string literal (no unquoting will take place)
fmt.Println(s2)

s3 := "\u003chtml\u003e" // Double quoted interpreted string literal
                           // (unquoted by the compiler to be "single" quoted)
fmt.Println(s3)

Sortie :

<html>
\u003chtml\u003e

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn