ホームページ >バックエンド開発 >Golang >HTML タグ内の Unicode エスケープ シーケンスを Golang の HTML エンティティに変換するにはどうすればよいですか?

HTML タグ内の Unicode エスケープ シーケンスを Golang の HTML エンティティに変換するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-12-22 20:04:18759ブラウズ

How Can I Convert Unicode Escape Sequences in HTML Tags to HTML Entities in Golang?

Golang の HTML タグのエスケープ文字の変換

「u003chtmlu003e」のような Unicode エスケープ シーケンスを HTML エンティティに直接変換する場合Golang では同等の「

実装

この変換を実現するには、次の手順に従います。

  • バッククォート (`) を使用して生の文字列リテラルを示す二重引用符でエスケープされた Unicode シーケンス。これにより、コンパイラがシーケンスを解釈したり引用符を解除したりすることがなくなります。
  • シーケンスのエスケープを解除するには、strconv.Unquote() を使用します。

次のことを考慮してくださいコード:

// Important to use backtick ` (raw string literal)
// else the compiler will unquote it (interpreted string literal)!

s := `\u003chtml\u003e`
fmt.Println(s)
s2, err := strconv.Unquote(`"` + s + `"`)
if err != nil {
    panic(err)
}
fmt.Println(s2)

出力:

\u003chtml\u003e

注:

包括的な HTML テキストのエスケープおよびエスケープ解除操作については、html パッケージの使用を検討してください。 、具体的には html.UnescapeString() ですが、特定の Unicode のデコードには制限があります。

生の文字列リテラル (バッククォートを使用) は、Unicode エスケープ シーケンスのリテラル形式を保持して適切なエスケープ解除を可能にするために不可欠です。

以上がHTML タグ内の Unicode エスケープ シーケンスを Golang の HTML エンティティに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。