>백엔드 개발 >Golang >HTML 태그의 유니코드 이스케이프 시퀀스를 Golang의 HTML 엔터티로 어떻게 변환할 수 있나요?

HTML 태그의 유니코드 이스케이프 시퀀스를 Golang의 HTML 엔터티로 어떻게 변환할 수 있나요?

Patricia Arquette
Patricia Arquette원래의
2024-12-22 20:04:18759검색

How Can I Convert Unicode Escape Sequences in HTML Tags to HTML Entities in Golang?

Golang의 HTML 태그에 있는 이스케이프 문자 변환

"u003chtmlu003e"와 같은 유니코드 이스케이프 시퀀스를 해당 HTML 엔터티로 직접 변환하는 경우 Golang에서는 이에 상응하는 "

구현

이 변환을 수행하려면 다음 단계를 따르세요.

  • 백틱을 사용하여 이스케이프된 유니코드 시퀀스를 큰따옴표로 묶습니다. (`)는 원시 문자열 리터럴을 나타냅니다. 이렇게 하면 컴파일러가 시퀀스를 해석하거나 인용을 해제할 수 없습니다.
  • strconv.Unquote()를 사용하여 시퀀스를 이스케이프 해제하세요.

다음을 고려하십시오 코드:

// Important to use backtick ` (raw string literal)
// else the compiler will unquote it (interpreted string literal)!

s := `\u003chtml\u003e`
fmt.Println(s)
s2, err := strconv.Unquote(`"` + s + `"`)
if err != nil {
    panic(err)
}
fmt.Println(s2)

출력:

\u003chtml\u003e

참고:

포괄적인 HTML 텍스트 이스케이프 및 이스케이프 해제 작업의 경우 html 패키지 사용을 고려하세요. , 특히 html.UnescapeString()은 특정 유니코드를 디코딩하는 데 제한이 있지만 시퀀스.

적절한 이스케이프 해제를 허용하기 위해 유니코드 이스케이프 시퀀스의 리터럴 형식을 유지하려면 원시 문자열 리터럴(백틱 사용)이 필수적입니다.

위 내용은 HTML 태그의 유니코드 이스케이프 시퀀스를 Golang의 HTML 엔터티로 어떻게 변환할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.