>백엔드 개발 >Golang >Go의 JSON 문자열에서 잘못된 UTF-8 문자를 효과적으로 제거하는 방법은 무엇입니까?

Go의 JSON 문자열에서 잘못된 UTF-8 문자를 효과적으로 제거하는 방법은 무엇입니까?

DDD
DDD원래의
2024-12-07 19:40:17490검색

How to Effectively Remove Invalid UTF-8 Characters from JSON Strings in Go?

Go의 JSON 문자열에서 잘못된 UTF-8 문자 제거

JSON 마샬링 중에 문자열에서 잘못된 UTF-8 문자를 발견하면 일반적으로 Go에서 문제가 발생하면 이를 제거하거나 처리할 수 있는 효과적인 방법을 찾는 것이 중요합니다.

In Go에서는 이 문제를 해결하기 위해 다양한 패키지와 기술을 사용할 수 있습니다. Go 1.13에 도입된 간단한 옵션 중 하나는 다음과 같습니다.

strings.ToValidUTF8("a\xc5z", "")

이 함수는 유효하지 않은 UTF-8 시퀀스를 두 번째 매개변수로 지정된 대체 문자열로 바꿉니다.

또는 Go 1.11 이상에서는 다음을 제공합니다. Map 기능과 utf8.RuneError 상수를 사용한 다용도 접근 방식:

fixUtf := func(r rune) rune {
    if r == utf8.RuneError {
        return -1
    }
    return r
}

fmt.Println(strings.Map(fixUtf, "a\xc5z"))

strings.Map 함수는 지정된 함수를 문자열의 각 룬에 적용하여 새 문자열을 반환합니다. fixUtf 함수는 잘못된 문자를 확인하고 이를 -1로 대체하여 출력에서 ​​효과적으로 제거합니다.

이러한 방법을 사용하면 개발자는 JSON 문자열에서 잘못된 UTF-8 문자를 빠르고 안정적으로 처리하여 유효한 UTF-8을 보장할 수 있습니다. 마샬링 중 데이터 8개.

위 내용은 Go의 JSON 문자열에서 잘못된 UTF-8 문자를 효과적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.