>백엔드 개발 >Golang >Go 문자열에서 잘못된 UTF-8 문자를 어떻게 제거합니까?

Go 문자열에서 잘못된 UTF-8 문자를 어떻게 제거합니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-09 21:42:11993검색

How Do I Remove Invalid UTF-8 Characters from a Go String?

Go의 문자열에서 잘못된 UTF-8 문자 제거

UTF-8을 사용하여 데이터를 인코딩/디코딩하면 다양한 시스템과 문자 간의 호환성이 보장됩니다. 세트. 그러나 전송 오류, 악의적인 공격 또는 기타 요인으로 인해 잘못된 UTF-8 문자가 발생할 수 있습니다. 데이터 무결성과 적절한 JSON 인코딩을 위해서는 이러한 문자를 제거하는 것이 필수적입니다.

해결책:

Go에서 이 문제를 해결하기 위해 사용할 수 있는 몇 가지 접근 방식이 있습니다.

  1. 고 1.13 :

    • Go 1.13 이상 버전에서는 strings.ToValidUTF8 함수가 편리한 솔루션을 제공합니다. 문자열과 대체 문자를 인수로 취하고 잘못된 UTF-8 문자가 지정된 문자로 대체된 문자열의 복사본을 반환합니다.
    • 예:

      fixedString := strings.ToValidUTF8("a\xc5z", "")
  2. 고 1.11 :

    • Go 1.11 이상 버전에서는 utf8.RuneError와 함께 strings.Map 함수를 사용하여 잘못된 UTF-8 문자를 제거할 수 있습니다. strings.Map 함수는 문자열의 각 문자에 매핑 함수를 적용하며 utf8.RuneError는 잘못된 UTF-8 룬을 나타내는 상수입니다.
    • 예:

      fixUtf := func(r rune) rune {
          if r == utf8.RuneError {
              return -1
          }
          return r
      }
      
      fixedString := strings.Map(fixUtf, "a\xc5z")

위 내용은 Go 문자열에서 잘못된 UTF-8 문자를 어떻게 제거합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.