Heim >Backend-Entwicklung >Golang >Wie entferne ich ungültige UTF-8-Zeichen aus einem Go-String?

Wie entferne ich ungültige UTF-8-Zeichen aus einem Go-String?

Linda Hamilton
Linda HamiltonOriginal
2024-12-09 21:42:11949Durchsuche

How Do I Remove Invalid UTF-8 Characters from a Go String?

Eliminieren ungültiger UTF-8-Zeichen in einer Zeichenfolge in Go

Das Kodieren/Dekodieren von Daten mit UTF-8 gewährleistet die Kompatibilität zwischen verschiedenen Systemen und Zeichen Sätze. Allerdings kann es aufgrund von Übertragungsfehlern, böswilligen Angriffen oder anderen Faktoren zu ungültigen UTF-8-Zeichen kommen. Das Entfernen dieser Zeichen ist für die Datenintegrität und die ordnungsgemäße JSON-Kodierung von entscheidender Bedeutung.

Lösung:

Um dieses Problem in Go zu beheben, stehen mehrere Ansätze zur Verfügung:

  1. Go 1.13 :

    • In Go 1.13 und späteren Versionen bietet die Funktion strings.ToValidUTF8 eine praktische Lösung. Es akzeptiert eine Zeichenfolge und ein Ersatzzeichen als Argumente und gibt eine Kopie der Zeichenfolge zurück, wobei ungültige UTF-8-Zeichen durch das angegebene Zeichen ersetzt werden.
    • Beispiel:

      fixedString := strings.ToValidUTF8("a\xc5z", "")
  2. Go 1.11 :

    • In Go 1.11 und späteren Versionen können Sie die strings.Map-Funktion in Verbindung mit utf8.RuneError verwenden, um ungültige UTF-8-Zeichen zu entfernen. Die strings.Map-Funktion wendet eine Zuordnungsfunktion auf jedes Zeichen in einer Zeichenfolge an, und utf8.RuneError ist eine Konstante, die eine ungültige UTF-8-Rune darstellt.
    • Beispiel:

      fixUtf := func(r rune) rune {
          if r == utf8.RuneError {
              return -1
          }
          return r
      }
      
      fixedString := strings.Map(fixUtf, "a\xc5z")

Das obige ist der detaillierte Inhalt vonWie entferne ich ungültige UTF-8-Zeichen aus einem Go-String?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn