Wie entferne ich effizient diakritische Zeichen aus UTF-8-Zeichenfolgen in Go?-Golang-php.cn

Heim

Backend-Entwicklung

Golang

Wie entferne ich effizient diakritische Zeichen aus UTF-8-Zeichenfolgen in Go?

Susan Sarandon

Dec 08, 2024 pm 02:03 PM

How to Efficiently Remove Diacritics from UTF-8 Strings in Go?

Diakritische Zeichen in Go entfernen

Bei der Arbeit mit UTF8-codierten Zeichenfolgen kann es erforderlich sein, diakritische Zeichen, wie z. B. die Akzente aus „žůžo“, zu entfernen „um „zuzo“ zu bekommen. Um solche Szenarien effizient zu bewältigen, stehen in Go Standardbibliotheken und -techniken zur Verfügung.

Ein Ansatz besteht darin, die Funktion unicode.Is() zu nutzen, um diakritische Zeichen (als „Mn“ klassifizierte Zeichen für Zeichen ohne Leerzeichen) zu identifizieren.

Der folgende Codeausschnitt zeigt, wie man diakritische Zeichen aus einer bestimmten Zeichenfolge mithilfe von unicode/norm und golang.org/x/text/transform entfernt Pakete:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks
}

func main() {
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)
    result, _, _ := transform.String(t, "žůžo")
    fmt.Println(result)
}

Dieser Code entfernt diakritische Zeichen durch Anwenden einer Reihe von Transformationen:

Normalisierte Formzerlegung (NFD): Zerlegt die Zeichenfolge in ihre Einzelteile Basis-Unicode-Zeichen, einschließlich Diakritische Zeichen.
RemoveFunc(isMn): Filtert Zeichen heraus, die Zeichen ohne Leerzeichen (diakritische Zeichen) sind.
Normalization Form Composition (NFC): Setzt neu zusammen die Zeichenfolge ohne diakritische Zeichen.

Als Ergebnis ist die Ausgabe eine Zeichenfolge ohne diakritische Zeichen, wie im Beispiel: „žůžo“ => „zuzo“.

Das obige ist der detaillierte Inhalt vonWie entferne ich effizient diakritische Zeichen aus UTF-8-Zeichenfolgen in Go?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

GO Language Pack Import: Was ist der Unterschied zwischen Unterstrich und ohne Unterstrich?Mar 03, 2025 pm 05:17 PM

Dieser Artikel erläutert die Paketimportmechanismen von Go: benannte Importe (z. B. importieren & quot; fmt & quot;) und leere Importe (z. B. Import _ & quot; fmt & quot;). Benannte Importe machen Paketinhalte zugänglich, während leere Importe nur T ausführen

Wie kann ich kurzfristige Informationsübertragung zwischen Seiten im BeEGO-Framework implementieren?Mar 03, 2025 pm 05:22 PM

In diesem Artikel werden die Newflash () -Funktion von BeEGO für die Übertragung zwischen PAGE in Webanwendungen erläutert. Es konzentriert sich auf die Verwendung von Newflash (), um temporäre Nachrichten (Erfolg, Fehler, Warnung) zwischen den Controllern anzuzeigen und den Sitzungsmechanismus zu nutzen. Limita

Wie konvertieren Sie die Liste der MySQL -Abfrageergebnisse in eine benutzerdefinierte Struktur -Slice in Go -Sprache?Mar 03, 2025 pm 05:18 PM

Dieser Artikel beschreibt die effiziente Konvertierung von MySQL -Abfrageergebnissen in GO -Strukturscheiben. Es wird unter Verwendung der SCAN -Methode von Datenbank/SQL zur optimalen Leistung hervorgehoben, wobei die manuelle Parsen vermieden wird. Best Practices für die Struktur -Feldzuordnung mithilfe von DB -Tags und Robus

Wie schreibe ich Scheinobjekte und Stubs zum Testen in Go?Mar 10, 2025 pm 05:38 PM

Dieser Artikel zeigt, dass Mocks und Stubs in GO für Unit -Tests erstellen. Es betont die Verwendung von Schnittstellen, liefert Beispiele für Mock -Implementierungen und diskutiert Best Practices wie die Fokussierung von Mocks und die Verwendung von Assertion -Bibliotheken. Die Articl

Wie kann ich benutzerdefinierte Typ -Einschränkungen für Generika in Go definieren?Mar 10, 2025 pm 03:20 PM

In diesem Artikel werden die benutzerdefinierten Typ -Einschränkungen von GO für Generika untersucht. Es wird beschrieben, wie Schnittstellen die minimalen Typanforderungen für generische Funktionen definieren und die Sicherheitstypsicherheit und die Wiederverwendbarkeit von Code verbessern. Der Artikel erörtert auch Einschränkungen und Best Practices

Wie schreibe ich Dateien in Go Language bequem?Mar 03, 2025 pm 05:15 PM

Dieser Artikel beschreibt effizientes Dateischreiben in Go und vergleicht OS.WriteFile (geeignet für kleine Dateien) mit OS.openfile und gepufferter Schreibvorgänge (optimal für große Dateien). Es betont eine robuste Fehlerbehandlung, die Verwendung von Aufschub und Überprüfung auf bestimmte Fehler.

Wie schreibt man Unit -Tests in Go?Mar 21, 2025 pm 06:34 PM

In dem Artikel werden Schreiben von Unit -Tests in GO erörtert, die Best Practices, Spottechniken und Tools für ein effizientes Testmanagement abdecken.

Wie kann ich Tracing -Tools verwenden, um den Ausführungsfluss meiner GO -Anwendungen zu verstehen?Mar 10, 2025 pm 05:36 PM

In diesem Artikel wird die Verwendung von Tracing -Tools zur Analyse von GO -Anwendungsausführungsfluss untersucht. Es werden manuelle und automatische Instrumentierungstechniken, den Vergleich von Tools wie Jaeger, Zipkin und Opentelemetrie erörtert und die effektive Datenvisualisierung hervorheben

See all articles