Maison >développement back-end >Golang >Comment puis-je supprimer les signes diacritiques des chaînes dans Go ?

Comment puis-je supprimer les signes diacritiques des chaînes dans Go ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-08 11:53:14240parcourir

How Can I Remove Diacritics from Strings in Go?

Suppression des signes diacritiques dans Go

L'élimination des signes diacritiques (marques d'accent) des chaînes codées en UTF-8 est une tâche courante de traitement de texte. Go fournit plusieurs bibliothèques à cet effet, dans le cadre de ses utilitaires de normalisation de texte.

Une approche consiste à combiner plusieurs bibliothèques, comme illustré ci-dessous :

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

// isMn determines if a rune represents a nonspacing mark (diacritic).
func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r)
}

func main() {
    // Create a transformation chain to:
    // - Decompose the string into its unicode normalization form (NFD).
    // - Remove all nonspacing marks (diacritics).
    // - Recompose the string into its normalized form (NFC).
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)

    // Apply the transformation to the input string "žůžo".
    result, _, _ := transform.String(t, "žůžo")

    // Print the resulting string, which is "zuzo" without diacritics.
    fmt.Println(result)
}

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn