Rumah >pembangunan bahagian belakang >Golang >Bagaimanakah Saya Boleh Mengalih Keluar Diakritik daripada Rentetan dalam Go?

Bagaimanakah Saya Boleh Mengalih Keluar Diakritik daripada Rentetan dalam Go?

Linda Hamilton
Linda Hamiltonasal
2024-12-08 11:53:14285semak imbas

How Can I Remove Diacritics from Strings in Go?

Mengalih keluar Diakritik dalam Go

Menghapuskan diakritik (tanda aksen) daripada rentetan yang dikodkan UTF-8 ialah tugas pemprosesan teks biasa. Go menyediakan beberapa perpustakaan untuk tujuan ini, sebagai sebahagian daripada utiliti penormalan Teksnya.

Satu pendekatan melibatkan menggabungkan berbilang perpustakaan, seperti yang ditunjukkan di bawah:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

// isMn determines if a rune represents a nonspacing mark (diacritic).
func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r)
}

func main() {
    // Create a transformation chain to:
    // - Decompose the string into its unicode normalization form (NFD).
    // - Remove all nonspacing marks (diacritics).
    // - Recompose the string into its normalized form (NFC).
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)

    // Apply the transformation to the input string "žůžo".
    result, _, _ := transform.String(t, "žůžo")

    // Print the resulting string, which is "zuzo" without diacritics.
    fmt.Println(result)
}

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengalih Keluar Diakritik daripada Rentetan dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn