首頁 >後端開發 >Golang >如何在 Go 中高效刪除 UTF-8 字串中的變音符號?

如何在 Go 中高效刪除 UTF-8 字串中的變音符號?

Susan Sarandon
Susan Sarandon原創
2024-12-08 14:03:11622瀏覽

How to Efficiently Remove Diacritics from UTF-8 Strings in Go?

在Go 中刪除變音符號

使用UTF8 編碼的字串時,可能需要刪除變音符號,例如“žůžo”中的重音符號” 得到“zuzo”。為了有效地處理此類場景,Go中提供了標準函式庫和技術。 >以下程式碼片段示範如何利用unicode/norm 和golang.org/x/text/transform從給定字串中刪除變音符號套件:

此程式碼透過應用一系列轉換來刪除變音符號:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks
}

func main() {
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)
    result, _, _ := transform.String(t, "žůžo")
    fmt.Println(result)
}

標準化形式分解( NFD)

:將字串分解為其基本Unicode字符,包括變音符號。 (NFC)
    :重新組合沒有的字串
  1. 因此,輸出將是一個去除了變音符號的字串,如範例所示: "žůžo" =>; “zuzo 」。

以上是如何在 Go 中高效刪除 UTF-8 字串中的變音符號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn