首頁 >後端開發 >Golang >如何在 Go 中刪除 UTF-8 字串中的變音符號?

如何在 Go 中刪除 UTF-8 字串中的變音符號?

Barbara Streisand
Barbara Streisand原創
2024-12-09 01:53:111063瀏覽

How to Remove Diacritics from UTF-8 Strings in Go?

使用文字規範化庫刪除Go 中的變音符號

如何輕鬆地從Go 中的UTF8 編碼字串中刪除變音符號?例如,將字串“žůžo”轉換為“zuzo”。

解決方案:

幸運的是,Go 提供了一系列處理文字規範化的標準庫,包括 Unicode標準化和變音符號刪除。以下是有效利用它們的方法:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks
}

func main() {
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)
    result, _, _ := transform.String(t, "žůžo")
    fmt.Println(result)
}

此程式碼使用 NFD(標準化形式 D)、Mn 移除和 NFC(標準化形式 C)演算法進行一系列轉換。結果有效地刪除了輸入字串中的所有變音符號。

以上是如何在 Go 中刪除 UTF-8 字串中的變音符號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn