首页 >后端开发 >Golang >如何从 Go 中的字符串中删除变音符号?

如何从 Go 中的字符串中删除变音符号?

Linda Hamilton
Linda Hamilton原创
2024-12-08 11:53:14238浏览

How Can I Remove Diacritics from Strings in Go?

在 Go 中删除变音符号

从 UTF-8 编码的字符串中删除变音符号(重音符号)是一项常见的文本处理任务。 Go 为此目的提供了多个库,作为其文本规范化实用程序的一部分。

一种方法涉及组合多个库,如下所示:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

// isMn determines if a rune represents a nonspacing mark (diacritic).
func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r)
}

func main() {
    // Create a transformation chain to:
    // - Decompose the string into its unicode normalization form (NFD).
    // - Remove all nonspacing marks (diacritics).
    // - Recompose the string into its normalized form (NFC).
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)

    // Apply the transformation to the input string "žůžo".
    result, _, _ := transform.String(t, "žůžo")

    // Print the resulting string, which is "zuzo" without diacritics.
    fmt.Println(result)
}

以上是如何从 Go 中的字符串中删除变音符号?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn