ホームページ >バックエンド開発 >Golang >Go の文字列から発音記号を削除するにはどうすればよいですか?

Go の文字列から発音記号を削除するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-14 01:09:09193ブラウズ

How to Remove Diacritics from Strings in Go?

Go を使用して発音記号を削除する

文字列 "žůžo" を "zuzo" に変換するには、すべての発音記号を削除する必要があります。これは、「Go でのテキスト正規化」で説明されている標準 Go ライブラリを使用して実現できます。

コード実装

次のコード例は、これらのライブラリの使用方法を示しています。

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r) // Mn: nonspacing marks
}

func main() {
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)
    result, _, _ := transform.String(t, "žůžo")
    fmt.Println(result) // prints: zuzo
}

By 「transform」ライブラリと「unicode/norm」ライブラリの機能を利用すると、Go の UTF8 でエンコードされた文字列から発音記号を効果的に削除できます。プログラム。

以上がGo の文字列から発音記号を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。