ホームページ >バックエンド開発 >Golang >Go で無効な UTF-8 文字を削除するにはどうすればよいですか?

Go で無効な UTF-8 文字を削除するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-12-14 16:10:17195ブラウズ

How Can I Remove Invalid UTF-8 Characters in Go?

Go で無効な UTF-8 文字を削除する

JSON データを操作する場合、無効な UTF-8 文字が発生し、マーシャリング中にエラーが発生する可能性があります。この問題は、UTF-8 エンコーディングに準拠していないバイトが存在するために発生します。

無効な UTF-8 文字の処理

Go では、 または を削除することでこの問題に対処できます。さまざまなアプローチを使用して無効な文字を置き換えます:

Go 1.13

strings.ToValidUTF8("a\xc5z", "")

Go 1.11

fixUtf := func(r rune) rune {
    if r == utf8.RuneError {
        return -1
    }
    return r
}

fmt.Println(strings.Map(fixUtf, "a\xc5z"))
fmt.Println(strings.Map(fixUtf, "posic�o"))

この関数は、無効な UTF-8 文字を負の値にマッピングすることで削除し、期待される出力が得られます。

az
posico

以上がGo で無効な UTF-8 文字を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。