Go で無効な UTF-8 バイトシーケンスを検出するにはどうすればよいですか?-Golang-php.cn

ホームページ

バックエンド開発

Golang

Go で無効な UTF-8 バイトシーケンスを検出するにはどうすればよいですか?

DDD

Dec 14, 2024 pm 10:17 PM

How Can I Detect Invalid UTF-8 Byte Sequences in Go?

Go での無効なバイトシーケンスの検出

Go では、バイトスライス ([]byte) を文字列に変換するときに、次のことが可能です。 Unicode に変換できない無効なバイトシーケンスが発生しました。これは、すべてのバイトシーケンスが有効な UTF-8 文字を表すわけではないという事実から生じます。

そのような発生を検出するには、次の 2 つのアプローチが利用可能です。

UTF-8 有効性チェック:

Tim Cooper が述べているように、utf8.Valid 関数を利用してバイトスライスかどうかをテストできます。有効な UTF-8 バイトが含まれています。結果が false の場合、無効なバイトシーケンスが存在することを示します。

文字列変換に関する考慮事項:

一般的な想定に反して、Go では非 UTF の変換が許可されています。 -8 バイトの文字列へのスライス。ただし、Go の文字列は本質的に読み取り専用のバイトスライスであるため、有効な UTF-8 ではないバイトにも対応できることに注意することが重要です。

Go が自動的に UTF-8 を実行するのは、特定の状況でのみです。 8 デコード:

for i, r := range s 構文を使用して文字列を反復処理する場合、r 変数は Unicode を表します。コードポイント (ルーン) であり、常に有効です。
文字列からルーンのスライス (つまり、[]rune(s)) に変換するとき、Go は文字列全体をルーンにデコードします。

どちらの場合も、無効な UTF-8 文字は U FFFD 置換文字に置き換えられます。この置換はすべてのアプリケーションで受け入れられるわけではないため、必要に応じて明示的な UTF-8 検証を実行することをお勧めします。

例:

次の Go プログラムを考えてみましょう。

package main

import (
    "fmt"
    "unicode/utf8"
)

func main() {
    a := []byte{0xff}
    s := string(a)

    // Check UTF-8 validity
    if utf8.Valid(a) {
        fmt.Println("Valid UTF-8")
    } else {
        fmt.Println("Invalid UTF-8")
    }

    // Output string
    fmt.Println(s)
}

出力:

Invalid UTF-8
�

この例では、バイトスライス a に無効なバイトシーケンスが含まれているため、「無効な UTF-8」メッセージが表示されます。以降、文字列に変換する際、無効なバイトは置換文字「�」で表されます。

以上がGo で無効な UTF-8 バイトシーケンスを検出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Go String Manipulationを学ぶ：「文字列」パッケージを使用しますMay 09, 2025 am 12:07 AM

Goの「文字列」パッケージは、文字列操作を効率的かつシンプルにするための豊富な機能を提供します。 1）文字列を使用して（）サブストリングを確認します。 2）Strings.split（）を使用してデータを解析できますが、パフォーマンスの問題を回避するには注意して使用する必要があります。 3）文字列join（）は文字列のフォーマットに適していますが、小さなデータセットの場合、ループ=はより効率的です。 4）大きな文字列の場合、文字列を使用して文字列を構築する方が効率的です。

GO：標準の「文字列」パッケージを使用した文字列操作May 09, 2025 am 12:07 AM

GOは、文字列操作に「文字列」パッケージを使用します。 1）文字列を使用して、関数を調整して文字列をスプライスします。 2）文字列を使用して、コンテイン関数を使用してサブストリングを見つけます。 3）文字列を使用して、文字列を交換します。これらの機能は効率的で使いやすく、さまざまな文字列処理タスクに適しています。

Goの「バイト」パッケージを使用したバイトスライス操作の習得：実用的なガイドMay 09, 2025 am 12:02 AM

byteSpackageIngoisESSENTINEFOREFFICTIENTBYTESLICEMANIPULATION、functionslikeContains、andReplaceforseding andmodyifiedbinarydata.itenhancesperformance andCodereadability、make dakeatavitaltoolfor forhandlingbingbinarydata、networkprotocols、andfilei

Go Binary Encoding/Decoding：「エンコード/バイナリ」パッケージを使用してくださいMay 08, 2025 am 12:13 AM

GOは、バイナリエンコードとデコードに「エンコード/バイナリ」パッケージを使用します。 1）このパッケージは、binary.writeとbinary.read関数を作成して、データを書き込み、読み取ります。 2）正しいエンディアン（BigendianやLittleendianなど）の選択に注意してください。 3）データのアラインメントとエラー処理も重要です。データの正確性とパフォーマンスを確保します。

GO：標準の「バイト」パッケージを使用したバイトスライス操作May 08, 2025 am 12:09 AM

「バイト」パッケージを包装してください

エンコード/バイナリパッケージに移動：バイナリ操作のパフォーマンスの最適化May 08, 2025 am 12:06 AM

Encoding/binaryPackageIngoiseffictevectiveforptimizingdueToitssuportforendiannessandannessandAhandling.toenhanceperformance：1）usebinary.native.nativedianfornatiannesstoavoidbyteswapping.2）batchedandandandwriteTerationtoredutei/ober

BYTESパッケージに移動：短いリファレンスとヒントMay 08, 2025 am 12:05 AM

GOのBYTESパッケージは、主にバイトスライスを効率的に処理するために使用されます。 1）bytes.bufferを使用すると、弦のスプライシングを効率的に実行して、不必要なメモリの割り当てを避けます。 2）バイト機能を使用して、バイトスライスをすばやく比較します。 3）bytes.index、bytes.split、bytes.replaceall関数は、バイトスライスの検索と操作に使用できますが、パフォーマンスの問題に注意する必要があります。

BYTESパッケージに移動：バイトスライス操作の実用的な例May 08, 2025 am 12:01 AM

バイトパッケージは、バイトスライスを効率的に処理するためのさまざまな機能を提供します。 1）bytes.containsを使用して、バイトシーケンスを確認します。 2）bytes.splitを使用してバイトスライスを分割します。 3）バイトシーケンスバイトを交換します。 4）bytes.joinを使用して、複数のバイトスライスを接続します。 5）bytes.bufferを使用してデータを作成します。 6）エラー処理とデータ検証のためのBYTES.MAPの組み合わせ。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

Dreamweaver Mac版

ビジュアル Web 開発ツール

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

SublimeText3 中国語版

中国語版、とても使いやすい

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、