recherche
Maisondéveloppement back-endGolangComment puis-je détecter les séquences d'octets UTF-8 invalides dans Go ?

How Can I Detect Invalid UTF-8 Byte Sequences in Go?

Détection des séquences d'octets invalides dans Go

Dans Go, lors de la conversion d'une tranche d'octets ([]byte) en chaîne, il est possible de rencontrez des séquences d'octets invalides qui ne peuvent pas être traduites en Unicode. Cela vient du fait que toutes les séquences d'octets ne représentent pas des caractères UTF-8 valides.

Pour détecter de telles occurrences, deux approches sont disponibles :

Contrôle de validité UTF-8 :

Comme le mentionne Tim Cooper, la fonction utf8.Valid peut être utilisée pour tester si une tranche d'octets contient un UTF-8 valide. octets. Si le résultat est faux, cela indique la présence de séquences d'octets invalides.

Considérations sur la conversion de chaînes :

Contrairement aux hypothèses courantes, Go permet la conversion de fichiers non UTF. - Tranches de 8 octets en chaînes. Cependant, il est important de noter qu'une chaîne dans Go est essentiellement une tranche d'octets en lecture seule et peut donc accueillir des octets qui ne sont pas valides en UTF-8.

Ce n'est que dans des situations spécifiques que Go exécute automatiquement l'UTF-8. 8 décodage :

  • Lors d'une itération sur une chaîne en utilisant la syntaxe for i, r := range s, la variable r représente un point de code Unicode (rune) et est toujours valide.
  • Lors de la conversion d'une chaîne en une tranche de runes (c'est-à-dire, []rune(s)), Go décode la chaîne entière en runes.

Dans les deux cas , les caractères UTF-8 non valides sont remplacés par le caractère de remplacement U FFFD. Ce remplacement peut ne pas être acceptable dans toutes les applications, il est donc recommandé d'effectuer une validation UTF-8 explicite si nécessaire.

Exemple :

Considérez le programme Go suivant :

package main

import (
    "fmt"
    "unicode/utf8"
)

func main() {
    a := []byte{0xff}
    s := string(a)

    // Check UTF-8 validity
    if utf8.Valid(a) {
        fmt.Println("Valid UTF-8")
    } else {
        fmt.Println("Invalid UTF-8")
    }

    // Output string
    fmt.Println(s)
}

Sortie :

Invalid UTF-8
�

Dans cet exemple, la tranche d'octets a contient un invalide séquence d'octets, ce qui entraîne un message "UTF-8 invalide". Par la suite, lors de sa conversion en chaîne, l'octet invalide est représenté par le caractère de remplacement "�".

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Apprenez Go String Manipulation: Travailler avec le package 'Strings'Apprenez Go String Manipulation: Travailler avec le package 'Strings'May 09, 2025 am 12:07 AM

Le package "Strings" de Go fournit des fonctionnalités riches pour rendre le fonctionnement des cordes efficace et simple. 1) Utilisez des chaînes.Contains () pour vérifier les sous-chaînes. 2) Strings.split () peut être utilisé pour analyser les données, mais il doit être utilisé avec prudence pour éviter les problèmes de performances. 3) Strings.join () convient aux chaînes de mise en forme, mais pour les petits ensembles de données, la boucle = est plus efficace. 4) Pour les grandes chaînes, il est plus efficace de construire des chaînes à l'aide de chaînes.

GO: Manipulation des cordes avec le package 'Strings' standardGO: Manipulation des cordes avec le package 'Strings' standardMay 09, 2025 am 12:07 AM

Go utilise le package "Strings" pour les opérations de chaîne. 1) Utilisez des chaînes. 2) Utilisez la fonction Strings.Contient pour trouver des sous-chaînes. 3) Utilisez les chaînes. Replace la fonction pour remplacer les chaînes. Ces fonctions sont efficaces et faciles à utiliser et conviennent à diverses tâches de traitement des chaînes.

La manipulation de la tranche de maîtrise des octets avec le package 'octets' de Go: un guide pratiqueLa manipulation de la tranche de maîtrise des octets avec le package 'octets' de Go: un guide pratiqueMay 09, 2025 am 12:02 AM

TheyTespackageingOssentialforeffictiveBytesLemanIpulation, offrant des fonctions de dynamisme, index, AndrePlaceForsearchingandModifierBinaryData.EtenhancesperformanceAndCodereadabilité, faisant en œuvre

Apprenez Go Binary Encoding / Decoding: Travailler avec le package 'Encoding / Binary'Apprenez Go Binary Encoding / Decoding: Travailler avec le package 'Encoding / Binary'May 08, 2025 am 12:13 AM

Go utilise le package "Encoding / Binary" pour le codage et le décodage binaires. 1) Ce package fournit des fonctions Binary.Write et Binary.read pour les données d'écriture et de lecture. 2) Faites attention au choix du bon endian (comme Bigendian ou Littleendian). 3) L'alignement des données et la gestion des erreurs sont également essentiels pour garantir l'exactitude et les performances des données.

GO: Manipulation de tranche d'octets avec le package 'octets' standardGO: Manipulation de tranche d'octets avec le package 'octets' standardMay 08, 2025 am 12:09 AM

Les "octets" packageofferser efficace pour la manière

GO Encoding / Binary Package: Optimiser les performances pour les opérations binairesGO Encoding / Binary Package: Optimiser les performances pour les opérations binairesMay 08, 2025 am 12:06 AM

Theencoding/binarypackageinGoiseffectiveforoptimizingbinaryoperationsduetoitssupportforendiannessandefficientdatahandling.Toenhanceperformance:1)Usebinary.NativeEndianfornativeendiannesstoavoidbyteswapping.2)BatchReadandWriteoperationstoreduceI/Oover

Package GO BYTES: Référence courte et conseilsPackage GO BYTES: Référence courte et conseilsMay 08, 2025 am 12:05 AM

Le package des octets GO est principalement utilisé pour traiter efficacement les tranches d'octets. 1) Utilisation de Bytes.Buffer peut effectuer efficacement l'épissage de chaîne pour éviter une allocation de mémoire inutile. 2) Les octets. La fonction égale est utilisée pour comparer rapidement les tranches d'octets. 3) Les fonctions Bytes.Index, Bytes.Split et Bytes.ReplaceALL peuvent être utilisées pour rechercher et manipuler des tranches d'octets, mais les problèmes de performances doivent être prêts à l'attention.

Package de go octets: Exemples pratiques pour la manipulation de la tranche d'octetsPackage de go octets: Exemples pratiques pour la manipulation de la tranche d'octetsMay 08, 2025 am 12:01 AM

Le package d'octets offre une variété de fonctions pour traiter efficacement les tranches d'octets. 1) Utilisez les octets.Contient pour vérifier la séquence d'octets. 2) Utilisez des octets.split pour diviser les tranches d'octets. 3) Remplacez les octets de séquence d'octets. Replace. 4) Utilisez des bytes.join pour connecter plusieurs tranches d'octets. 5) Utilisez des bytes.buffer pour créer des données. 6) Bytes combinés. MAP pour le traitement des erreurs et la vérification des données.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

SublimeText3 version anglaise

SublimeText3 version anglaise

Recommandé : version Win, prend en charge les invites de code !

SublimeText3 Linux nouvelle version

SublimeText3 Linux nouvelle version

Dernière version de SublimeText3 Linux

Adaptateur de serveur SAP NetWeaver pour Eclipse

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Navigateur d'examen sécurisé

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.