Maison >développement back-end >Golang >code tronqué intégré dans Golang

code tronqué intégré dans Golang

王林
王林original
2023-05-19 11:43:37512parcourir

Lors de l'écriture de programmes Golang, vous devrez peut-être intégrer certains caractères non-ASCII, tels que du texte chinois, des expressions Emoji, etc. Cependant, parfois, les caractères intégrés apparaîtront tronqués, affectant l'effet de fonctionnement et la lisibilité du programme. Ce qui suit présente quelques causes courantes et solutions aux caractères tronqués intégrés à Golang.

1. Encodage de chaîne Golang

Une chaîne en Golang est une séquence composée de caractères Unicode. Chaque caractère occupe 1 ou 2 octets, selon sa méthode d'encodage. Golang prend en charge les trois méthodes de codage de caractères suivantes :

  1. Codage UTF-8

UTF-8 est un codage Unicode de longueur variable. Chaque caractère occupe 1 à 4 octets et la longueur spécifique dépend de la valeur codée Unicode. . Dans Golang, les chaînes sont codées en UTF-8 par défaut. Par exemple :

s := "你好"

La chaîne s ci-dessus utilise le codage UTF-8.

  1. Encodage UTF-16

UTF-16 est un encodage Unicode de longueur fixe qui occupe 2 octets par caractère. Dans Golang, vous pouvez utiliser le type rune pour représenter les caractères codés en UTF-16. Par exemple :

var r rune = '好'

Le code ci-dessus représente l'encodage UTF-16 du caractère « good », qui est un entier de type uint16.

  1. Encodage UTF-32

UTF-32 est un encodage Unicode de longueur fixe qui occupe 4 octets par caractère. Dans Golang, vous pouvez utiliser le type int32 pour représenter les caractères codés en UTF-32. Par exemple :

var c int32 = '?'

Le code ci-dessus représente le codage UTF-32 de l'expression Emoji ?, qui est un entier de type uint32.

2. Méthodes d'intégration de caractères non-ASCII

Dans Golang, il existe quatre façons d'incorporer des caractères non-ASCII :

  1. Utilisation directe de caractères

Utilisation directe de caractères pour représenter des codes non-ASCII dans des chaînes de caractères. . Par exemple :

s := "你好?"

Le code ci-dessus contient à la fois des caractères chinois et une expression Emoji.

  1. Caractères d'échappement

Utilisez des caractères d'échappement pour représenter des caractères non-ASCII. Par exemple :

s := "你好U0001F60A"

Dans le code ci-dessus, U est suivi de l'encodage UTF-32 du caractère, qui représente une expression Emoji.

  1. Utilisez des valeurs codées Unicode

Utilisez des valeurs codées Unicode pour représenter des caractères non-ASCII. Par exemple :

s := "u4f60u597dU0001F60A"

Dans le code ci-dessus, u est suivi de l'encodage UTF-16 du caractère et U est suivi de l'encodage UTF-32.

  1. Utilisez l'encodage base64

pour encoder en base64 les caractères non-ASCII, puis intégrez la chaîne codée dans le programme. Par exemple :

s := "5L2g5aW98J+YqA=="

La chaîne ci-dessus est le résultat de l'encodage base64 de "Bonjour ?"

3. Causes et solutions aux caractères tronqués intégrés dans Golang

  1. Utilisation d'une mauvaise méthode d'encodage

Si une mauvaise méthode d'encodage est utilisée dans le programme, la chaîne contiendra des caractères tronqués. Par exemple, lors de l'utilisation de valeurs codées Unicode, si la mauvaise méthode de codage est utilisée, des caractères tronqués apparaîtront. La bonne façon de l'utiliser est d'utiliser le codage correct du caractère à échapper. Par exemple :

s := "u4f60u597dud83dude0a"

Dans le code ci-dessus, u est suivi de l'encodage UTF-16 et ud83dude0a est la représentation correcte de l'encodage UTF-16 pour les expressions Emoji.

  1. L'éditeur provoque des caractères tronqués lors de l'enregistrement des fichiers

Certains éditeurs modifieront l'encodage du fichier lors de l'enregistrement du fichier, comme la conversion de l'encodage UTF-8 en ANSI. Cela entraînera des chaînes tronquées dans le programme. Par conséquent, vous devez enregistrer le fichier à l'aide d'un éditeur prenant en charge le codage UTF-8 et vous assurer que le codage du fichier est cohérent avec celui utilisé dans le programme.

  1. Paramètre incorrect des variables d'environnement système

Dans certains cas, les variables d'environnement du système peuvent affecter l'encodage de la chaîne dans le programme. Vous devez vérifier si la variable d'environnement système est correctement définie sur la méthode de codage.

En bref, lors de l'intégration de caractères non-ASCII, vous devez choisir correctement la méthode d'encodage et vous assurer que la méthode d'encodage du fichier est cohérente avec la méthode d'encodage du programme. Utilisez des méthodes d'échappement correctes pour éviter les caractères tronqués.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Quel logiciel est Golang ?Article suivant:Quel logiciel est Golang ?