Maison > Article > développement back-end > Comment résoudre les caractères tronqués du texte Golang
Lors de l'écriture de programmes utilisant Golang, nous rencontrons parfois le problème de caractères tronqués lors de la sortie des caractères chinois. En effet, Golang utilise le codage UTF-8 par défaut, mais le codage par défaut de certains systèmes d'exploitation ou outils de terminal n'est pas UTF-8, ce qui empêche les caractères chinois de s'afficher normalement.
Il existe de nombreuses raisons à cette situation. Ci-dessous, nous en expliquerons plusieurs en détail et proposerons les solutions correspondantes.
1. Problèmes d'encodage avec les outils de terminal
Dans l'invite de commande CMD du système d'exploitation Windows, l'encodage par défaut est GBK, qui ne peut pas afficher normalement les caractères chinois codés en UTF-8. À ce stade, nous pouvons le résoudre des deux manières suivantes.
Modifiez la méthode d'encodage de CMD en UTF-8 Vous pouvez utiliser la commande chcp 65001 pour y parvenir (nécessite la prise en charge de Windows Vista et supérieur). Après avoir entré cette commande dans CMD, vous pouvez basculer la méthode de codage sur UTF-8.
Dans le programme golang, vous pouvez utiliser certaines fonctions de bibliothèque pour convertir les chaînes chinoises de l'encodage UTF-8 vers d'autres méthodes d'encodage. Par exemple, vous pouvez utiliser GB18030 dans le package "golang.org/x/text/encoding/simplifiedchinese" pour convertir la chaîne en codage GBK.
2. Problème d'encodage de fichier
Lorsque nous utilisons Golang pour lire des fichiers ou produire des fichiers, si la méthode d'encodage du fichier est incompatible avec la méthode d'encodage utilisée par le programme, cela entraînera également des caractères chinois tronqués.
Lors de la lecture d'un fichier en Golang, nous devons spécifier la méthode d'encodage du fichier. Ceci peut être réalisé en utilisant certaines fonctions du package "golang.org/x/text/encoding". Par exemple, utilisez la fonction "bufio.NewReader(os.Stdin).ReadString('n')" pour lire une ligne de chaîne codée en UTF-8. Si le fichier est codé différemment de UTF-8, vous pouvez spécifier un codage différent en modifiant la fonction ReadString en conséquence.
Lors de l'écriture de données dans un fichier, vous devez également spécifier la méthode d'encodage du fichier. Ceci peut être réalisé en utilisant certaines fonctions du package "golang.org/x/text/encoding". Par exemple, utilisez la fonction « bufio.NewWriter(buf).WriteString(str) » pour écrire une chaîne codée en UTF-8 dans un Buffer. Si vous devez écrire des données dans des fichiers avec d'autres méthodes de codage, vous pouvez spécifier d'autres méthodes de codage en modifiant la fonction WriteString en conséquence.
3. Problèmes d'encodage Web
Lors de l'écriture d'applications Web, si nous utilisons des caractères chinois en entrée ou en sortie, nous pouvons également rencontrer des problèmes de code tronqué.
Dans les applications Web Golang, vous pouvez résoudre le problème des caractères chinois tronqués en spécifiant le jeu de caractères dans l'en-tête http. Le caractère défini dans l'en-tête http peut être défini à l'aide des fonctions du package "net/http". Par exemple, vous pouvez utiliser la fonction "w.Header().Set("Content-Type", "text/html;charset=utf-8")" pour définir le jeu de caractères dans l'en-tête http sur UTF-8.
Dans les applications Web, nous pouvons avoir besoin de convertir les chaînes obtenues à partir de bases de données ou d'autres sources en chaînes codées en UTF-8, puis de les afficher dans le navigateur. Vous pouvez utiliser GB18030 dans le package "golang.org/x/text/encoding/simplifiedchinese" pour convertir les chaînes du codage GBK en codage UTF-8. Par exemple, vous pouvez utiliser la fonction "gbkBytes, _ := simplifiéchinese.GB18030.NewDecoder().Bytes(strBytes)" pour convertir une chaîne codée GBK en une chaîne codée UTF-8.
Résumé
Lors de l'écriture de programmes en golang, il est très courant de rencontrer le problème des caractères chinois tronqués. Nous pouvons adopter différentes solutions selon différentes situations. Pour éviter le problème des caractères chinois tronqués, le meilleur moyen est d'encoder toutes les données en UTF-8. Cela évite non seulement les problèmes de codage, mais rend également nos programmes plus portables et partageables.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!