Maison >interface Web >Questions et réponses frontales >Que faire si les caractères chinois du nœud utf8 sont tronqués

Que faire si les caractères chinois du nœud utf8 sont tronqués

藏色散人
藏色散人original
2023-02-08 10:29:122154parcourir

Solution de caractère tronqué du nœud utf8 : 1. Vérifiez le type de "SarchName" via "typeof" ; 2. Utilisez la méthode "Name=iconv.decode(name,'gbk')" pour convertir l'encodage en utf8.

Que faire si les caractères chinois du nœud utf8 sont tronqués

L'environnement d'exploitation de ce tutoriel : système Windows 10, version node v14.16.0, ordinateur DELL G3

Que faire si les caractères chinois node utf8 sont tronqués ?

  • node.js implémente la conversion d'encodage de GBK vers UTF8, solution chinoise brouillée

Avant de faire cela, j'ai rencontré un besoin, qui est d'utiliser node pour faire une requête floue de noms. En fait, c’est une question simple qui ne peut pas être plus simple, mais je suis resté bloqué sur cette question pendant deux jours.

En raison des besoins de l'entreprise, nous avons effectué une requête floue pour la nouvelle fonction.

Tout d'abord, j'ai dû mettre en place un service http de nœud, puis j'ai configuré MySQL. Après avoir établi le modèle ORM, j'ai rencontré une chose étrange alors que j'étais sur le point de commencer à écrire des instructions SQL, car mon nœud était codé en utf8. Cependant, la base de données de notre entreprise utilise le codage GBK, ce qui a provoqué une erreur lorsque j'ai effectué une requête de données et que la requête a échoué. La raison était due à des problèmes de codage.

Ce problème est également très simple, il suffit de transcoder ! ! !

Quand j'ai commencé à utiliser la méthode de transcodage du nœud Baidu, je suis tombé sur le plug-in iconv-jschardet, alors je suis allé sur npm pour le vérifier. J'ai commencé à utiliser

const iconv = require('iconv-jschardet');
SarchName =  iconv.encode(SarchName, 'gbk');

pour convertir les caractères envoyés depuis le front-end en encodage GBK, et j'étais très content.

Le résultat est toujours une erreur. A cause de cette erreur, j'ai passé un après-midi à la chercher. Je ne sais pas si la conversion a réussi, j'ai donc essayé d'innombrables méthodes mais je n'ai toujours pas pu résoudre ce problème d'encodage, j'ai donc pensé à utiliser SQL pour le convertir en binaire pour une correspondance floue lors des requêtes lors de l'écriture de PHP.

Donc, j'ai tapé le SarchName et il s'est avéré que c'était Obj. J'étais très confus et j'ai pensé que ce devrait être String, alors je l'ai imprimé et j'ai vu que c'était un Buffer. Maintenant, j'ai compris qu'il valait mieux ne pas le convertir directement en String. J'ai utilisé la méthode Buffer.toString() mais cela ne fonctionnait toujours pas, puis j'ai parcouru la documentation. J'ai découvert qu'il n'y avait pas d'encodage GBK, ce qui était un gros casse-tête.

Que faire si les caractères chinois du nœud utf8 sont tronqués

Ensuite, j'ai essayé l'ascii et j'ai découvert que cela ne fonctionnait toujours pas, alors j'ai essayé le binaire et c'était ok.

Que faire si les caractères chinois du nœud utf8 sont tronqués

** L'exécution de la requête floue s'est terminée sans aucun problème. Lorsque les données renvoyées ont été trouvées, elles étaient toujours codées en GBK. C'est facile ! ! ! ! Ensuite, convertissez-le en utf8

Name=iconv.decode(name,'gbk')

puis revenez et constatez qu'il n'y a pas de problème, alors ok c'est fait.

Au bout d'un moment, quelqu'un d'autre a détecté un bug et a dit que le nom de la personne n'était pas entièrement affiché ! ! ! !

En conséquence, ce symbole est apparu dans les noms de certaines personnes. . . . .

Baidu a constaté que le décodage était incomplet et qu'il n'y a actuellement aucune solution. . .

Au final, je n'ai eu d'autre choix que d'utiliser la méthode indexOf('�') pour récupérer les caractères rares de la chaîne

Enregistrez ensuite son statut et utilisez PHP pour la transcoder.

En un mot, pit ! **

Supplément : la conversion gbk de Node.js en utf8 ne parviendra toujours pas à convertir certains caractères rares et provoquera des caractères tronqués. Il est recommandé aux bibliothèques avec gbk de ne pas laisser le nœud effectuer des choses comme le transcodage chinois et passer à une autre langue.

Apprentissage recommandé : "Tutoriel vidéo Node.js"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn