Maison  >  Article  >  Java  >  Quelle est la différence entre Unicode et UTF-8

Quelle est la différence entre Unicode et UTF-8

青灯夜游
青灯夜游original
2018-11-22 10:53:478394parcourir

Le contenu de cet article est de présenter ce que sont Unicode et UTF-8, afin que tout le monde puisse comprendre la différence (différence) entre Unicode et UTF-8. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer. J'espère qu'il vous sera utile.

Qu'est-ce qu'Unicode ?

Unicode est un système de codage de caractères qui utilise deux octets pour représenter chaque caractère. Unicode définit un nombre unique compris entre 0 et 65 535 (216 – 1) pour chaque caractère et symbole, indépendamment de la plate-forme, du programme ou de la langue.

Qu'est-ce que l'UTF-8 ?

UTF-8 est un mécanisme standard pour convertir des valeurs de caractères larges en Unicode sous forme de flux d'octets, un format de codage peut être codé en caractères Unicode de 1 à 6 octets.

La différence entre Unicode et UTF-8

Unicode est un jeu de caractères, tandis que UTF-8 est une règle d'encodage.

Un jeu de caractères est une liste de caractères numérotés de manière unique (ces nombres sont parfois appelés « points de code »). Pour faire simple, chaque « personnage » se voit attribuer un identifiant unique. Par exemple, dans le jeu de caractères Unicode, le chiffre A est 41.

Règles d'encodage : C'est la règle pour convertir les "bits de code" en séquences d'octets (l'encodage/décodage peut être compris comme le processus de cryptage/déchiffrement. C'est un algorithme pour convertir une liste de nombres en binaire). , afin qu'il puisse le stocker sur le disque.

Par exemple, UTF-8 traduirait une séquence de nombres comme celle-ci : 1, 2, 3, 4 :

00000001 00000010 00000011 00000100

Nos données sont maintenant traduites en binaire Le fichier peut maintenant être enregistré sur le disque.

Diagramme de relation Unicode et UTF-8 :

Quelle est la différence entre Unicode et UTF-8

Conclusion :

UTF -8 est le codage utilisé pour convertir les données binaires en nombres ; Unicode est le jeu de caractères utilisé pour convertir les nombres en caractères.

Ce qui précède représente l’intégralité du contenu de cet article, j’espère qu’il sera utile à l’étude de chacun. Pour plus de didacticiels vidéo connexes, veuillez visiter : tutoriel Java !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn