Maison >Problème commun >Quelles sont les différences entre Unicode et Ascii

Quelles sont les différences entre Unicode et Ascii

百草
百草original
2023-09-06 11:56:065863parcourir

Les différences entre Unicode et Ascii incluent différentes plages d'encodage, différents espaces de stockage et différentes compatibilités. Introduction détaillée : 1. La plage de codage de l'ASCII est 0-127, qui est principalement utilisée pour représenter les lettres anglaises. La plage de codage de l'Unicode est beaucoup plus large et peut représenter presque tous les caractères de langue ; l'espace est différent. ASCII utilise généralement 1 octet pour stocker un caractère, tandis qu'Unicode peut utiliser 2 octets ou plus pour stocker un caractère 3. Compatibilité différente, etc.

Quelles sont les différences entre Unicode et Ascii

Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.

1. Qu'est-ce qu'Unicode ?

Unicode est une norme de codage de caractères dont le but est de définir un petit nombre de codes pour chaque caractère du monde. Il peut accueillir des caractères de presque toutes les langues, y compris les lettres anglaises, les caractères chinois, les caractères japonais, les caractères coréens, les chiffres arabes, etc.

2. Qu'est-ce que l'ASCII

ASCII (American Standard Code for Information Interchange, American Standard Code for Information Interchange) est un codage de caractères basé sur des caractères anglais. Il utilise 7 bits pour représenter un caractère et peut représenter un total de 128 caractères différents, notamment des lettres anglaises majuscules et minuscules, des chiffres arabes, des signes de ponctuation et certains caractères de contrôle.

3. La différence entre Unicode et ASCII

La différence entre Unicode et ascii se reflète principalement dans : 1. Différentes plages d'encodage 2. Différents espaces de stockage ; En général, Unicode contient plus de caractères que ASCII et peut représenter plus de langues.

1. Différentes plages de codage

La plage de codage de l'ASCII est de 0 à 127, qui est principalement utilisée pour représenter les lettres anglaises, tandis que la plage de codage de l'Unicode est beaucoup plus large et peut représenter presque tous les caractères de la langue.

2. Différents espaces de stockage

Le codage ASCII utilise généralement 1 octet pour stocker un caractère, tandis que le codage Unicode peut utiliser 2 octets ou plus pour stocker un caractère.

3. Compatibilité différente

Le codage ASCII fait partie du codage Unicode, c'est-à-dire que tous les caractères ASCII ont des codages correspondants dans le codage Unicode. Cela signifie également que le texte codé en ASCII peut être converti directement en codage Unicode sans perdre aucune information.

4.UTF8

  • Ainsi, dans un esprit de conservation, l'encodage UTF-8 qui convertit l'encodage Unicode en « encodage à longueur variable » est apparu.
  • Le codage UTF-8 code un caractère Unicode en 1 à 6 octets selon différentes tailles de nombres. Les lettres anglaises couramment utilisées sont codées en 1 octet, les caractères chinois font généralement 3 octets et seuls les caractères très rares seront codés en 4-. 6 octets. Si le texte que vous souhaitez transmettre contient de nombreux caractères anglais, l'utilisation du codage UTF-8 peut économiser de l'espace.
Caractère ASCII Unicode UTF-8
A 01000001 00000000 01 01000001
中文 x 01001110 00101101 01001110 00101101
  • Vous pouvez également constater dans le tableau ci-dessus que le codage UTF-8 présente un avantage supplémentaire, c'est-à-dire que le codage ASCII peut en fait être considéré comme faisant partie du codage UTF-8. Par conséquent, un grand nombre de supports uniquement. Le codage ASCII peut continuer à fonctionner sous le codage UTF-8.

5. Comment fonctionne le codage de caractères courant dans les ordinateurs

  • Dans la mémoire de l'ordinateur, le codage Unicode est utilisé de manière uniforme Lorsqu'il doit être enregistré sur le disque dur ou doit être transmis, il est converti en UTF-8. codage.
  • Lors de l'édition avec le Bloc-notes, les caractères UTF-8 lus dans le fichier sont convertis en caractères Unicode et stockés dans la mémoire. Une fois l'édition terminée, Unicode est converti en UTF-8 et enregistré dans le fichier lors de l'enregistrement :

  • Quelles sont les différences entre Unicode et Ascii

  • Lors de la navigation sur le web, le serveur convertira le contenu Unicode généré dynamiquement en UTF-8 puis le transmettra au navigateur :

  • Quelles sont les différences entre Unicode et Ascii

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn