Dans la technologie informatique et des télécommunications, un caractère est une unité d'informations de base d'un glyphe, d'une unité ou d'un symbole de type glyphe.
Les caractères font référence aux lettres, chiffres, mots et symboles utilisés dans les ordinateurs, notamment : 1, 2, 3, A, B, C, ~ ! ·#¥%……——*()——+etc.
En codage ASCII, un caractère alphabétique anglais nécessite 1 octet pour être stocké.
En codage GB 2312 ou GBK, un stockage de caractères chinois nécessite 2 octets.
En encodage UTF-8, le stockage d'un caractère alphabétique anglais nécessite 1 octet, et le stockage d'un caractère chinois nécessite 3 à 4 octets.
En encodage UTF-16, le stockage d'un caractère alphabétique anglais ou d'un caractère chinois nécessite 2 octets (certains caractères chinois de la zone d'extension Unicode nécessitent 4 octets pour être stockés).
En codage UTF-32, le stockage de n'importe quel caractère dans le monde nécessite 4 octets. Les caractères
sont des entités abstraites qui peuvent être représentées à l'aide de nombreux schémas de caractères ou pages de codes différents.
Par exemple, l'encodage Unicode UTF-16 représente les caractères sous la forme d'une séquence d'entiers de 16 bits, tandis que l'encodage Unicode UTF-8 représente les mêmes caractères sous la forme d'une séquence d'octets de 8 bits. Le Common Language Runtime de Microsoft utilise Unicode UTF-16 (Unicode Transformation Format, un codage 16 bits) pour représenter les caractères.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!