L'octet est une unité de mesure utilisée dans les technologies de l'information informatique pour mesurer la capacité de stockage. Il s'agit d'une chaîne de chiffres binaires traitée comme une unité et est une petite unité qui constitue une information. L'octet le plus couramment utilisé est un octet, c'est-à-dire qu'il contient un nombre binaire de huit bits.
Différentes méthodes d'encodage occupent différents octets pour un caractère :
Code ASCII :
Une lettre anglaise (non sensible à la casse) occupe un octet d'espace, une lettre chinoise des caractères chinois occupent deux octets d'espace. Une séquence de nombres binaires, utilisée comme unité numérique dans l'ordinateur, est généralement un nombre binaire de 8 bits, converti en décimal. La valeur minimale est 0 et la valeur maximale est 255. Par exemple, un code ASCII est un octet.
Encodage UTF-8 :
Un caractère anglais équivaut à un octet, et un caractère chinois (y compris le chinois traditionnel) équivaut à trois octets.
Codage Unicode :
Un mot anglais équivaut à deux octets, et un caractère chinois (y compris le chinois traditionnel) équivaut à deux octets.
Symboles :
La ponctuation anglaise occupe un octet, la ponctuation chinoise occupe deux octets. Par exemple : le point anglais "." occupe 1 octet et le point chinois "." occupe 2 octets.
Résumé :
Lors de l'encodage de codes ASCII et Unicode, le binaire 8 bits représente un caractère anglais et le binaire 16 bits représente un caractère midi. Dans le codage UTF-8, le binaire 8 bits représente un caractère anglais et le binaire 24 bits représente un caractère chinois.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!