Maison  >  Article  >  Java  >  La différence entre les octets et les caractères Java

La différence entre les octets et les caractères Java

(*-*)浩
(*-*)浩original
2019-12-04 09:49:123927parcourir

La différence entre les octets et les caractères Java

Octet (octet) : C'est l'unité de base du traitement des données dans les ordinateurs. Il est d'usage d'utiliser un B majuscule pour le représenter. 8bit (bit)

Caractère (char) : fait référence aux lettres, chiffres, mots et symboles utilisés dans les ordinateurs. Selon le format de codage des caractères, le nombre d'octets correspondant à chaque unité de caractère est différent.

La relation entre les octets et les caractères                                                                                                                                                                                                                                    Ce sont des symboles utilisés par les gens pour faciliter l'enregistrement. Les caractères sont stockés en octets dans les ordinateurs Les caractères sont stockés dans. octets selon la norme de codage spécifiée par le jeu de caractères

Byte signifie octet, qui est le type de données de base en Java. La plage de valeurs du type est comprise entre -128 et 127.

Habituellement, lors de la lecture de fichiers non texte (tels que des images, des sons, des fichiers exécutables), vous devez utiliser des tableaux d'octets pour enregistrer le contenu des fichiers. Lors du téléchargement de fichiers, des tableaux d'octets sont également utilisés. à des fins temporaires, le tampon reçoit le contenu du fichier. Par conséquent, l’octet est essentiel dans les opérations sur les fichiers. Il est utilisé que ce soit pour écrire ou lire des fichiers. Les lettres et les chiffres anglais sont codés sur un seul octet, mais les caractères des langues naturelles tels que les caractères chinois sont multi-octets. Un octet ne peut représenter que 255 caractères et il ne peut pas être utilisé pour traiter autant de langues naturelles dans le monde, un stockage multi-octets est donc absolument nécessaire.

Dans l'entrée et la sortie des fichiers, InputStream et OutputStream traitent des flux d'octets, ce qui signifie que tout est supposé être des octets binaires

Et Reader et Writer sont des flux de caractères, cela implique le problème ; de jeu de caractères ;

Selon la norme de codage ANSI, les signes de ponctuation, les chiffres et les lettres majuscules et minuscules occupent tous un octet et les caractères chinois occupent 2 octets.

Selon la norme UNICODE, tous les caractères occupent 2 octets.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn