Maison > Questions et réponses > le corps du texte
char既然代表了一个字符,就应该能存放所有的字符才对呀,加上乱七八糟的各国语言字符,总不能char只能存放 中日韩的单个字符吧?
PHPz2017-04-17 17:48:01
Java utilise uniquement le codage Unicode, donc char peut stocker des caractères chinois. Qu'est-ce qu'Unicode ?
Unicode (chinois : Universal Code, International Code, Unicode, Unicode) est une norme industrielle dans le domaine de l'informatique. Il organise et code la plupart des systèmes d'écriture dans le monde, permettant aux ordinateurs de présenter et de traiter le texte de manière plus simple.
Unicode se développe avec le standard du jeu de caractères universel et est également publié sous forme de livre [1]. Unicode est encore continuellement révisé à ce jour, chaque nouvelle version ajoutant de nouveaux caractères. La dernière version est la 8.0.0 [1] sortie le 17 juin 2015, qui a reçu plus de 100 000 caractères (les 100 000 caractères ont été adoptés en 2005). Outre les glyphes visuels, les méthodes de codage et les codages de caractères standard, les données couvertes par Unicode incluent également les caractéristiques des caractères, telles que les lettres majuscules et minuscules.
Ce qui précède provient de Wikipédia unicode-Wikipedia
Il n'est pas difficile de voir de ce qui précède que les éléments Unicode ne sont pas gratuits et doivent être inclus par l'organisation Unicode. Cependant, seuls certains caractères chinois, japonais et coréens sont désormais inclus, et ils peuvent ne pas l'être. complete. Et Java utilise Unicode, donc Java prendra en charge ces caractères tant qu'ils sont inclus dans l'organisation Unicode.
Pas une très bonne réponse.
阿神2017-04-17 17:48:01
Quand utf-8 ne suffit pas, il y a utf-16
http://baike.baidu.com/link?url=nkV9FQlo3zIu25zKLF3M1Pjp3Y6377hPnesTlnNqHb19cbkdV4P6JX9_FtCWPQ97j7BukgEZ0TBb66uqEn8rpK
黄舟2017-04-17 17:48:01
Le caractère est stocké sur 2 octets, car 2 octets pour les caractères la ponctuation sont plus que suffisants pour représenter les caractères, mais si vous ajoutez un autre texte non anglais, chinois, etc., cela peut ne pas suffire. utilisé pour représenter un Quant aux caractères, la plage qui peut être représentée va s'étendre, et 8 octets sont théoriquement possibles
Le standard de jeu de caractères Unicode a vu le jour
Les caractères en Java utilisent le codage Unicode, 16 bits