Maison >interface Web >js tutoriel >Explication détaillée des jeux de caractères en JavaScript
Les programmes JavaScriptsont écrits en utilisant le jeu de caractères Unicode. Unicode est un sur-ensemble d'ASCII et de Latin-1 et prend en charge presque toutes les langues utilisées sur la planète. ECMAScript3 nécessite que les implémentations JavaScript prennent en charge Unicode2.1 et les versions ultérieures, et ECMAScript5 nécessite la prise en charge d'Unicode3 et des versions ultérieures.
JavaScript est un langage sensible à la casse, c'est-à-dire les mots-clés, les variables, les fonctions les noms et tous les identifiants doivent être dans une casse cohérente. Cependant, il est important de noter que HTML n'est pas sensible à la casse (bien que XHTML le soit).
JavaScript ignorera les espaces entre les jetons dans le programme et, dans la plupart des cas, ignorera également les nouvelles lignes.
Étant donné que les espaces et les sauts de ligne peuvent être utilisés librement dans le code, une indentation nette et cohérente peut être utilisée pour implémenter un style de codage unifié, améliorant ainsi la lisibilité du code.
Caractères d'espace reconnus par JavaScript :
Caractère d'espace normal u0020
Caractère de tabulation horizontale u0009
Onglet vertical u000B
Saut de page u000C
Aucun espace de rupture u00A0
Octet marque de commande uFEFF
Tous les caractères de la catégorie Zs en Unicode
JavaScript reconnaît les caractères suivants comme fins de ligne Symbole :
Ligne caractère de retour u000A
Caractère de retour chariot u000D
Séparateur de ligne uz0z8
Séparateur de paragraphe u2029
Les caractères de retour chariot et de saut de ligne sont analysés ensemble en un terminateur d'une seule ligne
dans certains matériels et logiciels informatiques, l'ensemble complet des caractères Unicode ne peut pas être affiché ou saisi . Pour des raisons de compatibilité, JavaScript définit une séquence spéciale qui utilise 6 caractères ASCII pour représenter tout code interne Unicode 16 bits. Ces séquences d'échappement Unicode sont préfixées par u, suivi de 4 chiffres hexadécimaux (représentés par des chiffres et des lettres majuscules ou minuscules A~F), et peuvent être utilisées dans les littéraux JavaScript et les expressions régulières et identifiants (sauf mots-clés) .
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!