Maison >interface Web >js tutoriel >Explication détaillée des jeux de caractères en JavaScript

Explication détaillée des jeux de caractères en JavaScript

黄舟
黄舟original
2017-10-30 09:57:411887parcourir

Introduction

Les programmes JavaScriptsont écrits en utilisant le jeu de caractères Unicode. Unicode est un sur-ensemble d'ASCII et de Latin-1 et prend en charge presque toutes les langues utilisées sur la planète. ECMAScript3 nécessite que les implémentations JavaScript prennent en charge Unicode2.1 et les versions ultérieures, et ECMAScript5 nécessite la prise en charge d'Unicode3 et des versions ultérieures.

Sensible à la taille

JavaScript est un langage sensible à la casse, c'est-à-dire les mots-clés, les variables, les fonctions les noms et tous les identifiants doivent être dans une casse cohérente. Cependant, il est important de noter que HTML n'est pas sensible à la casse (bien que XHTML le soit).

Espaces, nouvelles lignes et caractères de contrôle de format

JavaScript ignorera les espaces entre les jetons dans le programme et, dans la plupart des cas, ignorera également les nouvelles lignes.

Étant donné que les espaces et les sauts de ligne peuvent être utilisés librement dans le code, une indentation nette et cohérente peut être utilisée pour implémenter un style de codage unifié, améliorant ainsi la lisibilité du code.
Caractères d'espace reconnus par JavaScript :

  • Caractère d'espace normal u0020

  • Caractère de tabulation horizontale u0009

  • Onglet vertical u000B

  • Saut de page u000C

  • Aucun espace de rupture u00A0

  • Octet marque de commande uFEFF

  • Tous les caractères de la catégorie Zs en Unicode

JavaScript reconnaît les caractères suivants comme fins de ligne Symbole :

Ligne caractère de retour u000A

Caractère de retour chariot u000D

Séparateur de ligne uz0z8

Séparateur de paragraphe u2029

Les caractères de retour chariot et de saut de ligne sont analysés ensemble en un terminateur d'une seule ligne

Séquence d'échappement Unicode

dans certains matériels et logiciels informatiques, l'ensemble complet des caractères Unicode ne peut pas être affiché ou saisi . Pour des raisons de compatibilité, JavaScript définit une séquence spéciale qui utilise 6 caractères ASCII pour représenter tout code interne Unicode 16 bits. Ces séquences d'échappement Unicode sont préfixées par u, suivi de 4 chiffres hexadécimaux (représentés par des chiffres et des lettres majuscules ou minuscules A~F), et peuvent être utilisées dans les littéraux JavaScript et les expressions régulières et identifiants (sauf mots-clés) .

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn