Heim  >  Artikel  >  Web-Frontend  >  Detaillierte Erklärung der Zeichensätze in JavaScript

Detaillierte Erklärung der Zeichensätze in JavaScript

黄舟
黄舟Original
2017-10-30 09:57:411823Durchsuche

Einführung

JavaScriptProgramme werden mit dem UnicodeZeichensatz geschrieben. Unicode ist eine Obermenge von ASCII und Latin-1 und unterstützt fast jede auf dem Planeten verwendete Sprache. ECMAScript3 erfordert, dass JavaScript-Implementierungen Unicode2.1 und nachfolgende Versionen unterstützen müssen, und ECMAScript5 erfordert die Unterstützung von Unicode3 und nachfolgenden Versionen.

Größensensitiv

JavaScript ist eine Sprache, bei der die Groß-/Kleinschreibung beachtet wird, d. h. Schlüsselwörter, Variablen, Funktionen Namen und alle Bezeichner müssen in konsistenter Groß- und Kleinschreibung angegeben werden. Es ist jedoch zu beachten, dass bei HTML die Groß-/Kleinschreibung nicht beachtet wird (obwohl bei XHTML die Groß-/Kleinschreibung beachtet wird).

Leerzeichen, Zeilenumbrüche und Formatsteuerzeichen

JavaScript ignoriert Leerzeichen zwischen Token im Programm und in den meisten Fällen auch Zeilenumbrüche.

Da Leerzeichen und Zeilenumbrüche im Code frei verwendet werden können, kann eine saubere und konsistente Einrückung verwendet werden, um einen einheitlichen Codierungsstil zu implementieren und dadurch die Lesbarkeit des Codes zu verbessern.
Von JavaScript erkannte Leerzeichen:

  • Normales Leerzeichen u0020

  • Horizontales Tabulatorzeichen u0009

  • Vertikaler Tab u000B

  • Formularvorschub u000C

  • Kein umbrechendes Leerzeichen u00A0

  • Byte Bestellzeichen uFEFF

  • Alle Zs-Kategoriezeichen in Unicode

JavaScript erkennt die folgenden Zeichen als Zeilenendesymbol:

Zeile Vorschubzeichen u000A

Wagenrücklaufzeichen u000D

Zeilentrennzeichen uz0z8

Absatztrennzeichen u2029

Die Wagenrücklauf- und Zeilenvorschubzeichen werden zusammen analysiert in ein einzeiliges Abschlusszeichen

Unicode-Escape-Sequenz

In mancher Computerhardware und -software kann der vollständige Satz von Unicode-Zeichen nicht angezeigt oder eingegeben werden . Aus Kompatibilitätsgründen definiert JavaScript eine spezielle Sequenz, die 6 ASCII-Zeichen verwendet, um jeden internen 16-Bit-Unicode-Code darzustellen. Diesen Unicode-Escape-Sequenzen wird ein u vorangestellt, gefolgt von vier hexadezimalen Ziffern (dargestellt durch Ziffern und Groß- oder Kleinbuchstaben A~F) und können in JavaScript-Literalen und regulären Ausdrücken und Bezeichnern (außer Schlüsselwörtern) verwendet werden. .

Das obige ist der detaillierte Inhalt vonDetaillierte Erklärung der Zeichensätze in JavaScript. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn