Heim  >  Artikel  >  Web-Frontend  >  Eine kurze Diskussion über JavaScript-Zeichensätze_Grundkenntnisse

Eine kurze Diskussion über JavaScript-Zeichensätze_Grundkenntnisse

WBOY
WBOYOriginal
2016-05-16 16:47:151402Durchsuche

JavaScript unterscheidet zwischen Groß- und Kleinschreibung:

Schlüsselwörter, Variablen, Funktionsnamen und alle Bezeichner müssen in konsistenter Groß- und Kleinschreibung angegeben werden (im Allgemeinen schreiben wir sie in Kleinbuchstaben), was sich stark von der Schreibmethode mit mehreren Stilen unterscheidet, als ich C# zum ersten Mal lernte.

Zum Beispiel: (Hier nehmen wir die Variablen str und Str als Beispiele)

Code kopieren Der Code lautet wie folgt:

var str='abc';
var Str ='ABC';
alert(str);//Ausgabe abc

Eine kurze Diskussion über JavaScript-Zeichensätze_Grundkenntnisse

Wenn str und Str dieselbe Variable sind, dann alarm(str);, sollte das Ausgabeergebnis ABC statt abc sein, wie oben gezeigt. Dies zeigt nur: JavaScript unterscheidet zwischen Groß- und Kleinschreibung.

Unicode-Escape-Sequenz

Das Aufkommen des Unicode-Zeichensatzes soll die Einschränkung ausgleichen, dass ASCII-Codes nur 128 Zeichen darstellen können. Wenn wir im täglichen Leben chinesische und japanische Zeichen anzeigen möchten, ist ASCII offensichtlich unmöglich. Unicode ist also eine Obermenge von ASCII und Latin-1. Erstens werden JavaScript-Programme mit dem Unicode-Zeichensatz geschrieben. Bei manchen Computerhardware und -software ist es jedoch unmöglich, den vollständigen Satz von Unicode-Zeichen anzuzeigen oder einzugeben (z. B.: é). JavaScript definiert eine spezielle Sequenz. Diese Sequenz verwendet 6 ASCII-Zeichen, um jeden internen 16-Bit-Unicode-Code darzustellen. Diese spezielle Sequenz wird zusammenfassend als Unicode-Escape-Sequenz bezeichnet, gefolgt von 4 hexadezimalen Ziffern

Zum Beispiel:

Code kopieren Der Code lautet wie folgt:
var str='cafu00e9';
var Str ='café';
alert(Str ' ' str);// Es ist ersichtlich, dass die Anzeige den gleichen Effekt hat.
alert (Str===str);//Ausgabe wahr

Eine kurze Diskussion über JavaScript-Zeichensätze_GrundkenntnisseEine kurze Diskussion über JavaScript-Zeichensätze_Grundkenntnisse

Aber wir sollten beachten, dass Unicode mehrere Methoden zum Codieren desselben Zeichens zulässt, wie das obige é-Escape-Beispiel zeigt:

é:

1. Das Unicode-Zeichen u00E9 kann zur Darstellung von

verwendet werden

2. Sie können auch eu0301 (Intonationszeichen) verwenden, um

darzustellen

Code kopieren Der Code lautet wie folgt:
var str='cafu00e9';
var Str ='cafeu0301';
alert(str ' ' Str); //Wie in der Abbildung unten gezeigt, sind die Ausgabeergebnisse von Str und str gleich
alert(Str===str); //Das Ergebnis ist dasselbe, aber ihre binären Codierungsdarstellungen unterscheiden sich grundlegend, sodass die Ausgabe falsch ist

Obwohl die im Texteditor angezeigten Ergebnisse gleich sind, unterscheiden sich ihre binären Codierungsdarstellungen grundlegend. Die Programmiersprache wird schließlich in den computermechanischen Code (Binärcodierung) der lokalen Plattform konvertiert, und der Computer kann nur verarbeiten das Binärergebnis kann nur durch Vergleich der Codes ermittelt werden, daher kann das Endergebnis ihres Vergleichs nur falsch sein

Das ist also die beste Erklärung für „Unicode ermöglicht mehrere Methoden zum Kodieren desselben Zeichens“, da der Unicode-Standard ein bevorzugtes Kodierungsformat für alle Zeichen definiert, um Text für einen geeigneten Vergleich in ein einheitliches Unicode-Format umzuwandeln.

Noch einmal é als Beispiel:

Sind das é in face und café gleich?

Das é in face und café werden beide in u00E9 oder beide in eu0301 umgewandelt, sodass das é in face und café verglichen werden kann

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn