Heim > Artikel > Web-Frontend > Detaillierte Erläuterung der Kodierung und Dekodierung von JavaScript-Zeichensätzen für Sie (grafisches Tutorial)
Dieser Artikel gibt Ihnen eine detaillierte Erklärung des Zeichensatzes in JavaScript sowie der Kodierung und Dekodierung von Zeichensätzen. Er ist sehr detailliert. Freunde in Not können sich darauf beziehen
1 . Zeichensatz
1) Zeichen und Bytes (Zeichen)
Zeichen ist der allgemeine Begriff für verschiedene Texte und Symbole, einschließlich verstümmelter Zeichen bis 1~n Bytes, ein Byte entspricht 8 Bits, jedes Bit wird durch 0 oder 1 dargestellt.
2) Zeichensatz
Ein Zeichensatz ist eine Sammlung mehrerer Zeichen. Jeder Zeichensatz enthält eine unterschiedliche Anzahl von Zeichensatznamen: ASCII-Zeichensatz , GB2312-Zeichensatz, Unicode-Zeichensatz usw.
3) Zeichenkodierung
Bei der Zeichenkodierung geht es darum, Symbole in computerlesbare Binärdateien umzuwandeln, und bei der Dekodierung geht es darum, Binärdateien in menschenlesbare Symbole umzuwandeln.
Die meisten Zeichensätze entsprechen einer Codierungsmethode (GBK entspricht beispielsweise der GBK-Codierung), es gibt jedoch viele Unicode-Codierungen, darunter UTF-8, UTF-16, UTF-32 und UTF-7.
Die derzeit am häufigsten verwendete Webseite ist „UTF-8“. UTF-8 verwendet ein bis vier Bytes zur Codierung jedes Zeichens. Es handelt sich um eine Obermenge von ASCII, sodass vorhandener ASCII-Text nicht konvertiert werden muss
2. Browserbasis
1) Dezimal und Hexadezimal in HTML-Attributen verwenden
Dezimal in HTML „8“ kann hexadezimal verwendet werden, und „Z“ wird hexadezimal verwendet. Es gibt ein x mehr als dezimal, und es gibt auch sechs weitere Zeichen a~f im Hexadezimalcode, um 10~15 darzustellen.
2) Dezimal und Hexadezimal werden in CSS-Attributen verwendet
CSS ist mit der Hexadezimalform von HTML kompatibel. Darüber hinaus kann Hexadezimal in der Form ausgedrückt verwendet werden von „6c“.
3) Das JavaScript-Codierungspaket
kann String-Oktal- und Hexadezimal-Codierungsmethoden direkt über eval ausführen, wobei Oktal durch „56“ und zehn Hexadezimal durch „ x5c".
Wenn im Code chinesische Zeichen verwendet werden und eine hexadezimale Kodierung erforderlich ist, kann nur eine hexadezimale Unicode-Kodierung durchgeführt werden. Die Darstellung lautet: „u4ee3u7801“.
In „Web Front-end Hacking Technology Revealed“ werden zwei Methoden zum Codieren und Decodieren gekapselt. Die folgenden zwei Methoden werden hauptsächlich verwendet. Der spezifische Code kann hier angezeigt werden.
Die Kerncodes sind: „str.charCodeAt(char).toString(base)“ und „String.fromCharCode(parseInt(code, base))“
Die Methode charCodeAt() gibt An zurück Ganzzahl zwischen 0 und 65535, die die UTF-16-Codeeinheit am angegebenen Index darstellt
Die statische String.fromCharCode()-Methode gibt eine Zeichenfolge zurück, die mit der angegebenen Folge von Unicode-Werten erstellt wurde.
Sie können „MonyerJS“ auch über eine Online-Webseite kodieren und dekodieren.
4) Automatischer HTML-Dekodierungsmechanismus
Wenn Sie beispielsweise auf einer Webseite hexadezimal „Hallo“ eingeben, wird es automatisch in „Hallo“ dekodiert.
Es gibt auch einige bekannte Leerzeichen „ “, die ebenfalls über diesen Mechanismus verfügen.
3. Browser-Kodierung
Es gibt drei Funktionspaare in JavaScript, die Zeichenfolgen kodieren und dekodieren können, nämlich:
escape/unescape, encodeURI /decodeURI, encodeURIComponent/decodeURIComponent.
Der Hauptunterschied besteht in der Anzahl der Zeichen, die nicht kodiert sind.
1) Es gibt 69 Zeichen, die Escape nicht codiert
*、+、-、.、/、@、_、0~9、a~z、A~Z
und wenn Escape andere Unicode-Werte als 0 bis 255 codiert, wird %u ausgegeben *** *Format.
2) Es gibt 82 Zeichen, die nicht von encodeURI codiert werden
!、#、$、&、'、(、)、*、+、,、-、.、/、:、;、=、?、@、_、~、0~9、a~z、A~Z
3) Es gibt 71 Zeichen, die werden nicht von encodeURIComponent codiert.
!、'、(、)、*、-、.、_、~、0~9、a~z、A~Z
Ich hoffe, dass es Ihnen in Zukunft hilfreich sein wird.
Verwandte Artikel:
Detaillierte Erläuterung der Verwendung von JS-Prototypen und Prototypenketten
Detaillierte Erläuterung der Interaktion zwischen Servlet3.0 und JS über Ajax
p5.jsZusammenfassung der Tastaturinteraktionsfunktionen
Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Kodierung und Dekodierung von JavaScript-Zeichensätzen für Sie (grafisches Tutorial). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!