Heim  >  Artikel  >  Web-Frontend  >  Was sind die Sprachkodierungen von HTML?

Was sind die Sprachkodierungen von HTML?

php中世界最好的语言
php中世界最好的语言Original
2017-11-23 16:10:324035Durchsuche

In HTML kann die Codierung zu verstümmelten Webseiten führen, wenn Benutzer den IE verwenden, und kann auch zu Kompatibilitätsproblemen in div+css führen. Die Codierung ist im Allgemeinen sehr wichtig HTML-Seite. Zwischen > Heute werden wir einige Kenntnisse über das Codieren vorstellen.

Im Allgemeinen wird diese Webseitenkodierung zwischen und platziert.

HTML-Codierungsstil

Pass Durch Ändern von utf-8 in charset=utf-8 kann sich die Codierung der Webseite ändern.

Wenn wir CSS-Dateien schreiben, müssen wir im Allgemeinen auch @charset „utf-8“ am Anfang der CSS-Datei verwenden, um den Codierungstyp dieser CSS-Datei zu definieren. Im Allgemeinen müssen der HTML-Quellcode und die CSS-Dateikodierung vereinheitlicht werden. Wenn sie nicht vereinheitlicht werden, führt dies zu Kompatibilitätsproblemen wie CSS-Hacks, verstümmelten Seiten und chaotischem Seitenlayout.

Häufig verwendete HTML-Codierungstypen

Die beiden in China am häufigsten verwendeten sind utf-8 und gb2312. Im Allgemeinen können diese beiden Typen die inländischen Anforderungen an die Webseitenkodierung erfüllen. Natürlich werden diese beiden Kodierungsarten auch in Programmen und Datenbanken verwendet, um Webseiten zu verarbeiten und

Datentypen zu speichern.

UTF-8 hat die folgenden Eigenschaften

UCS-Zeichen U+0000 bis U+007F (ASCII) werden als Bytes 0x00 bis 0x7F (ASCII-kompatibel) codiert Die enthaltenen ASCII-Zeichendateien sind in den Codierungsmethoden ASCII und UTF-8 gleich.

Alle>U+007F UCS-Zeichen werden als Multibyte-Zeichenfolge codiert. Daher gibt es für jedes Byte eine Reihe von Flag-Bits , ASCII-Bytes (0x00-0x7F) dürfen nicht Teil eines anderen Zeichens sein

Das erste Byte einer Mehrbyte-Zeichenfolge, die ein Nicht-ASCII-Zeichen darstellt, liegt immer zwischen 0xC0 und 0xFD und zeigt an wie viele Bytes dieses Zeichen enthält. Die verbleibenden Bytes einer Multibyte-Zeichenfolge liegen im Bereich von 0x80 bis 0xBF. Dies macht die Codierung sehr einfach und macht die Codierung weniger anfällig für fehlende Wörter 231 UCS-Codes

UTF-8-kodierte Zeichen können theoretisch bis zu 6 Byte lang sein, 16-Bit-BMP-Zeichen können jedoch nur bis zu 3 Byte lang sein.

Die Reihenfolge von Bigendian UCS-4 Byte-Strings sind vorbestimmt.

Die Bytes 0xFE und 0xFF werden niemals in der UTF-8-Codierung verwendet.

GB2312 hat die folgenden Eigenschaften

Der GB2312-Standard enthält insgesamt 6763 chinesische Schriftzeichen , einschließlich 3755 chinesischer Schriftzeichen der ersten Stufe und 3008 chinesischer Schriftzeichen der zweiten Stufe gleichzeitig, enthält GB2312 lateinische Buchstaben, griechische Buchstaben und japanische Hiragana sowie 682 Zeichen voller Breite, einschließlich Katakana-Buchstaben und russischer kyrillischer Buchstaben.

Das Aufkommen von GB2312 erfüllt im Wesentlichen die Computerverarbeitungsanforderungen chinesischer Schriftzeichen. Die darin enthaltenen chinesischen Schriftzeichen decken 99,75 % der Verwendungshäufigkeit ab. In GB2312 sind die gesammelten chinesischen Schriftzeichen „partitioniert“ und jede Zone enthält 94 chinesische Schriftzeichen/Symbole. Diese Darstellung wird auch Standortcode genannt.

Die Bereiche 01-09 sind Sondersymbole.

Die Bereiche 16–55 sind chinesische Schriftzeichen der ersten Ebene, sortiert nach Pinyin.

Die Bereiche 56–87 sind chinesische Schriftzeichen der zweiten Ebene, sortiert nach Radikal/Strich.

Bezirke 10-15 und 88-94 sind nicht kodiert.

Zum Beispiel ist das Zeichen „Ah“ das erste chinesische Zeichen in GB2312 und sein Standortcode ist 1601. In Programmen, die GB2312 verwenden, verwendet die Bytestruktur normalerweise die EUC-Speichermethode, um mit ASCII kompatibel zu sein. Jedes chinesische Zeichen und Symbol wird durch zwei Bytes dargestellt. Das erste Byte wird als „High-Byte“ und das zweite Byte als „Low-Byte“ bezeichnet. Das „High-Byte“ verwendet 0xA1-0xF7 (fügen Sie 0xA0 zur Vorwahl des Bereichs 01-87 hinzu), und das „Low-Byte“ verwendet 0xA1-0xFE (fügen Sie 01-94 zu 0xA0 hinzu). Beispielsweise wird das Wort „Ah“ in den meisten Programmen als 0xB0A1 gespeichert. (Vergleiche mit Standortcode: 0xB0=0xA0+16, 0xA1=0xA0+1).

Das Dezimalsystem des chinesischen Zeichenbereichscodes in der GB2312-Kodierung reicht also von 176 bis 247 und der Bitcode von 161 bis 255. Der Grund, warum 6763 gespeichert wird, ist kleiner als 82*94=6768, weil Die Vorwahl ist 215 und der Bitcode ist 215. Es gibt fünf Codes zwischen 250 und 254 ohne chinesische Zeichenkodierung, also 6768-5 = 6763.

GB2312-Kodierung kann in China leicht als gemeinsame Sprache verstanden werden.

Empfohlene Zeichensatzkodierung

UTF-8 kann diese Kodierung leicht verstehen, z. B. Taiwan und Festlandchina.

Fehler bei der Kompatibilität von Webseiten, die durch die Codierung verursacht werden

Wenn die Codierungsmischung dazu führt, dass die Webseite verstümmelt wird, spricht man auch von Inkompatibilität, insbesondere wenn die Codierungsmischung in CSS

Kommentaren

verwendet wird Verursacht CSS-Hack.

Ich hoffe, Sie werden in Zukunft nie vergessen, die Webseitenkodierung anzugeben, wenn Sie Webseiten erstellen.

Das Obige ist das Wissen über die HTML-Sprachkodierung. Weitere spannende Informationen finden Sie auf der chinesischen PHP-Website

andere

verwandte Artikel!

Verwandter Inhalt:

Woher weiß ich, welcher CSS-Attributstil für DIV festgelegt ist?

Warum müssen Sie CSS-Stile für DIV festlegen?

So verwenden Sie das

-Tag von HTML

Das obige ist der detaillierte Inhalt vonWas sind die Sprachkodierungen von HTML?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn