Heim >Backend-Entwicklung >XML/RSS-Tutorial >XML-Leitfaden – XML-Codierung

XML-Leitfaden – XML-Codierung

黄舟
黄舟Original
2017-02-11 15:14:051993Durchsuche


XML-Dokumente können ausländische Zeichen wie Norwegisch oder Französisch enthalten (natürlich Chinesisch! Dieser Teil kann immer noch nicht gemäß dem Originaltext übersetzt werden, einige der folgenden Inhalte wurden von mir selbst geschrieben)
Um Ihre zu erstellen Damit der Parser diese Zeichen versteht, müssen Sie die Zeichenkodierungsstandards in XML-Dokumenten vereinheitlichen.



Windows 95/98 Notepad
Windows 95/98 Notepad kann keine Dateien im Unicode-Kodierungsformat speichern.
Sie können Note verwenden, um XML-Dokumente zu bearbeiten und zu speichern, die ausländische Zeichen enthalten (z. B. Norwegisch, Französisch oder Chinesisch).

<?xml version="1.0"?> 
<note> 
<from>小奀</from> 
<to>小林</to> 
<message>晚上一起去火锅呀</message> 
</note>


Aber wenn Sie dies mit einem Browser-XML öffnen Bei Dokumenten, die mit Notepad bearbeitet wurden, tritt beim Öffnen mit IE 5.0 ein Fehler auf.



Codierung im Windows 95/98 Notepad verwenden
Das Codierungsattribut muss beim Bearbeiten von XML-Dateien im Windows 95/98 Notepad festgelegt werden.
Um Fehler zu vermeiden, können Sie der XML-Dokumentdeklaration ein Codierungsattribut hinzufügen, um den Codierungstyp dieses XML-Dokuments anzugeben, verwenden Sie jedoch keine Unicode-Codierung.
Die folgenden Kodierungstypen verursachen keine Fehler und chinesische Schriftzeichen werden normal angezeigt:

<?xml version="1.0" encoding="gb2312"?>




Die folgenden Kodierungstypen verursachen keine Fehler und Chinesische Schriftzeichen werden normal angezeigt. Normal:

<?xml version="1.0" encoding="gbk"?>




Die folgenden Codierungstypen verursachen keine Fehler und chinesische Schriftzeichen werden abnormal angezeigt (verstümmelte Zeichen):

<?xml version="1.0" encoding="windows-1252"?>




Die folgenden Codierungstypen verursachen keine Fehler und chinesische Zeichen werden nicht normal angezeigt (verstümmelte Zeichen):

<?xml version="1.0" encoding="ISO-8859-1"?>




Die folgenden Kodierungstypen verursachen keine Fehler und chinesische Schriftzeichen werden normal angezeigt:

<?xml version="1.0" encoding="UTF-8"?>




Die Die folgenden Kodierungstypen führen zu Fehlern:

<?xml version="1.0" encoding="UTF-16"?>


Windows 2000 Notepad verwenden
Windows 2000 Notepad kann Dateien im Unicode-Kodierungsformat speichern.
Notepad für Windows 2000 unterstützt den Unicode-Zeichensatz. Wenn Sie Win2000 Notepad verwenden, um das XML-Dokument im Unicode-Kodierungsformat zu speichern (bitte beachten Sie, dass die XML-Deklaration keine Kodierungsinformationen enthält):

<?xml version="1.0"?> 
<note><from>小奀</from><to>小林</to><message>晚上一起去火锅呀</message></note>


Die folgende Datei; xml, Der Fehler tritt in IE5.0+ nicht auf, aber wenn Sie Netscape 6.2 verwenden, kann ein Fehler auftreten. Leser vergleichen die beiden Dateien note_encode_none.xml und note_encode_none_u.xml. Wenn sie ihre jeweiligen Quelldateien separat betrachten, gibt es keinen Unterschied, aber warum kann eine angezeigt werden und die andere nicht? Die Antwort ist der Unicode-Zeichensatz.

Windows 2000 Notepad-Kodierung
Windows 2000 Notepad kann Dateien auch im „UTF-16“-Kodierungsformat speichern.
Wenn Sie das Codierungsattribut im XML-Dokument deklarieren und die Datei im Unicode-Codierungsformat speichern, kann ein Fehler auftreten.
Der folgende Code verursacht einen Fehler:

<?xml version="1.0" encoding="windows-1252"?>




Der folgende Code verursacht einen Fehler:

<?xml version="1.0" encoding="ISO-8859-1"?>




Der folgende Code verursacht einen Fehler:

<?xml version="1.0" encoding="UTF-8"?>




Die folgende Datei; note_encode_utf16_u.xml, wird es Wird in IE5.0+ normal angezeigt, im Netscape 6.2-Browser tritt jedoch ein Fehler auf.

<?xml version="1.0" encoding="UTF-16"?>



Fehlermeldung
Beim Durchsuchen von XML-Dokumenten mit IE5.0 oder höher können zwei verschiedene Kodierungsfehler auftreten:
Ein ungültiges Zeichen wurde gefunden im Textinhalt.
Wenn Ihr XML-Dokument nicht mit dem Codierungsformat Ihres XML-Dokuments übereinstimmt, kann ein Fehler auftreten. Normalerweise enthält das XML-Dokument einige „nicht-englische“ Zeichen, es wird ein Einzelbyte-Codierungseditor verwendet und das Codierungsformat des XML-Dokuments wird nicht in der Deklaration des XML-Dokuments festgelegt.

Der Wechsel von der aktuellen Kodierung zur angegebenen Kodierung wird nicht unterstützt.
Wenn das XML-Dokument im Unicode/UTF-16-Kodierungsformat gespeichert ist, die Deklaration des XML-Dokuments das Kodierungsformat jedoch auf eine Einzelbyte-Kodierung festlegt (z. B. Windows-1252, ISO-8859-1 oder UTF). -8) ; Oder das XML-Dokument wird in einem Einzelbyte-Kodierungsformat gespeichert, aber die Deklaration des XML-Dokuments legt das Kodierungsformat auf eine Unicode/UTF-16-Kodierungsform fest. In beiden Fällen treten Fehler auf.

Schlussfolgerung
Schlussfolgerung: Legen Sie das Kodierungsformat des Dokuments in der Deklaration des XML-Dokuments fest, bevor Sie es speichern. Einige meiner Vorschläge zur Fehlervermeidung:
Verwenden Sie ein Kodierungsformat, das den Unicode-Editor unterstützt.
Stellen Sie sicher, dass Sie wissen, welche Kodierung Sie verwenden.
Verwenden Sie Attributdeklarationen in XML-Dokumenten, um das Codierungsformat festzulegen.

Das Obige ist der Inhalt des XML-Leitfadens – XML-Codierungsinhalt. Weitere verwandte Inhalte finden Sie auf der chinesischen PHP-Website (www.php.cn)!


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn