Heim >Backend-Entwicklung >XML/RSS-Tutorial >Detaillierte Erläuterung grundlegender XML-Codierungsbeispiele

Detaillierte Erläuterung grundlegender XML-Codierungsbeispiele

Y2J
Y2JOriginal
2017-05-08 10:02:451849Durchsuche

XML-Dokumente können fremde Zeichen wie Norwegisch oder Französisch enthalten (natürlich Chinesisch! Dieser Teil kann immer noch nicht gemäß dem Originaltext übersetzt werden, ein Teil des folgenden Inhalts wurde von mir selbst geschrieben)
Damit Ihr Parser diese Zeichen versteht , Sie müssen einen einheitlichen Zeichenkodierungsstandard in XML-Dokumenten verwenden.

Windows 95/98 Notepad
Windows 95/98 Notepad kann keine Dateien im Unicode-Kodierungsformat speichern.
Mit Notepad können Sie XML-Dokumente bearbeiten und speichern, die ausländische Zeichen enthalten (z. B. Norwegisch, Französisch oder Chinesisch).
>Xiaoyi
Xiaolin

Wenn Sie jedoch einen Browser verwenden, um dieses mit Notepad bearbeitete XML-Dokument zu öffnen, wird die Fehlermeldung „Mit IE 5.0 öffnen“ angezeigt.

Kodierung im Windows 95/98 Notepad verwenden
Beim Bearbeiten von XML-Dateien im Windows 95/98 Notepad müssen Sie das Kodierungsattribut

festlegen.
Um Fehler zu vermeiden, können Sie der XML-Dokumentdeklaration ein Codierungsattribut hinzufügen, um den Codierungstyp dieses XML-Dokuments anzugeben, verwenden Sie jedoch keine Unicode-Codierung.
Die folgenden Kodierungstypen verursachen keine Fehler und chinesische Zeichen werden normal angezeigt: Keine Fehler verursachen Fehler, und chinesische Zeichen werden normal angezeigt: Die folgenden Codierungstypen verursachen keine Fehler und chinesische Zeichen werden ungewöhnlich angezeigt (verstümmelte Zeichen):


Der folgende Kodierungstyp verursacht keine Fehler, chinesische Zeichen jedoch nicht normal angezeigt werden (verstümmelte Zeichen):


Der folgende Codierungstyp verursacht keine Fehler und chinesische Zeichen werden normal angezeigt:


Die folgenden Kodierungstypen verursachen Fehler:


Windows 2000 Notepad verwenden
Windows 2000 Notepad kann Dateien im Unicode-Kodierungsformat speichern.
Notepad für Windows 2000 unterstützt den Unicode-Zeichensatz. Wenn Sie Win2000 Notepad verwenden, um das XML-Dokument im Unicode-Kodierungsformat zu speichern (bitte beachten Sie, dass die XML-Deklaration keine Kodierungsinformationen enthält):
;< ;von>XiaoxiXiaolinLass uns abends zusammen zum Hotpot gehen

Die folgende Datei; note_encode_none_u .xml, es werden keine Fehler in IE5.0+ auftreten, aber wenn Sie Netscape 6.2 verwenden, können Fehler auftreten. Leser vergleichen die beiden Dateien note_encode_none.xml und note_encode_none_u.xml. Wenn sie ihre jeweiligen Quelldateien separat betrachten, gibt es keinen Unterschied, aber warum kann eine angezeigt werden und die andere nicht? Die Antwort ist der Unicode-Zeichensatz.

Windows 2000 Notepad-Kodierung
Windows 2000 Notepad kann Dateien auch im „UTF-16“-Kodierungsformat speichern.
Wenn Sie das Codierungsattribut im XML-Dokument deklarieren und die Datei im Unicode-Codierungsformat speichern, kann ein Fehler auftreten.
Der folgende Code verursacht einen Fehler:


Der folgende Code verursacht einen Fehler:


Der folgende Code verursacht einen Fehler:


Die folgende Datei; note_encode_utf16_u.xml wird in IE5.0+ normal angezeigt, verursacht jedoch einen Fehler im Netscape 6.2-Browser.


Fehlermeldung
Beim Durchsuchen von XML-Dokumenten mit IE5.0 oder höher können zwei unterschiedliche Kodierungen auftreten Es wurden Fehler erkannt:
Im Textinhalt wurde ein ungültiges Zeichen gefunden.
Wenn Ihr XML-Dokument nicht mit dem Codierungsformat Ihres XML-Dokuments übereinstimmt, kann ein Fehler auftreten. Normalerweise enthält das XML-Dokument einige „nicht-englische“ Zeichen und verwendet eine Einzelbyte-Kodierung
Editor
, und das Kodierungsformat des XML-Dokuments wird nicht in der Deklaration des XML-Dokuments festgelegt.

Der Wechsel von der aktuellen Kodierung zur angegebenen Kodierung wird nicht unterstützt.
Wenn das XML-Dokument im Unicode/UTF-16-Kodierungsformat gespeichert ist, die Deklaration des XML-Dokuments das Kodierungsformat jedoch auf eine Einzelbyte-Kodierung festlegt (z. B. Windows-1252, ISO-8859-1 oder UTF). -8) ; Oder das XML-Dokument wird in einem Einzelbyte-Kodierungsformat gespeichert, aber die Deklaration des XML-Dokuments legt das Kodierungsformat auf eine Unicode/UTF-16-Kodierungsform fest. In beiden Fällen treten Fehler auf.

Schlussfolgerung
Schlussfolgerung: Legen Sie das Kodierungsformat des Dokuments in der Deklaration des XML-Dokuments fest, bevor Sie es speichern. Einige meiner Vorschläge zur Fehlervermeidung:
Verwenden Sie ein Kodierungsformat, das den Unicode-Editor unterstützt.
Stellen Sie sicher, dass Sie wissen, welche Kodierung Sie verwenden.
Verwenden Sie Attributdeklarationen in XML-Dokumenten, um das Codierungsformat festzulegen.

[Verwandte Empfehlungen]

1.XML Kostenloses Video-Tutorial

2.XML Technisches Handbuch

3.Boolesches Tutorial Yan Shiba XML-Video-Tutorial

Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung grundlegender XML-Codierungsbeispiele. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn