Heim >Backend-Entwicklung >XML/RSS-Tutorial >Detaillierte Einführung in Kodierungs- und Verifizierungsprobleme beim Schreiben von XML-Code
In diesem Artikel werden hauptsächlich die Kodierungs- und Verifizierungsprobleme beim Schreiben von XML-Code vorgestellt. Die Kodierung von XML-Dateien kann auch in der Präambel angegeben werden.
Kodierung
Codierung ist der Prozess der Konvertierung von Unicode-Zeichen in äquivalente Binärdarstellungen. Wenn ein XML-Handler ein XML-Dokument liest, verlässt er sich beim Kodieren des Dokuments auf den Kodierungstyp. Daher müssen wir den Codierungstyp in der XML-Deklaration angeben.
Codierungstyp
Es gibt zwei Haupttypen der Codierung:
UTF-8
UTF-16
UTF steht für das UCS-Konvertierungsformat und UCS selbst bedeutet universellen Zeichensatz . Zahl 8 oder 16 stellt die Anzahl der Bits dar, die das Zeichen darstellen. Sie sind 8 (ein Byte) oder 16 (zwei Bytes). Für Dokumente ohne Kodierungsinformationen wird standardmäßig UTF-8 verwendet.
Syntax
Kodierungsinformationen sind im Prolog des XML-Dokuments enthalten. Die Syntax für die UTF-8-Kodierung lautet wie folgt:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Die Syntax für die UTF-16-Kodierung lautet wie folgt:
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
Beispiel
Das folgende Beispiel zeigt die Kodierungsdeklaration:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>Tanmay Patil TutorialsPoint (011) 123-4567
Im obigen Beispiel „coding="UTF-8" ist die Verwendung von 8 angegeben -Bit-Zeichen. Um 16 Zeichen zu verwenden, verwenden Sie die UTF-16-Kodierung.
Mit UTF-8 kodierte XML-Dateien sind kleiner als Dateien im UTF-16-Format.
Validierung
Validierung ist der Prozess der Validierung von XML-Dokumenten. Ein Dokument gilt als gültig, wenn sein Inhalt mit den Elementen, Attributen und der zugehörigen Dokumenttypdefinition (DTD) übereinstimmt und wenn das Dokument den durch b ausgedrückten Einschränkungen entspricht. Es gibt zwei Möglichkeiten, die Validierung durch einen XML-Parser durchzuführen. Dies sind:
Wohlgeformtes XML-Dokument
Gültiges XML-Dokument
Wohlgeformtes XML-Dokument
Ein XML-Dokument gilt als wohlgeformt, wenn es den folgenden Regeln folgt.
XML-Dokumente ohne DTD müssen die vordefinierten Zeichenentitäten verwenden, die amp(&), apos (einfaches Anführungszeichen), g(>), quot (doppeltes Anführungszeichen) verarbeiten.
Muss der Reihenfolge der Tags folgen, d. h. die inneren Tags müssen geschlossen werden, bevor die äußeren Tags geschlossen werden.
Jedes Start-Tag muss ein End-Tag haben oder ein selbstschließendes Tag sein (b2386ffb911b14667cb8f0f91ea547a7...6e916e0f7d1e588d4f442bf645aedb2f oder d4bce3f20dbe5ab08417432e520da517).
Das Start-Tag darf nur ein Attribut enthalten und muss in Anführungszeichen gesetzt werden.
Mit Ausnahme der Entitäten amp(&), apos (einfaches Anführungszeichen), g(>) und quot (doppeltes Anführungszeichen) müssen andere Entitäten vor der Verwendung deklariert werden.
Beispiel
Das Folgende ist ein Beispiel für ein wohlgeformtes XML-Dokument:
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE address [ <!ELEMENT address (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <address> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </address>
Das obige Beispiel gilt als wohlgeformt, weil:
Es definiert den Dokumenttyp. Und hier ist der Dokumenttyp der Elementtyp.
enthält ein Stammelement mit dem Namen „Adresse“.
Jedes untergeordnete Element Name, Firma und Telefonnummer ist ein selbsterklärendes, ordnungsgemäß geschlossenes Tag.
Die Tags sind in der richtigen Reihenfolge.
Das obige ist der detaillierte Inhalt vonDetaillierte Einführung in Kodierungs- und Verifizierungsprobleme beim Schreiben von XML-Code. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!