>백엔드 개발 >XML/RSS 튜토리얼 >XML 코드 작성 시 인코딩 및 확인 문제에 대한 자세한 소개

XML 코드 작성 시 인코딩 및 확인 문제에 대한 자세한 소개

黄舟
黄舟원래의
2017-03-10 19:35:501494검색

이 글에서는 XML 코드 작성의 인코딩 및 검증 문제를 주로 소개합니다. HTML과 마찬가지로 XML 파일의 인코딩도 서문에 지정할 수 있습니다. 필요한 친구는

인코딩을 참조하세요.

인코딩은 유니코드 문자를 동등한 이진 표현으로 변환하는 프로세스입니다. XML 핸들러는 XML 문서를 읽을 때 인코딩 유형에 따라 문서를 인코딩합니다. 따라서 XML 선언에서 인코딩 유형을 지정해야 합니다.

인코딩 유형
인코딩에는 크게 두 가지 유형이 있습니다.

UTF-8
UTF-16
UTF는 UCS 변환 형식을 나타내며, UCS 자체는 범용 문자 집합을 의미합니다. . 숫자 8 또는 16은 문자를 나타내는 비트 수를 나타냅니다. 8(1바이트) 또는 16(2바이트)입니다. 인코딩 정보가 없는 문서의 경우 기본적으로 UTF-8이 사용됩니다.

구문
XML 문서의 프롤로그에는 인코딩 정보가 포함되어 있습니다. UTF-8 인코딩 구문은 다음과 같습니다.

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

UTF-16 인코딩 구문은 다음과 같습니다.

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

아래 예제에서는 인코딩 선언을 보여줍니다.

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  
    Tanmay Patil  
    TutorialsPoint  
    (011) 123-4567  

위의 인코딩="UTF-8" 예제에서는 8비트 문자를 표시하도록 지정합니다. 16자를 사용하려면 UTF-16 인코딩을 사용하세요.

UTF-8을 사용하여 인코딩된 XML 파일은 UTF-16 형식의 파일보다 크기가 더 작습니다.

유효성 검사

유효성 검사는 XML 문서의 유효성을 검사하는 프로세스입니다. 문서의 내용이 요소, 속성 및 연관된 문서 유형 정의(DTD)와 일치하고 문서가 b로 표현된 제약 조건을 준수하는 경우 문서는 유효한 것으로 간주됩니다. XML 파서를 통해 유효성 검사를 처리하는 방법에는 두 가지가 있습니다.

잘 구성된 XML 문서
유효한 XML 문서
잘 구성된 XML 문서
XML 문서는 다음 규칙을 따르는 경우 올바른 형식으로 간주됩니다.

DTD가 없는 XML 문서는 amp(&), apos(작은따옴표), g(>), quot(큰따옴표)를 처리하는 미리 정의된 문자 엔터티를 사용해야 합니다.
태그 순서를 따라야 합니다. 즉, 외부 태그가 닫히기 전에 내부 태그가 닫혀야 합니다.
각 시작 태그에는 종료 태그가 있거나 자체적으로 닫히는 태그(b2386ffb911b14667cb8f0f91ea547a7...6e916e0f7d1e588d4f442bf645aedb2f 또는 d4bce3f20dbe5ab08417432e520da517)여야 합니다.
시작 태그에는 하나의 속성만 있어야 하며 따옴표로 묶어야 합니다.
amp(&), apos(작은따옴표), g(>), quot(큰따옴표) 항목을 제외한 다른 항목은 사용하기 전에 선언해야 합니다.

다음은 올바른 형식의 XML 문서의 예입니다.

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
<!DOCTYPE address   
[   
<!ELEMENT address (name,company,phone)>  
    <!ELEMENT name (#PCDATA)>  
    <!ELEMENT company (#PCDATA)>  
    <!ELEMENT phone (#PCDATA)>  
]>  
<address>  
    <name>Tanmay Patil</name>  
    <company>TutorialsPoint</company>  
    <phone>(011) 123-4567</phone>  
</address>

위 예는 다음과 같은 이유로 올바른 형식으로 간주됩니다.

문서 유형을 정의합니다. 여기서 문서 유형은 요소 유형입니다.
에는 address라는 루트 요소가 포함되어 있습니다.
각 하위 요소 이름, 회사 및 전화번호는 설명이 필요 없으며 올바르게 닫힌 태그입니다.
태그 순서가 올바른지 확인하세요.

위 내용은 XML 코드 작성 시 인코딩 및 확인 문제에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.