>백엔드 개발 >XML/RSS 튜토리얼 >XML 구조 및 구문에 대한 자세한 소개

XML 구조 및 구문에 대한 자세한 소개

黄舟
黄舟원래의
2017-03-24 17:09:231347검색

이제 메모장을 사용하여 XML 파일을 만들어 보겠습니다. 먼저 XML 파일을 살펴보세요.

예 1:

〈?xml version="1.0" encoding="gb2312" ?〉
〈参考资料〉
〈书籍〉
〈名称〉XML入门精解〈/名称〉
〈作者〉张三〈/作者〉
〈价格 货币单位="人民币"〉20.00〈/价格〉
〈/书籍〉
〈书籍〉
〈名称〉XML语法〈/名称〉
〈!--此书即将出版--〉
〈作者〉李四〈/作者〉
〈价格 货币单位="人民币"〉18.00〈/价格〉
〈/书籍〉
〈/参考资料〉

이것은 일반적인 XML 파일입니다. 편집한 후 .xml 접미사가 붙은 파일로 저장하세요. 이 파일을 파일 서문(프롤로그)과 파일 본문의 두 가지 주요 부분으로 나눌 수 있습니다. 이 파일의 첫 번째 줄은 파일 서문입니다. 이 줄은 XML 파일이 선언해야 하는 항목이며 XML 파일의 첫 번째 줄에도 있어야 합니다. 주로 XML 파서의 작동 방법을 알려줍니다. 그 중 버전은 이 XML 파일에 사용되는 표준 버전 번호를 나타내며, 인코딩은 이 XML 파일에 사용되는 문자 유형 을 나타내며, 이 문을 생략할 경우 다음은 생략 가능합니다. 문자코드는 유니코드 문자코드이어야 합니다(생략하지 않는 것이 좋습니다). 이 예에서는 GB2312 문자 코드를 사용하고 있으므로 인코딩 문을 생략할 수 없습니다. 파일의 서문에도 몇 가지 선언문이 있는데, 이에 대해서는 나중에 소개하겠습니다.

파일의 나머지 부분은 파일 본문에 속하며 XML 파일의 내용 정보가 여기에 저장됩니다. 파일의 본문이 시작 및 끝 제어 태그로 구성되어 있음을 알 수 있습니다. 이를 XML 파일의 "루트 요소"라고 합니다. 루트 요소 바로 아래에는 "책" 아래에 "이름", "저자" 및 "가격"과 같은 하위 요소가 있습니다. 통화 단위는 요소의 "속성"이고, "RMB"는 "속성 값"입니다.

〈!--이 책은 곧 출간됩니다--〉이 문장은 HTML과 동일하며, XML 파일에서 주석 부분은 "〈!--" 사이에 위치합니다. 부품 사이에는 "-->" 태그가 있습니다.

보시다시피 XML 파일은 매우 간단합니다. HTML과 마찬가지로 XML 파일도 일련의 태그로 구성됩니다. 그러나 XML 파일의 태그는 자체 사용자 정의 태그이므로 태그 내용의 의미를 명확하게 설명할 수 있습니다.

XML 파일에 대한 대략적인 인상을 받은 후, XML 파일의 구문에 대해 자세히 이야기해 보겠습니다. 문법에 대해 이야기하기 전에 중요한 개념인 XML Parse를 이해해야 합니다.

1. XML 파서

파서의 주요 기능은 XML 파일에 구조적 오류가 있는지 확인하고 XML 파일의 태그를 제거한 후 올바른 내용을 읽어오는 것입니다. 다음 One-step 신청 처리로 넘어갑니다. XML은 파일 정보를 구조화하는 데 사용되는 마크업 언어입니다. XML 사양에는 파일 구조를 표시하는 방법에 대한 자세한 규칙이 있습니다. 파서는 이러한 규칙에 따라 작성된 소프트웨어입니다(주로 Java로 작성됨). HTML과 마찬가지로 브라우저에도 HTML 파서가 있어야 브라우저가 HTML 태그로 구성된 다양한 웹 페이지를 "읽고" 우리 앞에 표시할 수 있습니다. 브라우저의 HTML 파서가 읽을 수 없는 태그가 있는 경우 오류 메시지가 반환됩니다.

현재 HTML 태그는 실제로 상당히 혼란스럽고 비표준 태그가 많기 때문에(일부 웹페이지는 IE에서는 정상적으로 표시될 수 있지만 Netscape Navigator에서는 표시되지 않음) 처음부터 디자이너들은 XML의 구문과 구조는 엄격하게 규정되어 있습니다. 우리가 작성하는 XML 파일은 이러한 규정을 준수해야 합니다. 그렇지 않으면 XML 파서가 오류 메시지를 무자비하게 표시합니다.

XML 파일에는 두 가지 유형이 있습니다. 하나는 Well-Formed XML 파일이고 다른 하나는 Validating XML 파일입니다.

XML 파일이 XML 사양의 특정 관련 규칙을 만족하고 DTD(Document Format Definition - 자세한 내용은 나중에 설명)를 사용하지 않으면 Well-Formed라고 할 수 있습니다. XML 파일이 올바른 형식이고 DTD가 올바르게 사용되고 DTD의 구문이 올바른 경우 파일은 유효성 검사 중입니다. 두 개의 XML 파일에 해당하는 두 개의 XML 파서가 있는데, 하나는 Well-Formed 파서이고 다른 하나는 Validating 파서입니다. IE 5에는 Well-Formed XML 파일을 구문 분석하는 데에도 사용할 수 있는 유효성 검사 구문 분석기가 포함되어 있습니다.

Well-Formed 조건을 만족하는지 확인해보세요. 방금 편집한 첫 번째 XML 파일을 IE 5 이상의 브라우저에서 열 수 있습니다.

왜 브라우저에 표시되는 내용이 내 소스 파일과 같은지 궁금하시죠? 맞습니다. XML 파일의 경우 내용만 알고 표시 형식은 CSS 또는 XSL로 완성되기 때문입니다. 여기서는 이 XML 파일에 대한 CSS 또는 XSL 파일을 정의하지 않았으므로 원래 형식으로 표시됩니다. 실제로 전자 데이터 교환에는 XML 파일만 필요합니다. 이를 어떤 형식으로 표시하려면 CSS 또는 XSL 파일을 편집해야 합니다(이 문제는 나중에 논의됩니다).

2. Well-Formed XML 파일

파서가 XML을 올바르게 구문 분석하고 브라우저에 표시하려면 XML이 Well-Formed여야 함을 알고 있습니다. 그렇다면 Well-Formed XML 파일이란 무엇입니까? XML 파일을 생성할 때 반드시 준수해야 하는 지침은 주로 다음과 같습니다.

1.XML文件的第一行必须是声明该文件是XML文件以及它所使用的XML规范版本。在文件的前面不能够有其它元素或者注释。

2.在XML文件中有且只能够有一个根元素。我们的第一个例子中,〈参考资料〉... 〈/参考资料〉就是此XML文件的根元素。

3.在XML文件中的标记必须正确地关闭,也就是说,在XML文件中,控制标记必 须有与之对应的结束标记。如:〈名称〉标记必须有对应的〈/名称〉结束标记,不像HTML,某些标记的结束标记可有可无。如果在XML文件中遇到自成一个单元的标记,就是类似于HTML 中的〈img src=.....〉的这些没有结束标记的时候,XML把它称为“空元素”,必须用这样的写法:〈空元素名/〉,如果元素中含有属性时写法则为:〈空元素名 属性名=“属性值”/〉。

4.标记之间不得交叉。在以前的HTML文件中,可以这样写:

〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉

标记之间有相互重叠的区域,而在XML中,是严格禁止这样标记交错的写法,标记必须以规则性的次序来出现。

5.属性值必须要用“ ”号括起来。如第一个例子中的“1.0”、“gb2312”、“人民币”。都是用“ ”号括起来了的,不能漏掉。

6.控制标记、指令和属性名称等英文要区分大小写。与HTML不同的是,在HTML中, 类似〈B〉和〈b〉的标记含义是一样的,而在XML中,类似〈name〉、〈NAME〉或〈Name〉这样的标记是不同的。

7.我们知道,在HTML文件中,如果我们要浏览器原封不动地将我们所输入的东西显示出来,可以将这些东西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉标记中间。这对于我们创建HTML教学的网页是必不可少的,因为网页中要显示HTML的源代码。而在XML中,要实现这样的功能,就必须使用CDATA标记。在CDATA标记中的信息被解析器原封不动地传给应用程序,并且不解析该段信息中的任何控制标记。CDATA区域是由:“〈![CDATA[”为开始标记,以“>〉”为结束标记。例如:例2中的源码,除了“〈![CDATA[”和“>〉”符号,其余的内容解析器将原封不动地交给下游的应用程序,即使CDATA区域中的开始和结尾的空白以及换行字符等,都同样会被转交(注意CDATA是大写的字符)。

例2:

〈![CDATA[飞翔的xml〉〉〉〉〉,:-)
oooo〈〈〈〈〈〈〈
>〉

8.XML处理空白字符和HTML不一样。HTML标准规定,不管有多少个空白,都当作一个空白来处理;而在XML中规定,所有标记以外的空白,解析器都要忠实地交给下游的应用程序处理。这样,我们有时必须摒弃编写HTML文件时的缩排习惯,因为缩排的空格,解析器也要处理。如:

〈作者〉张三〈/作者〉
和
〈作者〉
张三
〈/作者〉

上述内容对于解析器来说是不同的(后者在〈作者〉〈/作者〉标记之内除了张三这个字符以外,还包括两个换行记号以及“张三”前的文字缩排符号)。所以解析器在去掉标记后将信息传给应用程序将有不同的处理结果。

如果我们想明确地告诉XML程序,标记中的空白有明确的含义,不要随便去掉(如在一些诗中,空格有它具体的意义),则可在标记中加入一个XML内置的属性——xml:space 。如(注意属性名称和值的大小写):

〈诗歌 xml:space="preserver"〉
祖国啊! 祖国!
我的祖国!
〈/诗歌〉

另外,在XML文件中,如果要用到表1的特殊字符,必须用相应符号代替。

表1:

特殊字符     替代符号
 &&       &
 <       &it;
 >       >
 "       "
 &#39;      &apos;

小结:

符合上述规定的XML文件就是Well-Formed的XML文件。这是编写XML文件的最基本要求。可以看到XML文件的语法规定比HTML要严格多了。由于有这样的严格规定,软件工程师编写XML的解析器就容易多了,不像编写HTML语言的解析器,必须费尽心思去适应不同的网页写法,提高自己浏览器的适应能力。实际上,这对于我们初学者来说,也是一件好事。该怎样就怎样,不必像原来那样去疑惑各种HTML的写法。

XML 파일에서 사용되는 대부분의 태그는 맞춤 태그인 것을 알 수 있습니다. 그런데 생각해보면, 같은 업종에 종사하는 A, B 두 회사가 XML 파일을 이용하여 서로 데이터를 교환하고자 한다면, A 회사는 태그를 사용하여 제품의 가격 정보를 나타내고, B 회사는 태그를 사용할 수 있습니다. 가격> 가격 정보를 나타냅니다. XML 애플리케이션이 해당 XML 파일의 정보를 읽는 경우 태그가 가격 정보를 나타낸다는 것만 알면 B사의 가격 정보를 읽을 수 없으며 오류가 발생합니다. 분명히 XML 파일을 사용하여 정보를 교환하려는 엔터티의 경우 그들 사이에 합의가 있어야 합니다. 즉, XML 파일을 작성하는 데 사용할 수 있는 태그, 상위 요소에 포함될 수 있는 하위 요소, 순서 각 요소가 어떤 요소로 나타나는지, 속성을 정의하는 방법 등이 나와 있습니다. 이렇게 하면 XML로 데이터를 교환할 때 원활한 통신이 가능합니다. 이 규칙을 DTD(Document Type Definition, 문서 형식 정의)라고 합니다. DTD를 XML 파일 작성을 위한 템플릿으로 생각할 수 있습니다. 동일한 업계 간의 XML 데이터 교환의 경우 고정된 DTD를 갖는 것이 훨씬 더 편리합니다. 예를 들어, 인터넷상의 주요 전자 쇼핑몰의 XML 웹 페이지가 모두 동일한 DTD를 따른다면, 우리는 이 DTD를 기반으로 애플리케이션을 쉽게 작성하여 온라인에서 관심 있는 항목을 자동으로 캡처할 수 있습니다. 실제로 앞서 언급한 MathML, SMIL 등과 같이 잘 정의된 DTD가 이미 여러 개 있습니다.

XML 파일이 올바른 형식이고 DTD를 기반으로 올바르게 생성된 경우 XML 파일 이름은 Validating XML file입니다. 해당 파서는 Validating Parser라고 합니다.

위 내용은 XML 구조 및 구문에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.