집 >백엔드 개발 >XML/RSS 튜토리얼 >XML 시작하기
Standard Universal Markup Language의 하위 집합인 Extensible Markup Language는 전자 파일을 구조화하기 위해 표시하는 데 사용되는 마크업 언어입니다. 전자컴퓨터에서 태그란 컴퓨터가 이해할 수 있는 정보기호를 말한다. 이러한 태그를 통해 컴퓨터는 기사 등 다양한 정보를 처리할 수 있다. 데이터를 표시하고 데이터 유형을 정의하는 데 사용할 수 있습니다. 사용자가 자신의 마크업 언어를 정의할 수 있는 소스 언어입니다. 이는 World Wide Web 전송에 이상적으로 적합하며 응용 프로그램이나 공급업체와 관계없이 구조화된 데이터를 설명하고 교환하는 통합된 접근 방식을 제공합니다. 인터넷 환경에서 크로스 플랫폼, 콘텐츠 의존적 기술이며 오늘날 분산된 구조화된 정보를 처리하는 데 효과적인 도구이기도 합니다. 이미 1998, W3C에서 XML1.0 사양을 발표했습니다. 인터넷을 통한 문서 정보 전송을 단순화합니다.
1969년, GML(일반화 마크업 언어 일반화 마크업 언어)---->1985연도,SGML(표준 일반화 마크업 언어)--- > ;1993년, HTML(Hypertext Markup LanguageHypertext Markup Language)--->1998 연도, XML(Extensible Markup LanguageExtensible Markup Language)
1, Extensible Markup Language는 Hypertext Markup Language와 매우 유사한 마크업 언어입니다.
2 데이터를 표시하는 것이 아닌 데이터를 전송하도록 설계되었습니다.
3 태그는 미리 정의되어 있지 않습니다. 라벨을 직접 정의해야 합니다.
4, 자기 설명적으로 디자인되었습니다.
5 W3C의 권장 규격입니다.
1은 Hypertext Markup Language를 대체하지 않습니다.
2, Hypertext Markup Language의 보충입니다.
3, Hypertext Markup Language와는 다른 목적으로 설계되었습니다:
4, 데이터를 전송하고 저장하도록 설계되었습니다. 데이터의 내용입니다.
5. 하이퍼텍스트 마크업 언어는 데이터의 모양에 중점을 두고 데이터를 표시하도록 설계되었습니다.
6 하이퍼텍스트 마크업 언어는 정보를 표시하는 언어이자 정보를 전달하는 언어입니다.
7 가장 잘 설명하면 소프트웨어와 하드웨어에 독립적인 정보 전송 도구입니다.
1, 불규칙한 데이터 전송 문제를 해결합니다.
2는 트리 구조로 사물을 매우 잘 설명할 수 있습니다.
3, 구성 파일로 사용할 수 있습니다.
PS: 요즘 많은 언어와 기술에서는 XML을 데이터 전송 표준으로 사용하고 있습니다. , 따라서 XML에 대한 깊은 이해는 일반적인 데이터 전송 프로토콜을 마스터하는 것과 같습니다.
참고문서: http://www.php.cn/
사례:
아아아아一个XML文件可分为如下几部分内容:
文档声明 、元素、属性、注释 、CDATA区 ,特殊字符 、处理指令(processing instruction)
基本语法:
<?xml version="1.0" encoding="UTF-8"?> <!-- 上面是文档声明 - -> <?xml-stylesheet type="text/css" href=”XML2.css”?> <!-- 上面是处理指令 - -> <根元素> <!-- 注释 - -> <![CDATA[ CDATA区,可以是任意字符 ]]> <元素 属性=”属性值”> <元素>元素内容</元素> <空元素/>> </元素> </class>
<?xml version="1.0" encoding=“编码方式" standalone="yes|no"?>
XML声明放在XML文档的第一行
XML声明由以下几个部分组成:
version - -文档符合XML1.0规范
encoding - -文档字符编码,比如”utf-8”
standalone - -文档定义是否独立使用
standalone="yes“
standalone=“no” 默认
PS:虽说现在XML出了2.0版了,但是现在大多还是用1.0版。
基本语法:
<元素>元素内容</元素> <元素/>
注意事项:
1、每个XML文档必须有且只有一个根元素。
2、根元素是一个完全包括文档中其他所有元素的元素。
3、根元素的起始标记要放在所有其他元素的起始标记之前。
4、根元素的结束标记要放在所有其他元素的结束标记之后。
5、XML元素指XML文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:
包含标签体:3499910bf9dac5ae3c52d5ede73834851235db79b134e9f6b82c0b36e0489ee08ed
不含标签体的:3499910bf9dac5ae3c52d5ede73834855db79b134e9f6b82c0b36e0489ee08ed, 简写为:7d01d0a03a49fceb57d12197d8d196cb
6、一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套 ,例如:
3499910bf9dac5ae3c52d5ede7383485hello a4b561c25d9afb9ac8dc4d70affff419world5db79b134e9f6b82c0b36e0489ee08ed0d36329ec37a2cc24d42c7229b69747a
7、对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。
例如:
3499910bf9dac5ae3c52d5ede73834851235db79b134e9f6b82c0b36e0489ee08ed和3499910bf9dac5ae3c52d5ede7383485 123 5db79b134e9f6b82c0b36e0489ee08ed意义是完全不同的。
8、一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:
1---区分大小写,例如,64e5601d0a941f4972a2954192bdae18和e388a4556c0f65e1904146cc1a846bee是两个不同的标记。
2---不能以数字或"_" (下划线)开头。
3---不能包含空格。
4---名称中间不能包含冒号(:)。
9、元素、标签、节点意义都是一样的。
基本语法
<元素 属性1=”属性值” 属性2=”属性值”>元素内容</元素>
注意事项:
1、属性值用双引号(")或单引号(')分隔(如果属性值中有',用"分隔;有",用'分隔)
2、一个元素可以有多个属性,它的基本格式为:
3、属性名称在同一个元素标记中只能出现一次
4、属性值不能包括83992e84119b8649428fe2de73af99ef, &之类的特殊字符,否则需要使用转义字符。
这个和HTML一样,都是c2a54aadee89294d3edc03e4891272d5,同样也不能注释嵌套,不能放在元素名中间。
有些内容可能不想让解析引擎解析执行,而是当作原始内容处理,用于把整段文本解释为纯字符数据而不是标记的情况。包含大量509d37b71e5ee94f7a50f124edbc8c3f、&或者"字符。CDATA区中的所有字符都会被当作元素字符数据的常量部分,而不是XML标记。
PS:CDATA区可以用于传递特殊字符,传递文件数据。可以通过将图片这类二进制文件以byte[]的形式放入CDATA区中,需要使用时在以byte[]的方式读出。
处理指令,简称PI (Processing Instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。
处理指令必须以“0f7ea912b4bec2649ab2166088880186”作为结尾,XML声明语句就是最常见的一种处理指令。 例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容。
案例:
<?xml version="1.0" encoding="utf-8"?> <?xml-stylesheet href="XML2.css" type="text/css"?> <class> <student> <name>张三</name> <sex>男</sex> <age>20</age> </student> <student> <name>李四</name> <sex>女</sex> <age>18</age> </student> </class>
XML2.css
name { font-size: 20px; font-weight: bold; color: red; } sex{ font-size: 30px; font-weight: bolder; color: blue; } age{ font-size: 25px; font-weight: bolder; color: blue; }
1、XML必须有且仅有一个根元素
2、元素大小写敏感
3、元素不能以数字,下划线开头
4、属性值用引号
5、属性值如果有特殊字符要用实体表示
6、同一元素的属性必须唯一,属性值可以不唯一
7、非空元素标记必须成对
8、空标记要写关闭符号
9、元素必须正确嵌套
10、元素中可以包含字母、数字或者其它字符(支持中文)
11、元素中不能含空格
12、元素中不能含冒号(注:冒号留给命名空间使用)
以上就是XML入门的内容,更多相关内容请关注PHP中文网(www.php.cn)!