一、文档规则
1.区分大小写。
2.属性值必须加引号(单引号、双引号都可以),一般情况下建议使用使用双引号。
3.所有标记必须有结束符号。
4.所有空标记必须关闭。
5.必须有且仅有一根元素。
6.解析空白字符时,会按照实际内容输出,不会缩略。
7.特殊字符处理:
字符 替换字符
& &
" &quto;
' '
8.标记名称约定:
a.可以包含字母、数字、其他字符。
b.不能以数字和下划线开头。
c.不能以xml或者Xml之类的字符开头。
d.不能包含空格
二、xml声明
xml声明标准语句:
强调:
1.“2.”?>"之前可以有空格,也可以没有。
3.enconding和standalone是可选属性,encoding默认值是"UTF-8",standalone默认值是"no"。
4.常见的编码方式有:
简体中文:GB2312
繁体中文 :BIG5
西欧字符:UTF-8,UTF-16
5.standalone表示文档是否附带DTD文件。
三、xml属性
因为数据既可以存储在子元素中也可以存储在属性中,那么何时用属性,何时用子元素,没有固定规则,但是建议:元数据应该以属性的方式存储,而数据本身应该以元素的形式存储。
使用属性会引发以下问题:
1.属性不能包含多个值(子元素可以)。
2.属性不容易扩展。
3.属性不能描述结构(子元素可以)。
4.属性很难通过DTD进行测试。
四、命名空间
声明命名空间俩种方式:
1.默认声明,所有元素不需要指定前缀,如:
……
2.明确声明,xmlns关键字与一个命名空间的URI的前缀相关联,所有元素都需要指定前缀,如:
……
强调:用来表示命名空间的URI并不被XML解析器调用,实际上并不去访问这个URI,它只是表示一个标识名字而已。
五、XML专用标记:CDATA
CDATA的全称是Character DATA,即字符数据,它主要用来显示特殊字符,比如"CDATA的语法格式为:
如:
]]>
强调:CDATA不能嵌套;要显示的字符中不能包含"]]>"。