집 >백엔드 개발 >XML/RSS 튜토리얼 >XML의 문자 엔터티 및 문자 데이터에 대한 심층적인 이해
这篇文章主要介绍了XML中的字符实体与字符数据,文中所说的CDATA片段即是指字符数据即不由解析器解析的文本块,需要的朋友可以参考下
字符实体
在我们了解字符实体之前,先了解一下什么是 XML 实体。
W3 联盟 对实体的定义:文档实体作为实体树的根元素和 XML 处理程序的起点。
这意味着实体就是 XML 中的占位符。它们可以声明在文档序言或者DTD中。实体有不同的类型,本章后面会讨论字符实体。
HTML 和 XML 都有一些符号被保留使用,它们不能在 XML 代码中用作内容。例如,92d33664ec5f827b86e068a341370a86 符号被用作 XML 标签的开头和结尾。要显示这些特殊字符,就要使用字符实体。
有些特殊的字符或符号还不能直接使用键盘输入。可以使用字符实体来显示这些符号或特殊字符。
字符实体类型
有三种类型的字符实体:
预定义的字符实体。
编码字符实体。
命名字符实体。
预定义的字符实体
引入它们是为了避免使用某些有歧义的符号。例如,当我们把小于(1002bb67c963e002250114507804a6fd)符号当尖括号(a8093152e673feb7aba1828c43532094)使用时就会产生歧义。字符实体从根本上来说就是用来界定 XML 标签的。下面是一个来自 XML 规范的预定义字符实体列表。它们可以用来表示某些字符而不带歧义。
和号: &
单引号: '
大于: >
小于: 42d14128b93ed8d2fb5ef6ec27f6e02e
命名字符实体
正如上面所说的,数值字符很难记住,最受欢迎的字符实体类型是命名字符实体。因为每个实体都用一个名称标识。
例如:
'Aacute' 表示带重音符的大写 A 字符。 'ugrave' 表示带沉音符的小写 u。
CDATA 片段
术语 CDATA 就是字符数据。CDATA 被定义为不由解析器解析的文本块,但它被公认为标记。
标记中预定义的实体比如 <,> 和 & 需要手动输入并且通常难以阅读。这种情况下就可以使用 CDATA 片段。通过使用 CDATA 片段,我们可以告诉解析器文档的特定部分不包含标记,应该被当做普通文本对待。
语法
下面是 CDATA 片段的语法:
<![CDATA[ characters with markup ]]>
上面的语法由三个部分组成:
CDATA 开始部分 - CDATA 以9个字符的分隔符c13cca473a5f5fbc90a0d62326916109 分隔符结尾。
CData 部分 - 上面这两个标记之间的字符被解释为字符而不是标记。这个部分可以包含标记字符(bff82425ba327b991a066901888e460e 和 &),但是它们会被 XML 处理程序忽略。
示例
下面的标记代码展示了 CDATA。其中写在 CDATA 片段中的字符都会被解析器忽略。
<script> <![CDATA[ <message> Welcome to TutorialsPoint </message> ]] > </script>
在上述的语法中,761b5f615852937c78510c6ee32be47a 和 dc97c94abba54b3574a1f2a9fcb1679b 之间的所有内容都会被当做字符数据而不是标记。
CDATA 规则
XML CDATA 需要遵循以下规则:
XML 文档任何位置的 CDATA 都不能包含 "]]>" 字符。
CDATA 片段不可以嵌套。
위 내용은 XML의 문자 엔터티 및 문자 데이터에 대한 심층적인 이해의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!