解析XML

Barbara Streisand
Barbara Streisand原创
2024-09-27 20:32:29676浏览

Parsing XML

HTML 是 Web 开发中最常见的标记语言。 HTML 是 XML 的超集,也就是说它是 XML 规范的扩展。这个事实的最酷之处在于,Web 浏览器在呈现 HTML 的能力方面实际上配备了 XML 解析器,并且在幕后具有 XML 解析功能。

为什么要考虑 XML

HTML 是互联网开发人员普遍使用的标记语言。该博客的读者(软件工程师)可能只需要 HTML。然而,我的媒体公司与许多非技术领域的作者打交道,我不得不说...作者对他们内容的看法与 HTML 所认为的不同。

XML 的美妙之处在于它的通用 结构,它允许自定义解析和处理。这种灵活性在 HTML 中得到了完美的体现,但是 允许自定义定义 的用例可以通过 XML 更好地处理。

XML 是一种数据承载语言。 HTML 是该语言的扩展,带有标准化的图形用户界面呈现。要了解我的意思,请在浏览器中打开一个 XML 文件。 https://alexason.com/uploads/library.xml

正如您将看到的,现代浏览器渲染带有元素标签的文件。但还要注意,浏览器会识别数据类型,并应用特殊格式。这样看来,XML 更像是 JSON。


解析XML

虽然不是浏览器渲染代理原生的,但可以使用浏览器 API 的 DOMParser 来解析 XML。

看到要点就是行动
const xmlString = `
  <story>
    <styles>
      <titleStyle>
        <color>#4A90E2</color>
      </titleStyle>
      <paragraphStyle>
        <color>#333333</color>
      </paragraphStyle>
    </styles>
    <title>Elena and the Embrace of Holiness</title>
    <paragraph>In the heart of the village, where the sun kissed the earth...</paragraph>
    <!-- More paragraphs here -->
  </story>`;

const parser = new DOMParser();
const xmlDocument = parser.parseFromString(xmlString, "text/xml");
const parserError = xmlDoc.getElementsByTagName("parsererror");
if (parserError.length > 0) {
  // Handle error
  console.error("Error parsing XML:", parserError[0].textContent);
} else {
  // Successfully parsed the XML
  // XML Document contains a document
  console.log("Parsed XML Document:", xmlDocument);
  const title = xmlDocument.getElementsByTagName("title")[0].textContent;
  const titleColor = xmlDocument.getElementsByTagName("color")[0].textContent;
}


真实用例

所示示例演示了 XML 的可能性,但渲染和样式化内容的用例最好由 HTML 处理。虽然格式类似于 HTML,但使用 XML 作为 HTML 不一定是 XML 的最佳情况。

我认识的 HTML 开发人员 Israel 是这样编写 XML 的。他使用数据格式重新创建 HTML,然后使用 JavaScript 将其变成 HTML。虽然考虑到 XML 的灵活性,这是可能的,但如果用例适用于浏览器,我会告诉你我告诉 Israel 的话:“只需编写 HTML!”

加入以色列和 HTML 开发者的拯救行列。

在哪里使用 XML

XML 是一种很好的中间表示格式。如前所述,我公司的直接用例是将许多不同作者(书籍作者、手稿作者)的作品表述转换为标准化格式。任务是将 Word 文档、PDF、纯文本和口语单词转换为某种类似的数据格式。

XML 可以 做到这一点,并且在 Calibre 和 Manuskript 等软件程序中正是如此使用。


这是对 XML 的了解。它是一种广泛认可的格式,与许多阅读器和转换工具兼容。由于 XML 易于解析、W3C 推荐且普遍存在,因此它是一种用于无限期数据存储的安全语言。

如果您对数据科学和存储工具感兴趣,请务必关注此 Dev.to。添加反应?了解更多这样的内容。

一个

以上是解析XML的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn