在 ElementTree 的“find”和“findall”方法中忽略 XML 命名空间
使用 ElementTree 模块解析和定位 XML 文档中的元素时,命名空间会带来复杂性。下面介绍了如何在 Python 中使用“find”和“findall”方法时忽略命名空间。
当 XML 文档包含命名空间时,会导致 ElementTree 模块在搜索标签时考虑它们,就会出现问题。这可能会导致意外结果,如问题中提供的示例所示:
<code class="python">el1 = tree.findall("DEAL_LEVEL/PAID_OFF") # Return None el2 = tree.findall("{http://www.test.com}DEAL_LEVEL/{http://www.test.com}PAID_OFF") # Return element</code>
要忽略名称空间,解决方案是在使用“find”或“之前修改已解析的 XML 文档中的标签” findall”方法。这可以使用 ElementTree 的 iterparse() 方法来实现:
<code class="python">import io from xml.etree import ElementTree as ET # Parse the XML document it = ET.iterparse(StringIO(xml)) # Iterate over each element and strip the namespace if present for _, el in it: _, _, el.tag = el.tag.rpartition("}") # strip ns # Get the modified root element root = it.root # Now, you can search for elements without namespaces el3 = root.findall("DEAL_LEVEL/PAID_OFF") # Return matching elements</code>
此解决方案修改解析文档中的标签,从而更轻松地定位元素,而无需手动为每个标签指定命名空间前缀。
以上是在 Python 中使用 ElementTree 的'find”和'findall”方法时如何忽略 XML 命名空间?的详细内容。更多信息请关注PHP中文网其他相关文章!