ホームページ >バックエンド開発 >Python チュートリアル >Python による XML データの解析および分析テクノロジー
Python による XML データ解析および分析テクノロジ
XML (Extensible Markup Language) は、データの保存と送信に使用されるマークアップ言語です。 XML は、情報のやり取りやデータの保存に広く使用されています。 Python は、XML データを解析および分析するためのさまざまなライブラリとモジュールを提供します。この記事では、Python を使用して XML データを解析および分析する方法を説明し、いくつかのコード例を示します。
xml.etree.ElementTree ライブラリは、XML データを解析および操作するための Python の標準ライブラリで提供されています。このライブラリを使用して、XML ツリーを走査したり、要素を検索したり、要素の属性やテキスト コンテンツにアクセスしたりすることができます。
以下は簡単な XML の例です:
<book> <title>Python编程</title> <author>John Doe</author> <price>39.99</price> </book>
xml.etree.ElementTree ライブラリを使用して、XML データを Element オブジェクトに解析し、オブジェクトをトラバースすることで対応する情報を取得できます。
import xml.etree.ElementTree as ET # 解析XML数据 tree = ET.parse('book.xml') root = tree.getroot() # 遍历XML树 for child in root: print(child.tag, child.text) # 获取元素属性 title = root.find('title') print(title.get('lang')) # 获取元素文本内容 price = root.find('price').text print(price)
上記のコードは次の結果を出力します:
title Python编程 author John Doe price 39.99 None
from lxml import etree # 解析XML数据 tree = etree.parse('book.xml') root = tree.getroot() # 遍历XML树 for child in root: print(child.tag, child.text) # 获取元素属性 title = root.find('title') print(title.get('lang')) # 获取元素文本内容 price = root.find('price').text print(price)このコードは前の例とよく似ていますが、lxml ライブラリを使用します。 lxml ライブラリはよりシンプルで直接的に使用でき、コード ブロックはより簡潔であることがわかります。
XPath を使用して XML データを解析する
from lxml import etree # 解析XML数据 tree = etree.parse('book.xml') root = tree.getroot() # 使用XPath定位元素 title = root.xpath('/book/title')[0] price = root.xpath('/book/price')[0] # 获取元素文本内容 print(title.text) print(price.text)上記のコードでは、XPath 式
/book/title
および/book/ を使用しています。 Priceタイトル要素と価格要素をそれぞれ見つけます。測位結果の最初の要素をノードとして使用することで、対応するテキスト コンテンツを取得できます。
この記事の導入を通じて、Python を使用して XML データを解析および分析するテクノロジを学びました。 xml.etree.ElementTree と lxml ライブラリを使用して XML データを解析し、場所に XPath を使用する方法を学びました。これらのテクノロジーを習得すると、XML データをより簡単に処理し、必要な情報を抽出できるようになります。
以上がPython による XML データの解析および分析テクノロジーの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。