XPath 式の Python での使用法
XPath は、XML および HTML ドキュメント内を移動および検索するための言語であり、データ スクレイピング、Web 自動テスト、テキストで広く使用されています。抽出およびその他の分野。 Python では、lxml ライブラリを使用して XML ドキュメントと HTML ドキュメントを解析し、XPath 式を使用して必要なデータを検索して抽出できます。
pip install lxml
from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse('example.html', parser)
xpath_expr = '//a'
nodes = tree.xpath(xpath_expr)
texts = [node.text for node in nodes] print(texts)
以下は、データを抽出する方法を示す完全なサンプル コードです。 HTML ドキュメントからすべてのリンクを抽出します:
from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.html', parser) xpath_expr = '//a' nodes = tree.xpath(xpath_expr) links = [node.get('href') for node in nodes] print(links)
上記は、Python での XPath 式の基本的な使用法です。 XPath 構文をマスターし、lxml ライブラリを使用すると、XML ドキュメントや HTML ドキュメントからデータを簡単に解析して抽出でき、データ分析や Web クローリングなどのタスクに強力なツールを提供できます。
この記事が、Python での XPath 式の理解と使用に役立つことを願っています。データ処理と Web 開発での成功を祈っています。
以上がPython での XPath 式の使用法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。