ホームページ >バックエンド開発 >Python チュートリアル >Python での XPath 式の使用法
XPath 式の Python での使用法
XPath は、XML および HTML ドキュメント内を移動および検索するための言語であり、データ スクレイピング、Web 自動テスト、テキストで広く使用されています。抽出およびその他の分野。 Python では、lxml ライブラリを使用して XML ドキュメントと HTML ドキュメントを解析し、XPath 式を使用して必要なデータを検索して抽出できます。
pip install lxml
from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse('example.html', parser)
xpath_expr = '//a'
nodes = tree.xpath(xpath_expr)
texts = [node.text for node in nodes] print(texts)
以下は、データを抽出する方法を示す完全なサンプル コードです。 HTML ドキュメントからすべてのリンクを抽出します:
from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.html', parser) xpath_expr = '//a' nodes = tree.xpath(xpath_expr) links = [node.get('href') for node in nodes] print(links)
上記は、Python での XPath 式の基本的な使用法です。 XPath 構文をマスターし、lxml ライブラリを使用すると、XML ドキュメントや HTML ドキュメントからデータを簡単に解析して抽出でき、データ分析や Web クローリングなどのタスクに強力なツールを提供できます。
この記事が、Python での XPath 式の理解と使用に役立つことを願っています。データ処理と Web 開発での成功を祈っています。
以上がPython での XPath 式の使用法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。