Python中的XPath表達式用法
XPath是一種用於在XML和HTML文件中進行導航和尋找的語言,廣泛應用於資料抓取、Web自動化測試、文字擷取等領域。在Python中,我們可以使用lxml函式庫來解析XML和HTML文檔,並使用XPath表達式來定位和擷取所需的資料。
pip install lxml
from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse('example.html', parser)
xpath_expr = '//a'
nodes = tree.xpath(xpath_expr)
texts = [node.text for node in nodes] print(texts)
from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.html', parser) xpath_expr = '//a' nodes = tree.xpath(xpath_expr) links = [node.get('href') for node in nodes] print(links)以上就是Python中使用XPath表達式的基本用法。透過掌握XPath語法和使用lxml函式庫,我們能夠方便地對XML和HTML文件進行解析和資料擷取,為資料分析和網頁爬蟲等任務提供了強大的工具。 希望本文能幫助你了解並使用Python中的XPath表達式。祝你在資料處理和Web開發中取得成功!
以上是Python中的XPath表達式用法的詳細內容。更多資訊請關注PHP中文網其他相關文章!