Rumah > Artikel > hujung hadapan web > Panduan Jangan Terlepas: Memahami Ciri-ciri yang Disokong oleh Pemilih lxml
Ingin tahu pemilih apa yang disokong oleh lxml? Panduan yang tidak boleh dilepaskan!
Ikhtisar
Pemilih adalah salah satu ciri yang sangat penting apabila menggunakan lxml untuk penghuraian HTML atau XML dalam Python. Pemilih membenarkan pembangun memilih elemen tertentu daripada dokumen HTML atau XML melalui pemilih CSS atau ungkapan XPath. Pustaka lxml bukan sahaja menyediakan fungsi penghuraian yang berkuasa, tetapi juga menyokong pelbagai pemilih, membolehkan pembangun memilih kaedah yang sesuai secara fleksibel mengikut keperluan mereka.
Pemilih CSS
Mula-mula, mari kita lihat pemilih CSS yang disokong dalam pustaka lxml. Pemilih CSS ialah cara untuk memilih elemen menggunakan sintaks yang serupa dengan gaya CSS. Berikut ialah beberapa contoh pemilih CSS yang biasa digunakan:
Memilih elemen mengikut nama teg:
from lxml import etree html = ''' <html> <body> <p>Hello, World!</p> <div> <p>lxml tutorial</p> <a href="https://www.example.com">example.com</a> </div> </body> </html> ''' tree = etree.HTML(html) elements = tree.cssselect('p')
Dalam contoh di atas, elemen
akan mengandungi semua <p> elemen tag. <code>elements
将包含所有<p></p>
标签的元素。
通过类选择器选择元素:
elements = tree.cssselect('.example')
在上面的示例中,.example
将选择所有类名为example
的元素。
通过ID选择器选择元素:
element = tree.cssselect('#main') ```` 在上面的示例中,`#main`将选择ID为`main`的元素。 XPath选择器 lxml库还支持XPath选择器,它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例:
通过标签名称选择元素:
elements = tree.xpath('//p')
在上面的示例中,elements
将包含所有<p></p>
标签的元素。
通过属性选择器选择元素:
elements = tree.xpath('//a[@href="https://www.example.com"]')
在上面的示例中,elements
将选择所有具有href
属性值为https://www.example.com
的<a></a>
标签的元素。
通过文本内容选择元素:
element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
在上面的示例中,element
将选择包含文本内容为"lxml tutorial"
的<p></p>
在上面的示例中,`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。 总结<p></p>
.example
akan memilih semua kelas bernama example code> elemen . <ol start="3">🎜🎜Pilih elemen mengikut pemilih ID: 🎜rrreee🎜🎜🎜Pilih elemen mengikut nama tag: 🎜rrreee🎜Dalam contoh di atas, <kod>elemen</kod>
</ol>
akan mengandungi semua . 🎜🎜🎜🎜Pilih elemen melalui pemilih atribut: 🎜rrreee🎜 Dalam contoh di atas, elemen
akan memilih semua elemen yang mempunyai nilai atribut href
sebagai https:/ / Elemen teg
. 🎜🎜🎜🎜Pilih elemen mengikut kandungan teks: 🎜rrreee🎜 Dalam contoh di atas, <a></a>
www.example.comelemen
akan memilih "lxml tutorial"
The elemen teg p>. 🎜🎜🎜🎜Pilih elemen mengikut hierarki: 🎜🎜🎜rrreee
Atas ialah kandungan terperinci Panduan Jangan Terlepas: Memahami Ciri-ciri yang Disokong oleh Pemilih lxml. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!