ホームページ >ウェブフロントエンド >htmlチュートリアル >お見逃しなく: lxml セレクターでサポートされる機能を理解する
lxml がサポートするセレクターを知りたいですか?見逃せないガイドです!
概要
セレクターは、Python の HTML または XML 解析に lxml を使用する場合に非常に重要な機能の 1 つです。セレクターを使用すると、開発者は CSS セレクターまたは XPath 式を通じて HTML または XML ドキュメントから特定の要素を選択できます。 lxml ライブラリは強力な解析機能を提供するだけでなく、さまざまなセレクターもサポートしているため、開発者はニーズに応じて適切なメソッドを柔軟に選択できます。
CSS セレクター
まず、lxml ライブラリでサポートされている CSS セレクターを見てみましょう。 CSS セレクターは、CSS スタイルに似た構文を使用して要素を選択する方法です。一般的に使用される CSS セレクターの例をいくつか示します。
タグ名で要素を選択します。
from lxml import etree html = ''' <html> <body> <p>Hello, World!</p> <div> <p>lxml tutorial</p> <a href="https://www.example.com">example.com</a> </div> </body> </html> ''' tree = etree.HTML(html) elements = tree.cssselect('p')
上記の例では、 要素
には、<p></p>
タグを持つすべての要素が含まれます。
クラス セレクターによる要素の選択:
elements = tree.cssselect('.example')
上記の例では、.example
によってすべてのクラスが選択されます。 example
という名前。
ID セレクターで要素を選択:
element = tree.cssselect('#main') ```` 在上面的示例中,`#main`将选择ID为`main`的元素。 XPath选择器 lxml库还支持XPath选择器,它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例:
タグ名で要素を選択:
elements = tree.xpath('//p')
上記の例では、 elements
には、すべての <p></p>
要素が含まれます。
属性セレクターによる要素の選択:
elements = tree.xpath('//a[@href="https://www.example.com"]')
上記の例では、elements
は href
を持つすべての要素を選択します。属性値が https://www.example.com
である <a></a>
タグを持つ要素。
テキスト コンテンツによる要素の選択:
element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
上記の例では、element
はテキスト コンテンツを含む要素を "lxml チュートリアルとして選択します。
タグの「
」要素。
階層による要素の選択:
在上面的示例中,`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。 总结
以上がお見逃しなく: lxml セレクターでサポートされる機能を理解するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。