ホームページ >バックエンド開発 >Python チュートリアル >Python を使用して HTML を解析し、要素にアクセスするにはどうすればよいですか?
Python による HTML の解析
質問:
HTML 要素にアクセスして操作するにはどうすればよいですかPython パーサーを使用していますか? Firefox の「要素の検査」機能で表示されるネストされた構造に似た、構造化された形式でタグとそのコンテンツを取得できるモジュールが必要です。
答え:
BeautifulSoup
BeautifulSoup モジュールは、人気のある強力な Python ライブラリですHTML を解析するため。 HTML をネストされたデータ構造に変換して、HTML 要素に簡単にアクセスして移動できるようにします。
例:
指定した HTML ドキュメントを解析するには:
from bs4 import BeautifulSoup html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
「body」内の「container」div の内容を取得するにはtag:
print(parsed_html.body.find('div', attrs={'class':'container'}).text)
その他のオプション:
以上がPython を使用して HTML を解析し、要素にアクセスするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。