ホームページ >バックエンド開発 >PHPチュートリアル >selenium_PHP チュートリアルの Webdriver による部分的な HTML 抽出

selenium_PHP チュートリアルの Webdriver による部分的な HTML 抽出

WBOY
WBOYオリジナル
2016-07-12 08:56:321353ブラウズ

Selenium での Webdriver の部分的な HTML 抽出

Selenium の Webdriver が driver.page_source を使用しているとは言わないでください。スープを作成するたびに HTML ドキュメント全体を抽出する必要はありません。なぜなら、以下のような左右構造のフォーラムの場合、各コンテンツの変更は実際には HTML ページ全体のごく一部に過ぎないため、Web サイト全体の MOOC コースのコメントをすべてクロールダウンしたい場合、どれだけ役に立たないことになるからです。仕事しなきゃいけないの!
しかし、Baidu は中国語のコンテンツを検索しましたが、答えは見つかりませんでした。そこで Google に行ったところ、この質問に対する世界中の上級者からの回答がすでにあることがわかりました:

主なアイデアは、次のように get_attribute メソッドを使用して innerHTML を抽出することです:

検証後は、すべて OK です。 :

www.bkjia.com本当http://www.bkjia.com/PHPjc/1112548.html技術記事 Selenium の Webdriver による部分的な HTML 抽出 Selenium の Webdriver が driver.page_source を使用しているとは言わないでください。スープのために毎回 HTML ドキュメント全体を抽出する必要はありません。だって、そうですよね...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。