ホームページ  >  記事  >  バックエンド開発  >  リクエストと lxml を使用してクローラーを実装するチュートリアルの例

リクエストと lxml を使用してクローラーを実装するチュートリアルの例

PHP中文网
PHP中文网オリジナル
2017-06-20 14:46:432112ブラウズ

# ページをリクエストするモジュールをリクエストします
# lxml モジュールの HTML ビルド セレクター セレクター (フォーマットされた応答レスポンス)
# from lxml import html
# import request

# response =requests.get (url) .content

# selector = html.formatstring(response)

# hrefs = selector.xpath('/html/body//div[@class='feed-item _j_feed_item']/a + これはページをクロールする前に、HTML 構造を注意深く分析する必要があります。このページは比較的単純で、JS 処理は含まれません。

以上がリクエストと lxml を使用してクローラーを実装するチュートリアルの例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。