ホームページ  >  に質問  >  本文

クローラー - Python クローラーで JavaScript 関数のページ回転を完了するにはどうすればよいですか?

Web ページをクロールしたときに、このような機能によってページめくりが実装されていることに気づきました。ページをめくっても、ページの URL は変わりませんでした:

リーリー

ページめくりを実現するために次のような関数を作成しました:

リーリー

しかし、turn_page() を呼び出した後、ページめくりが失敗しました。この問題はどうやって解決すればよいでしょうか?また、このような問題を解決するにはどのような知識を自分で学べばよいでしょうか?ありがとうございます!

typechotypecho2685日前1409

全員に返信(2)返信します

  • 阿神

    阿神2017-06-13 09:26:39

    • セレンの使用を推奨します

    • たとえば、インターフェース上の次のページボタンをクリックする必要がある場合、または上下左右のキーを入力する必要がある場合、ページをめくることができ、Selenium Webdriver がそれを実行でき、参照を提供できます。 (私はQidian中国語ウェブサイトの小説をクロールしていました)

    • Selenium は、ページと対話し、クリック、ダブルクリック、Enter を実行し、ページが読み込まれるのを待機します (暗黙的な待機と明示的な待機)。 。 。 。

    リーリー

    返事
    0
  • PHP中文网

    PHP中文网2017-06-13 09:26:39

    いくつかの状況があります。
    1. JS エフェクトをスライドまたはクリックすることでページをめくることができます。
    2. ハイパーリンクをクリックすることでページをめくることができます。

    Chrome のデベロッパー ツールでネットワーク分析を使用すると、HTML ページであってもフィードバック JSON レンダリングであっても、結果を取得できます。

    json は処理が簡単で、結果を直接取得するだけです。通常の HTML ページでは、改ページに通常のマッチングを使用する必要があります。次に、リンクをプールに入れてクロールします。

    /a/11...

    返事
    0
  • キャンセル返事