Web ページをクロールしたときに、このような機能によってページめくりが実装されていることに気づきました。ページをめくっても、ページの URL は変わりませんでした:
リーリー
ページめくりを実現するために次のような関数を作成しました:
リーリーしかし、turn_page() を呼び出した後、ページめくりが失敗しました。この問題はどうやって解決すればよいでしょうか?また、このような問題を解決するにはどのような知識を自分で学べばよいでしょうか?ありがとうございます!
阿神2017-06-13 09:26:39
セレンの使用を推奨します
たとえば、インターフェース上の次のページボタンをクリックする必要がある場合、または上下左右のキーを入力する必要がある場合、ページをめくることができ、Selenium Webdriver がそれを実行でき、参照を提供できます。 (私はQidian中国語ウェブサイトの小説をクロールしていました)
Selenium は、ページと対話し、クリック、ダブルクリック、Enter を実行し、ページが読み込まれるのを待機します (暗黙的な待機と明示的な待機)。 。 。 。
PHP中文网2017-06-13 09:26:39
いくつかの状況があります。
1. JS エフェクトをスライドまたはクリックすることでページをめくることができます。
2. ハイパーリンクをクリックすることでページをめくることができます。
json は処理が簡単で、結果を直接取得するだけです。通常の HTML ページでは、改ページに通常のマッチングを使用する必要があります。次に、リンクをプールに入れてクロールします。