検索

ホームページ  >  に質問  >  本文

网页爬虫 - ubuntu 下 python 使用 selenium + PhantomJS 时出错

PHP中文网PHP中文网2803日前888

全員に返信(4)返信します

  • 迷茫

    迷茫2017-04-17 14:35:09

    私も最近これに遭遇しました。動的jsがまだ解析されていないため、Webページのコードを取得できません。例外は NoSuchElementException ですが、これは明らかです。

    返事
    0
  • PHP中文网

    PHP中文网2017-04-17 14:35:09

    phantomjs はヘッドレスブラウザに属しており、ウィンドウがないため、すべての要素が描画されない可能性もあります。したがって、この時点で見つかった要素はすべて NoSuchElementException 例外になります。
    次の手順を試すことができます:

    リーリー

    参考: https://github.com/ariya/phantomjs/issues/11637

    返事
    0
  • 怪我咯

    怪我咯2017-04-17 14:35:09

    自分で答えてください。
    stackoverflow で解決策が見つかりました。
    速度を向上させるために CSS、画像、JS をブロックします。
    PhantomJS はまだ使用できませんが、確かに高速であり、目的は達成されています。

    リーリー

    http://stackoverflow.com/questions/20892768/how-to-speed-up-browsing-in-selenium-firefox
    http://stackoverflow.com/questions/17462884/is-selenium-slow -または私のコードが間違っています

    返事
    0
  • 阿神

    阿神2017-04-17 14:35:09

    この場合、js も解析できないのではないでしょうか? 他の高速ツールを使用してみてはいかがでしょうか?

    返事
    0
  • キャンセル返事