ホームページ  >  に質問  >  本文

python - 为什么感觉 pyspider 爬取的速度好慢

为什么感觉 pyspider 爬取的速度好慢(比自己直接用 requests 和 bs慢多了),是不是因为有些网页会 retry,不过成功率倒是比自己爬取的高多了。是不是我的使用方法不对?求解释

巴扎黑巴扎黑2741日前862

全員に返信(2)返信します

  • 迷茫

    迷茫2017-04-18 10:33:39

    ここでは、Web UI コンソールでレート/バースト パラメータを設定して速度を調整できます。レートは 1 秒あたりのクロール数、バーストは同時実行数です。デフォルトは 1/3 なので、比較的遅いです。このツールについてはまだよくわかっていません

    返事
    0
  • 高洛峰

    高洛峰2017-04-18 10:33:39

    私はフレームワークを使ってクローラを書いたことはありませんが、自分でクローラを書く場合、モデルが複雑になればなるほど(スレッド制御、スレッド状態監視など)、並行して書くと効率が悪くなります。

    返事
    0
  • キャンセル返事