首頁  >  問答  >  主體

使用python scrapy框架,循環爬取URL, 每次運行一段時間後直接卡死,沒有任何報錯

每次運行半小時左右, 直接卡死, log裡沒有任何報錯, 卡死的時候CPU佔用率非常高

我在setting.py裡設定了download timeout,不是超時的原因

ctrl-c無法正常退出, ctrl-z退出以後, 繼續執行還是同樣的問題, 半小時後再次卡死

#
世界只因有你世界只因有你2686 天前911

全部回覆(2)我來回復

  • 高洛峰

    高洛峰2017-06-12 09:29:08

    先TOP看看是內否過高,還是CPU過高,再找到是被哪些進程佔用了
    如果都是你的爬蟲進程,那就得排查代碼,看看是不是哪裡一直未被釋放

    總之從各方面去排查吧

    回覆
    0
  • PHP中文网

    PHP中文网2017-06-12 09:29:08

    strace

    回覆
    0
  • 取消回覆