使用python scrapy框架,循環爬取URL, 每次運行一段時間後直接卡死,沒有任何報錯

Question

每次運行半小時左右, 直接卡死, log裡沒有任何報錯, 卡死的時候CPU佔用率非常高

我在setting.py裡設定了download timeout,不是超時的原因

ctrl-c無法正常退出, ctrl-z退出以後, 繼續執行還是同樣的問題, 半小時後再次卡死

#

高洛峰 · Answer

先TOP看看是內否過高，還是CPU過高，再找到是被哪些進程佔用了
如果都是你的爬蟲進程，那就得排查代碼，看看是不是哪裡一直未被釋放

總之從各方面去排查吧

PHP中文网 · Answer

<p>strace</p>