搜尋

首頁  >  問答  >  主體

Python爬虫程序运行“卡顿”


用Python爬取某网站两个月的数据,程序“卡顿”,但并未报错,也未结束。如上图所示。
例如,我把时间循环设置为2016.8.1--2016.10.1,抓取到数据的就只能到2016.9.4,然后程序也没运行结束,但数据库也一直没有更多的数据进入。出现“卡顿”。

然后我换了台配置更好的电脑,情况会好很多,可以抓取半年的数据。本来我想抓一年的数据,但抓取到半年的数据的数据后,也会出现如图所示的情况,并且数据库也一直未添加更多的数据。即“卡顿”。

我想知道有没有办法能够一次抓取的数据多点??

PHP中文网PHP中文网2853 天前775

全部回覆(2)我來回復

  • PHPz

    PHPz2017-04-18 09:31:28

    出現阻塞的原因是什麼呢?你可以透過以下方式分析:

    1,抓包分析,是不是網路原因;
    2,你寫的爬蟲是用什麼框架,是urllib2還是scrapy框架,查看日誌情況。
    3,查看是否是url池已經處理完,沒有新的目標任務加入爬取佇列。

    回覆
    0
  • PHP中文网

    PHP中文网2017-04-18 09:31:28

    可以使用多線程,每個線程處理一個月的數據,這樣即使哪個月的數據出了問題依然能夠保證大多數數據的完整性,然後具體分析出問題的月份的數據的情況。

    回覆
    0
  • 取消回覆