Python爬虫程序运行“卡顿”

Question

用Python爬取某网站两个月的数据，程序“卡顿”，但并未报错，也未结束。如上图所示。
例如，我把时间循环设置为2016.8.1--2016.10.1，抓取到数据的就只能到2016.9.4，然后程序也没运行结束，但数据库也一直没有更多的数据进入。出现“卡顿”。

PHPz · Answer

障害の理由は何ですか?次の方法で分析できます:

1. ネットワークが原因かどうかを確認するためのパケットキャプチャ分析。
2. クローラーの作成に使用したフレームワークは urllib2 ですか? それとも Scrapy フレームワークですか?
3. URL プールが処理され、新しいターゲットタスクがクロールキューに追加されていないかどうかを確認します。

PHP中文网 · Answer

マルチスレッドを使用でき、各スレッドが 1 か月分のデータを処理するため、いずれかの月のデータに問題があった場合でも、ほとんどのデータの整合性が確保され、その後、問題が発生した月を詳細に分析できます。

Python爬虫程序运行“卡顿”

全員に返信(2)返信します