python - scrapy 抓不到起始网页内容

Question

初学使用scrapy，按照教程建了很小一个例子，还没有到用pipeline之类的地步，只想看看能不能爬东西下来。代码如下： spider.py： {代码...} items.py: {代码...} 但是发现几个新闻网站都爬取失败了，包括：people...

迷茫 · Answer

樓主，您好，我是這樣解決這個問題的，第一我打開：

scrapy shell http://people.com.cn

進入到了shell模式，然後輸入：

response.url.split('/')[-2]

發現裡面的內容為空，這時候我判定是分割網址的時候弄錯了，所以，我嘗試了下面這個程式碼：

response.url.split('/')[-1]

發現有輸出如下：

所以樓主的原因是filename不存在，所以不會產生文件了。
試試吧。

PHPz · Answer

你用終端測試試試看
http://scrapy-chs.readthedocs...

天蓬老师 · Answer

不知道你有沒有認真看scrapy的文檔
http://scrapy-chs.readthedocs...