python - scrapy 抓不到起始网页内容

Question

初学使用scrapy，按照教程建了很小一个例子，还没有到用pipeline之类的地步，只想看看能不能爬东西下来。代码如下： spider.py： {代码...} items.py: {代码...} 但是发现几个新闻网站都爬取失败了，包括：people...

迷茫 · Answer

Helo, ini cara saya menyelesaikan masalah ini Mula-mula saya buka:

scrapy shell http://people.com.cn

Masukkan mod shell, kemudian masukkan:

response.url.split('/')[-2]

Saya mendapati bahawa kandungan di dalamnya kosong Pada masa ini, saya memutuskan bahawa saya telah membuat kesilapan apabila membahagikan URL, jadi saya mencuba kod berikut:

response.url.split('/')[-1]

Mendapati output berikut:

Jadi sebab di sebalik poster asal ialah nama fail tidak wujud, jadi dokumen itu tidak akan dihasilkan.
Cubalah.

PHPz · Answer

Uji dengan terminal dan cuba
http://scrapy-chs.readthedocs...

天蓬老师 · Answer

Saya tidak tahu sama ada anda telah membaca dokumentasi scrapy dengan teliti
http://scrapy-chs.readthedocs...

python - scrapy 抓不到起始网页内容

membalas semua(3)saya akan balas