python - 爬虫爬取网页后，如何保存网页？

Question

爬虫从 Internet 中爬取众多的网页作为原始网页库存储于本地，然后网页分析器抽取网页中的主题内容交给分词器进行分词，得到的结果用索引器建立正排和倒排索引，这样就得到了索引数据库，用户查询时，在通过分词...

黄舟 · Answer

雷雷

迷茫 · Answer

他這裡的意思是抓取到的網頁直接以文件的方式存放到本地磁碟

ringa_lee · Answer

可以使用物件儲存組件。

PHP中文网 · Answer

推薦大家使用下神箭手雲爬蟲（ http://www.shenjianshou.cn ），完全在雲上編寫和執行爬蟲，不需要配置任何開發環境，快速開發快速實現。

簡單幾行javascript 就可以實現複雜的爬蟲，同時提供許多功能函數：反反爬蟲、 js 渲染、資料發布、圖表分析、反防盜鍊等，這些在開發爬蟲過程中經常會遇到的問題都由神箭手幫你解決。
所擷取的資料：
(1)可以選擇發佈到網站，如wecenterwordpressdiscuzdede帝國等cms系統
(2)也可以發佈到資料庫
(3)或匯出檔案到本機
具體設定都在「資料發佈&匯出」中

python - 爬虫爬取网页后，如何保存网页？

全部回覆(4)我來回復