首頁  >  文章  >  後端開發  >  教你如何透過關鍵字爬取網頁圖片

教你如何透過關鍵字爬取網頁圖片

Y2J
Y2J原創
2017-05-09 14:21:015145瀏覽

本文主要介紹了Python爬蟲:透過關鍵字爬取百度圖片的方法。具有很好的參考價值,下面跟著小編一起來看下吧

使用工具:Python2.7 點我下載

scrapy框架

#sublime text3

一。建立python(Windows版本)

 1.安裝python2.7 ---然後在cmd當中輸入python,介面如下則安裝成功

 2.整合Scrapy框架----輸入命令列:pip install Scrapy

安裝成功介面如下:

#失敗的情況很多,範例一種:

#解決方案:其餘錯誤可百度

搜尋

二。開始編程

1.爬取無反爬蟲措施的靜態網站。例如百度貼吧,豆瓣讀書。

例如-《桌面吧》的一個帖子tieba.baidu.com/p/2460150866?red_tag=3569129009

python程式碼如下:

#程式碼註解:引入了兩個模組urllib,re。定義兩個

函數

,第一個函數是取得整個目標網頁數據,第二個函數是在目標網頁中取得目標圖片,遍歷網頁,並且給予取得的圖片依照0開始排序。

註:re模組知識點:

爬取圖片效果圖:

圖片儲存路徑預設在建立的.py同目錄檔下。 2.爬取有反爬蟲措施的百度圖片。如百度圖片等。

例如關鍵字搜尋「表情包」https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1% ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

圖片採用滾動式加載,先爬取最優先的30張。

程式碼如下:

程式碼註解:匯入4個模組,os模組用於指定儲存路徑。前兩個函數同上。第三個函數使用了if語句,並且try

Exception

異常。

爬取過程如下:

爬取結果:

註:寫python程式碼注重對齊,and不能混用Tab和空格,易報錯。

【相關推薦】1.

Python免費影片教學

#2.

Python學習手冊

# #3. Python物件導向影片教學

###

以上是教你如何透過關鍵字爬取網頁圖片的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn