首頁  >  文章  >  後端開發  >  實例解析Python如何實現爬取京東手機圖片

實例解析Python如何實現爬取京東手機圖片

零到壹度
零到壹度原創
2018-03-30 10:30:182031瀏覽

本文主要為大家分享一篇Python如何實現爬取京東手機圖片的方法,具有很好的參考價值,希望對大家有所幫助。一起跟著小編過來看看吧,希望能幫助大家。

運行環境Python3.6.4
<span style="font-size: 14px; font-family: 微软雅黑, "Microsoft YaHei";">#爬取京东手机图片import re #导入re模块import urllib.request  #导入urllib.request模块def craw(url,page): #定义函数craw<br/>    html1 = urllib.request.urlopen(url).read() #调用urllib.request模块里的urlopen函数打开url链接,并且读取,最后赋值给html1<br/>    html1 = str(html1) #将html1网页内容变成字符串<br/>    pat1 = &#39;&#39;&#39;<p id="plist".+? <p class="page clearfix">&#39;&#39;&#39; #利用pat1正则表达式进行第一次信息过滤<br/>    result1 = re.compile(pat1).findall(html1)  #查找所有符合条件的信息<br/>    result1 = result1[0]<br/>    pat2 = &#39;&#39;&#39;<img width="220" height="220" data-img="1".+?"//(.+?\.jpg)">&#39;&#39;&#39;#".+?"组合可以匹配除换行外的任意字符,第二个正则表达式进行第二次过滤<br/>    imagelist = re.compile(pat2).findall(result1)<br/>    x = 1<br/>    for imageurl in imagelist:<br/>        imagename = "D:/Python35/myweb/part6/img1/"+"第"+str(page)+"页图"+str(x)+".jpg"<br/>        imageurl = "http://"+imageurl        try:<br/>            urllib.request.urlretrieve(imageurl,filename=imagename)        except urllib.error.URLError as e:            if hasattr(e,"code"):<br/>                x+=1<br/>            if hasattr(e,"reason"):<br/>                x+=1<br/>        x+=1for i in range(1,2):<br/>    url = "http://list.jd.com/list.html?cat=9987,653,655&page="+str(i)<br/>    craw(url,i)</span>

相關推薦:

##python爬蟲實作-- -爬取京東圖片

京東手機圖片爬取

#實例爬取京東收集圖片 #

以上是實例解析Python如何實現爬取京東手機圖片的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn