首頁  >  文章  >  後端開發  >  使用正規表示式抓取網頁圖片的Python程式碼實例

使用正規表示式抓取網頁圖片的Python程式碼實例

Y2J
Y2J原創
2017-05-03 16:15:331310瀏覽

這篇文章主要介紹了Python使用正規表示式抓取網頁圖片的方法,結合具體實例形式分析了Python網頁文件的讀取及正則匹配相關操作技巧,需要的朋友可以參考下

本文實例講述了Python使用正規表示式抓取網頁圖片的方法。分享給大家參考,具體如下:

#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
#匹配网页中的图片
 reg = r'src="(.*?\.jpg)" alt'
  imgre = re.compile(reg)
  imglist = re.findall(imgre,html)
  x = 0
  for imgurl in imglist:
    urllib.urlretrieve(imgurl,'%s.jpg' % x)
    x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)

以上是使用正規表示式抓取網頁圖片的Python程式碼實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn