Heim >Backend-Entwicklung >Python-Tutorial >python爬虫入门教程之点点美女图片爬虫代码分享

python爬虫入门教程之点点美女图片爬虫代码分享

WBOYOriginal: 2016-06-16 08:42:141385Durchsuche

继续鼓捣爬虫，今天贴出一个代码，爬取点点网「美女」标签下的图片，原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序：点点美女图片爬虫 
#  版本：0.2 
#  作者：zippera 
#  日期：2013-07-26 
#  语言：Python 2.7 
#  说明：能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*&#63;imgsrc="(ht.*&#63;)\".*&#63;')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3&#63;page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法：新建一个文件夹，把代码保存为name.py文件，运行python name.py就可以把图片下载到文件夹。

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Python中函数的用法实例教程Nächster Artikel：Python Tkinter基础控件用法

In Verbindung stehende Artikel

Mehr sehen