Heim  >  Artikel  >  Backend-Entwicklung  >  Implementierungsmethode zum Herunterladen von Bildern in Python (supereinfach)

Implementierungsmethode zum Herunterladen von Bildern in Python (supereinfach)

不言
不言Original
2018-04-16 17:00:552974Durchsuche

In diesem Artikel wird die Implementierungsmethode zum Herunterladen von Bildern in Python vorgestellt (supereinfach), die jetzt einen gewissen Referenzwert hat. Freunde in Not können darauf verweisen.

Der Herausgeber unten wird es erklären Hier ist ein Artikel darüber, wie man das Herunterladen von Bildern in Python implementiert (super einfach). Der Herausgeber findet es ziemlich gut, deshalb werde ich es jetzt mit Ihnen teilen und es allen als Referenz geben. Folgen wir dem Editor, um einen Blick darauf zu werfen.

Manchmal müssen wir Bilder im Internet finden und herunterladen, indem wir zum Speichern mit der rechten Maustaste klicken. Einige Bilder können nicht heruntergeladen werden, wenn Sie mit der rechten Maustaste klicken, oder es müssen viele Bilder heruntergeladen werden. In diesem Fall kann das Problem leicht gelöst werden!

1 Scraping


#coding=utf-8
  import urllib
  def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
  html = getHtml("https://tieba.baidu.com/p/5582243679")
  print html


Der Seitendatenerfassungsprozess definiert die Funktion getHtml(), deren Funktion darin besteht, eine URL an getHtml( zu übergeben ) und schließlich die gesamte Seite herunterladen.

2. Seitendatenfilterung


import re
  import urllib
  def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
  def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist
  html = getHtml("https://tieba.baidu.com/p/5582243679")
  print getImg(html)


Bei der Seitendatenfilterung wird eine neue Funktion getImg definiert ( ), besteht die Funktion dieser Funktion darin, Bildadressen im JPG-Format herauszufiltern.

3. Bild-Download


#coding=utf-8
  import urllib
  import re
  def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
  def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
      urllib.urlretrieve(imgurl,'%s.jpg' % x)
      x+=1
  html = getHtml("https://tieba.baidu.com/p/5582243679")
  print getImg(html)


Erhalten Sie alle qualifizierten Bild-URLs über eine for-Schleife und verwenden Sie die URLlib Die Methode .urlretrieve() lädt die Remote-Daten auf die lokale Seite herunter und benennt sie um.

Das Folgende ist eine Ergänzung

wie folgt:


import urllib.request
response = urllib.request.urlopen('http://www.jb51.net/g/500/600')
cat_img = response.read()

with open('cat_500_600.jpg','wb') as f:
 f.write(cat_img)


urlopen() Die Klammern können entweder eine Zeichenfolge oder ein Anforderungsobjekt sein. Wenn die Zeichenfolge übergeben wird, wird sie in ein Anforderungsobjekt umgewandelt. daher kann der Code

response = urllib.request.urlopen('http://www.jb51.net/g/500/600') auch als

req = urllib geschrieben werden. request .Request('http://www.jb51.net/g/500/600')

1. Antwort = urllib.request.urlopen(req)
2 , Getcode-Methode


Code mit open('cat_500_600.jpg','wb') as f:

f.write(cat_img) entspricht

1. f = open('cat_500_600.jpg','wb')

2. Versuchen Sie:

3 )

4. schließlich:

5.f.close()

Verwandte Empfehlungen:

Python ist einfaches Beispiel einer Methode zur Berechnung des Datei-MD5-Werts

Python einfache Methode zur Computersteuerung


Das obige ist der detaillierte Inhalt vonImplementierungsmethode zum Herunterladen von Bildern in Python (supereinfach). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn