Heim  >  Artikel  >  Backend-Entwicklung  >  Grundlegende Crawler-Übungen – Python-Crawler, laden Sie Bilder von Douban-Mädchen herunter

Grundlegende Crawler-Übungen – Python-Crawler, laden Sie Bilder von Douban-Mädchen herunter

高洛峰
高洛峰Original
2017-02-16 10:52:171853Durchsuche

Laden Sie die Mädchenbilder auf der angegebenen Website herunter. Sie können die Anzahl der Seiten entsprechend Ihren Anforderungen festlegen Katzenwert, um es selbst zu erleben. Wenn Sie Fragen haben, hinterlassen Sie eine Nachricht an Ich werde antworten, wenn ich sie sehe
2 = Vollbusiges Mädchen
3 = Schöne Beine
4 = Gutes Aussehen
5 = Hodgepodge
6 = Kleines Gesäß

import requests
import re
import time
from bs4 import BeautifulSoup

cat ='2'
img = 'http://www.dbmeinv.com/dbgroup/show.htm?cid='+ cat
end = '/dbgroup/show.htm?cid='+ cat + '&pager_offset=100'
urls = [ ]
def getURLs(mainURL):
    time.sleep(1)
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'}
    html = requests.get(mainURL).text
    soup = BeautifulSoup(html, 'html.parser')
    picURL = re.findall('<img class.*?src="(.+?\.jpg)"', html, re.S)
    for url in picURL:
        urls.append(url)
        print(url)
    asoup = soup.select('.next a')[0]['href']
    Next_page = 'http://www.dbmeinv.com' + asoup
    if asoup != end:
        getURLs(Next_page)
    else:
        print('链接已处理完毕!')
    return urls
url = getURLs(img)

i = 0
for each in url:
    pic = requests.get(each, timeout = 10)
    picName = 'pictures/' + str(i) + '.jpg'
    fp = open(picName, 'wb')
    fp.write(pic.content)
    fp.close()
    i += 1

print('图片下载完成')
Weitere grundlegende Crawler-Übungen – Python-Crawler lädt Bilder von Douban-Mädchen herunter. Weitere Artikel finden Sie auf der chinesischen PHP-Website!                                                                                                            
Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Python-DjangoNächster Artikel:Python-Django