>백엔드 개발 >파이썬 튜토리얼 >기본 크롤러 연습 - Python 크롤러에서 Douban 소녀 사진 다운로드

기본 크롤러 연습 - Python 크롤러에서 Douban 소녀 사진 다운로드

高洛峰
高洛峰원래의
2017-02-16 10:52:171864검색

지정된 웹사이트에서 소녀 사진을 다운로드하세요. 여기서는 처음 100페이지의 사진만 캡처했습니다. 필요에 따라 페이지 수를 설정할 수 있습니다.
고양이 값은 이미지 유형을 변경할 수 있습니다. cat value 궁금하신 점은 메시지 남겨주시면 답변해드리겠습니다
2 = 가슴큰 여자
3 = 예쁜 다리
4 = 잘생김
5 = Hodgepodge
6 = 작은 엉덩이

import requests
import re
import time
from bs4 import BeautifulSoup

cat ='2'
img = 'http://www.dbmeinv.com/dbgroup/show.htm?cid='+ cat
end = '/dbgroup/show.htm?cid='+ cat + '&pager_offset=100'
urls = [ ]
def getURLs(mainURL):
    time.sleep(1)
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'}
    html = requests.get(mainURL).text
    soup = BeautifulSoup(html, 'html.parser')
    picURL = re.findall('<img class.*?src="(.+?\.jpg)"', html, re.S)
    for url in picURL:
        urls.append(url)
        print(url)
    asoup = soup.select('.next a')[0]['href']
    Next_page = 'http://www.dbmeinv.com' + asoup
    if asoup != end:
        getURLs(Next_page)
    else:
        print('链接已处理完毕!')
    return urls
url = getURLs(img)

i = 0
for each in url:
    pic = requests.get(each, timeout = 10)
    picName = 'pictures/' + str(i) + '.jpg'
    fp = open(picName, 'wb')
    fp.write(pic.content)
    fp.close()
    i += 1

print('图片下载完成')

더 기본적인 크롤러 연습 - Python 크롤러 다운로드 Douban 소녀 사진 관련 기사는 PHP 중국어 웹 사이트를 주목하세요! ~

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
이전 기사:Python-Django다음 기사:Python-Django