Maison >développement back-end >Tutoriel Python >Introduction détaillée à la fonction de robot d'exploration simple basée sur Python3.4
Cet article présente principalement la programmation Python3.4 pour implémenter des fonctions simples d'exploration et d'exploration, impliquant l'exploration de pages Web Python3.4 et des techniques d'exploitation liées à l'analyse régulière. Les amis dans le besoin peuvent s'y référer
Cet article décrit le. exemples La programmation Python3.4 implémente une fonction de robot d'exploration simple. Partagez-le avec tout le monde pour votre référence, les détails sont les suivants :
import urllib.request import urllib.parse import re import urllib.request,urllib.parse,http.cookiejar import time def getHtml(url): cj=http.cookiejar.CookieJar() opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj)) opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')] urllib.request.install_opener(opener) page = urllib.request.urlopen(url) html = page.read() return html #print ( html) #html = getHtml("http://weibo.com/") def getimg(html): html = html.decode('utf-8') reg='"screen_name":"(.*?)"' imgre = re.compile(reg) src=re.findall(imgre,html) return src #print ("",getimg(html)) uid=['2808675432','3888405676','2628551531','2808587400'] for a in list(uid): print (getimg(getHtml("http://weibo.com/"+a))) time.sleep(1)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!