Heim >Backend-Entwicklung >Python-Tutorial >So erhalten Sie Webinhalte in Python

So erhalten Sie Webinhalte in Python

(*-*)浩
(*-*)浩Original
2019-06-28 11:36:2515190Durchsuche

Python eignet sich recht gut für die Datenverarbeitung. Python ist eine gute Wahl. Es verfügt über viele vorgefertigte Klassenpakete, die viele komplexe Funktionen ausführen können, solange Sie sie aufrufen.

So erhalten Sie Webinhalte in Python

1 Pyhton ruft den Inhalt der Webseite ab (also den Quellcode) (empfohlenes Lernen: Python-Video-Tutorial)

page = urllib2.urlopen(url)   
contents = page.read()   
#获得了整个网页的内容也就是源代码  
print(contents)

URL stellt die URL dar, Inhalt stellt den Quellcode dar, der der URL entspricht, urllib2 ist das Paket, das verwendet werden muss, die obigen drei Codezeilen können den gesamten Quellcode abrufen die Webseite

2 Erhalten Sie den gewünschten Inhalt von der Webseite (erhalten Sie zuerst den Quellcode der Webseite, analysieren Sie dann den Quellcode der Webseite, suchen Sie das entsprechende Tag und extrahieren Sie dann den Inhalt im Tag)

Nehmen Sie das Douban-Filmranking als Beispiel

Jetzt muss ich die Namen, Bewertungen, Anzahl der Rezensionen und Links aller Filme auf der aktuellen Seite erhalten

#coding:utf-8  
''''' 
@author: jsjxy 
'''  
import urllib2   
import re   
from bs4 import BeautifulSoup  
from distutils.filelist import findall  

page = urllib2.urlopen('http://movie.douban.com/top250?format=text')   
contents = page.read()   
 #print(contents)  
soup = BeautifulSoup(contents,"html.parser")  
print("豆瓣电影TOP250" + "\n" +" 影片名              评分       评价人数     链接 ")    
for tag in soup.find_all('div', class_='info'):    
   # print tag  
    m_name = tag.find('span', class_='title').get_text()        
    m_rating_score = float(tag.find('span',class_='rating_num').get_text())          
    m_people = tag.find('div',class_="star")  
    m_span = m_people.findAll('span')  
    m_peoplecount = m_span[3].contents[0]  
    m_url=tag.find('a').get('href')  
    print( m_name+"        "  +  str(m_rating_score)   + "           " + m_peoplecount + "    " + m_url )

Konsolenausgabe , Sie können es auch in eine Datei schreiben

Weitere Python-bezogene Technologien Artikel, besuchen Sie bitte die Spalte Python-Tutorial, um mehr zu erfahren!

Das obige ist der detaillierte Inhalt vonSo erhalten Sie Webinhalte in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn