Heim >Backend-Entwicklung >Python-Tutorial >So erhalten Sie Webinhalte in Python
Python eignet sich recht gut für die Datenverarbeitung. Python ist eine gute Wahl. Es verfügt über viele vorgefertigte Klassenpakete, die viele komplexe Funktionen ausführen können, solange Sie sie aufrufen.
1 Pyhton ruft den Inhalt der Webseite ab (also den Quellcode) (empfohlenes Lernen: Python-Video-Tutorial)
page = urllib2.urlopen(url) contents = page.read() #获得了整个网页的内容也就是源代码 print(contents)
URL stellt die URL dar, Inhalt stellt den Quellcode dar, der der URL entspricht, urllib2 ist das Paket, das verwendet werden muss, die obigen drei Codezeilen können den gesamten Quellcode abrufen die Webseite
2 Erhalten Sie den gewünschten Inhalt von der Webseite (erhalten Sie zuerst den Quellcode der Webseite, analysieren Sie dann den Quellcode der Webseite, suchen Sie das entsprechende Tag und extrahieren Sie dann den Inhalt im Tag)
Nehmen Sie das Douban-Filmranking als Beispiel
Jetzt muss ich die Namen, Bewertungen, Anzahl der Rezensionen und Links aller Filme auf der aktuellen Seite erhalten
#coding:utf-8 ''''' @author: jsjxy ''' import urllib2 import re from bs4 import BeautifulSoup from distutils.filelist import findall page = urllib2.urlopen('http://movie.douban.com/top250?format=text') contents = page.read() #print(contents) soup = BeautifulSoup(contents,"html.parser") print("豆瓣电影TOP250" + "\n" +" 影片名 评分 评价人数 链接 ") for tag in soup.find_all('div', class_='info'): # print tag m_name = tag.find('span', class_='title').get_text() m_rating_score = float(tag.find('span',class_='rating_num').get_text()) m_people = tag.find('div',class_="star") m_span = m_people.findAll('span') m_peoplecount = m_span[3].contents[0] m_url=tag.find('a').get('href') print( m_name+" " + str(m_rating_score) + " " + m_peoplecount + " " + m_url )
Konsolenausgabe , Sie können es auch in eine Datei schreiben
Weitere Python-bezogene Technologien Artikel, besuchen Sie bitte die Spalte Python-Tutorial, um mehr zu erfahren!
Das obige ist der detaillierte Inhalt vonSo erhalten Sie Webinhalte in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!