Heim >Backend-Entwicklung >Python-Tutorial >Machen Sie Python komfortabler – eine Einführung in die häufig verwendeten Standardbibliotheken von Python

Machen Sie Python komfortabler – eine Einführung in die häufig verwendeten Standardbibliotheken von Python

Tomorin
TomorinOriginal
2018-08-15 17:31:471808Durchsuche

Welche Python-allgemeinen Bibliotheken in Python gibt es, die Programmierer nicht aus der Hand legen können? So sehr, dass ich süchtig wurde. Heute werden wir solche häufig verwendeten Python-Bibliotheken aussortieren. Sie können gerne verwandte Bibliotheksinhalte im Kommentarbereich hinzufügen oder ändern oder mir eine private Nachricht senden.

Stellen Sie zunächst die Bibliothek beautifulsoup vor, denn als ich zum ersten Mal mit Crawler in Kontakt kam, sah ich, dass jeder diese Bibliothek wärmstens empfahl. Ich habe es später verwendet und fand es wirklich gut. Aber Programmierer, wie können sie in einer Bibliothek sterben, haha.

Der Installationsprozess einiger Bibliotheken wird nicht noch einmal beschrieben. Bitte beziehen Sie sich auf Anaconda. -_-.

Die folgenden Beispiele werden alle damit getestet.

html = """
<html><head><title>The Dormouse&#39;s story</title></head>
<body>
<p class="myclass" name="dromouse"><b>The Dormouse&#39;s story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" class="myclass" id="box"><!-- Elsie --></a>,
<a href="http://example.com/lacie" class="myclass" id="box1">Lacie</a> and
<a href="http://example.com/tillie" class="myclass" id="box2">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""

BeautifulSoup

Beautiful Soup unterstützt den HTML-Parser in der Python-Standardbibliothek und unterstützt auch einige Parser von Drittanbietern. Zum Beispiel lxml HTML, lxml XML, html5lib. Diese Bibliotheken müssen jedoch installiert werden, andernfalls wird die interne Standardbibliothek von Python verwendet.

Es gibt zwei Möglichkeiten, schöne Suppenobjekte zu erstellen.

1. Soup=BeautifulSoup(html) #Verwenden Sie variablen Inhalt, um

2. supple=BeautifulSoup('mysite.html') #Verwenden Sie lokale Dateien, um

zu erstellen BeautifulSoup konvertiert HTML in eine komplexe Baumstruktur. Schüler mit Frontend-Kenntnissen wissen, dass es einem DOM-Objekt ähnelt. Es gibt ungefähr vier Arten von Objekten in BeautifulSoup: Tag, NavigableString, BeautifulSoup und Comment. Da die meisten unserer täglichen Vorgänge darin bestehen, Informationen aus jedem Tag zu extrahieren, werde ich die häufig verwendeten Tag-Objekte kurz beschreiben.

Tag

tag ist ein HTML-Tag.

Zum Beispiel Kopf, Titel, a, p usw. in HTML.

Im tatsächlichen Betrieb finden wir das erforderliche Tag über den Selektor und erhalten dann die erforderlichen Informationen, indem wir das Tag-Objekt bedienen. In BeautifulSoup werden findAll() und find() häufig verwendet, um den Dokumentbaum zu durchsuchen, um die benötigten Tags zu erhalten. Gleichzeitig unterstützt BeautifulSoup auch die CSS-Syntax für die Suche, die Methode select() und der Rückgabetyp ist Liste.

ps:

1.findAll() entspricht find_all()

2. Wenn Sie mehr über das Frontend wissen, verwenden Sie die Methode select() für einen reibungslosen Vergleich.

find()

find() entspricht limit=1 in findAll(), aber find() gibt das Ergebnis zurück, findAll() gibt eine Liste zurück .

CSS-Selektor

Beautifulsoup unterstützt CSS-Syntaxselektoren, um die erforderlichen Tags zu finden.

select(CSS选择器)
例:
soup.select(&#39;.myclass #box&#39;)
#后代选择器
soup.select(&#39;head>title&#39;)
#子选择器
soup.select(&#39;div+p&#39;)
#相邻兄弟选择器
soup.select(&#39;div~p’)
#后续兄弟选择器

Gleichzeitig können Sie auch eine Attributsuche hinzufügen. Die Methode

soup.select(&#39;.myclass a[id="box"]&#39;)

select() gibt eine Liste zurück.

Die oben genannten sind fast die am häufigsten verwendeten Funktionen von BeautifulSoup

Das obige ist der detaillierte Inhalt vonMachen Sie Python komfortabler – eine Einführung in die häufig verwendeten Standardbibliotheken von Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn