Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mit Python HTML analysieren und auf Elemente zugreifen?

Wie kann ich mit Python HTML analysieren und auf Elemente zugreifen?

Linda Hamilton
Linda HamiltonOriginal
2024-12-13 22:27:15847Durchsuche

How Can I Parse HTML and Access Elements Using Python?

HTML mit Python analysieren

Frage:

Wie kann ich auf HTML-Elemente zugreifen und diese bearbeiten? mit einem Python-Parser? Ich benötige ein Modul, das es mir ermöglicht, Tags und ihren Inhalt in einem strukturierten Format abzurufen, ähnlich der verschachtelten Struktur, die in der Firefox-Funktion „Element prüfen“ angezeigt wird.

Antwort:

BeautifulSoup

Das BeautifulSoup-Modul ist eine beliebte und leistungsstarke Python-Bibliothek zum Parsen von HTML. Es kann HTML in eine verschachtelte Datenstruktur umwandeln, sodass Sie problemlos auf HTML-Elemente zugreifen und darin navigieren können.

Beispiel:

So analysieren Sie das von Ihnen bereitgestellte HTML-Dokument:

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>

Um den Inhalt des „Container“-Div innerhalb des „Body“ abzurufen tag:

print(parsed_html.body.find('div', attrs={'class':'container'}).text)

Andere Optionen:

  • lxml: Ein schneller und effizienter XML- und HTML-Parser, der erweiterte Funktionen wie unterstützt als XPath.
  • HTMLParser: Ein integriertes Python-Modul, das Folgendes bereitstellt ein einfacher HTML-Parser.

Das obige ist der detaillierte Inhalt vonWie kann ich mit Python HTML analysieren und auf Elemente zugreifen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn