Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mithilfe der „Requests'-Bibliothek von Python asynchron Inhalte von mehreren Webseiten abrufen?

Wie kann ich mithilfe der „Requests'-Bibliothek von Python asynchron Inhalte von mehreren Webseiten abrufen?

Susan Sarandon
Susan SarandonOriginal
2024-12-08 22:24:13621Durchsuche

How Can I Asynchronously Retrieve Content from Multiple Web Pages Using Python's `requests` Library?

Asynchrone Anfragen mit Python-Anfragen: Inhalte von mehreren Seiten abrufen

Die Python-Anfragebibliothek ermöglicht die asynchrone Verarbeitung von HTTP-Anfragen. Während das bereitgestellte Beispiel in der Dokumentation den Abruf von Antwortcodes zeigt, wird in diesem Artikel erläutert, wie der Inhalt jeder angeforderten Seite abgerufen wird.

Um dies zu erreichen, ist es notwendig, die Aufgabe in die folgenden Schritte zu unterteilen:

  1. Definieren Sie eine Aufgabenfunktion: Erstellen Sie eine Python-Funktion, die die gewünschte Aktion definiert, die für jedes Antwortobjekt ausgeführt werden soll. Diese Funktion enthält normalerweise den Code zum Extrahieren des gewünschten Inhalts.
  2. Ereignis-Hook hinzufügen: Verknüpfen Sie die Aufgabenfunktion mit jeder Anfrage, indem Sie sie als Ereignis-Hook hinzufügen. Dadurch wird sichergestellt, dass die Funktion automatisch mit dem Antwortobjekt aufgerufen wird, wenn die Anfrage abgeschlossen ist.
  3. Asynchrone Verarbeitung initiieren: Nachdem Sie Ereignis-Hooks definiert und angehängt haben, erstellen Sie eine Liste aller zu verarbeitenden Anfragen asynchron. Rufen Sie dann die Methode async.map in dieser Liste auf.

Beispielcode:

from requests import async

urls = [
    'http://python-requests.org',
    'http://httpbin.org',
    'http://python-guide.org',
    'http://kennethreitz.com'
]

# Task function to extract page content
def extract_content(response):
    return response.content

# List to hold asynchronous actions
async_list = []

# Create requests with event hooks
for u in urls:
    action_item = async.get(u, hooks={'response': extract_content})
    async_list.append(action_item)

# Initiate asynchronous processing
async.map(async_list)

# Print the extracted content
for item in async_list:
    print(item.content)

Indem Sie diese Schritte befolgen und das bereitgestellte Codebeispiel verwenden, Mit der Python-Anforderungsbibliothek können Sie den Inhalt mehrerer Seiten erfolgreich asynchron abrufen.

Das obige ist der detaillierte Inhalt vonWie kann ich mithilfe der „Requests'-Bibliothek von Python asynchron Inhalte von mehreren Webseiten abrufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn