suchen
HeimBackend-EntwicklungPython-TutorialWarum bekomme ich den Fehler 'Listenliste außerhalb des Reichweite' bei der Verwendung von Python Crawler?

Warum bekomme ich den Fehler

Fehler "Listenindex außerhalb des Bereichs" Fehler in Python Crawler: Ursache und Lösung

Wenn Sie Python und BeautifulSoup für das Web -Crawling verwenden, stoßen Sie häufig list index out of range . Dieses Problem kann auch dann auftreten, wenn der Code nicht geändert wird, insbesondere wenn es sich um dynamische Webseiten oder Website -Strukturänderungen handelt. Dieser Artikel analysiert die Ursache dieses Fehlers und bietet eine effektive Lösung.

Hier ist ein Beispielcode, der demonstriert, was diesen Fehler verursachen könnte:

 Anfragen importieren
Aus BS4 Import BeautifulSoup

Headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebkit/537.36 (KHTML, wie Gecko) Chrome/124.0.0.0 Safari/537.36 EDG/124.0.0.0'}
Antwort = Requests.get ("https://www.iqiyi.com/ranks1/3/0", Headers = Headers)
print (Antwort.Status_code)
Antwort = Antwort.text
Suppe = BeautifulSoup (Antwort, "html.parser")

Def extract_data ():
    titles = [title.get_text (). strip () für Titel in Suppe.find_all ("div", class _ = "rvi__tit1")]
    heat = [heat.get_text (). strip () für hitze in suppe.find_all ("span", class _ = "rvi__Index__num")]
    Einführungen = [intro.get_text (). Strip () für Intro in Suppe.find_all ("P", Klasse _ = "rvi__Des2")]
    Rückgabetitel, Wärme, Einführungen

Def display_data (Titel, Wärme, Einführungen):
    min_len = min (Len (Titel), Len (Hitze), Len (Einführungen))
    Für i in Reichweite (min_len):
        print (f "Ranking: {i 1}, Titel: {Titel [i]}, Popularität: {Wärme [i]}, Einführung: {Einführungen [i]}")


Wenn __name__ == '__main__':
    Titel, Wärme, Einführungen = extract_data ()
    display_data (Titel, Wärme, Einführungen)

In diesem Beispiel erfolgt list index out of range in display_data in der Lage ist, normalerweise in der DILD_DATA. Der Grund ist: Die Längen der drei Listen von titles , heat und introductions können inkonsistent sein. Wenn eine der Listen eine Länge von weniger als 10 (oder den Reichweite von Schleifen) hat, tritt bei dem Zugriff auf die Listenelemente ein Index-Fehler auf.

Lösung:

Der Schlüssel besteht darin, sicherzustellen, dass vor dem Zugriff auf das Listenelement die Länge der Liste überprüft wird und nur Elemente innerhalb des gültigen Indexbereichs zugegriffen werden. Der verbesserte Code lautet wie folgt:

 Anfragen importieren
Aus BS4 Import BeautifulSoup

# ... (Header und Anfrage bleibt gleich) ...

Def extract_data ():
    # ... (Extraktion bleibt gleich) ...

Def display_data (Titel, Wärme, Einführungen):
    min_len = min (Len (Titel), Len (Hitze), Len (Einführungen)) # Die kürzeste Liste finden
    Für i in Reichweite (min_len):
        print (f "Ranking: {i 1}, Titel: {Titel [i]}, Popularität: {Wärme [i]}, Einführung: {Einführungen [i]}")


Wenn __name__ == '__main__':
    Titel, Wärme, Einführungen = extract_data ()
    display_data (Titel, Wärme, Einführungen)

Durch die Berechnung der kürzesten Länge der drei Listen min_len und die Verwendung min_len als Bereich der Schleife stellen wir sicher, dass keine Elemente außerhalb des List -Indexbereichs zugegriffen werden, wodurch list index out of range unzureichend vermieden werden. Dies ist eine robustere Verarbeitungsmethode, die sich an Änderungen in verschiedenen Webseitenstrukturen und Datenvolumina anpassen kann. Zusätzlich ist das Hinzufügen von Fehlerbehandlungsmechanismen (z. B. try-except Blöcken) auch eine gute Programmierpraxis, die komplexere Situationen bewältigen kann.

Das obige ist der detaillierte Inhalt vonWarum bekomme ich den Fehler 'Listenliste außerhalb des Reichweite' bei der Verwendung von Python Crawler?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Wie erstellen Sie mehrdimensionale Arrays mit Numpy?Wie erstellen Sie mehrdimensionale Arrays mit Numpy?Apr 29, 2025 am 12:27 AM

Durch die folgenden Schritte können mehrdimensionale Arrays mit Numpy erstellt werden: 1) Verwenden Sie die Funktion numpy.array (), um ein Array wie NP.Array ([1,2,3], [4,5,6]) zu erstellen, um ein 2D-Array zu erstellen; 2) Verwenden Sie np.zeros (), np.ones (), np.random.random () und andere Funktionen, um ein Array zu erstellen, das mit spezifischen Werten gefüllt ist; 3) Verstehen Sie die Form- und Größeneigenschaften des Arrays, um sicherzustellen, dass die Länge des Unterarrays konsistent ist und Fehler vermeiden. 4) Verwenden Sie die Funktion np.reshape (), um die Form des Arrays zu ändern. 5) Achten Sie auf die Speichernutzung, um sicherzustellen, dass der Code klar und effizient ist.

Erklären Sie das Konzept des 'Rundfunks' in Numpy -Arrays.Erklären Sie das Konzept des 'Rundfunks' in Numpy -Arrays.Apr 29, 2025 am 12:23 AM

SendeminnumpyissamethodtoperformoperationsonarraysofdifferentShapesByAutomaticaligningTHem.itsimplifiesCode, Verbesserung der Verschiebbarkeit, und BoostSPerformance.her'Showitworks: 1) kleinereArraysArepaddedwithonestOMatchDimens.2) compatibledimens

Erklären Sie, wie Sie zwischen Listen, Array.Array und Numpy -Arrays für die Datenspeicherung auswählen.Erklären Sie, wie Sie zwischen Listen, Array.Array und Numpy -Arrays für die Datenspeicherung auswählen.Apr 29, 2025 am 12:20 AM

Forpythondatastorage, ChooselistsforflexibilitätswithmixedDatatypes, Array.Arrayformemory-effizientesHomogenoususnumericalData und NumpyArraysForAdvancedNumericalComputing.ListsareversAntileffictionForLarGenicalDataSetsetaSets;

Geben Sie ein Beispiel für ein Szenario an, in dem die Verwendung einer Python -Liste angemessener wäre als die Verwendung eines Arrays.Geben Sie ein Beispiel für ein Szenario an, in dem die Verwendung einer Python -Liste angemessener wäre als die Verwendung eines Arrays.Apr 29, 2025 am 12:17 AM

PythonlistsarebetterTterThanarraysFormAnagingDiversedatatypes.1) ListScanholdElements ofdifferenttypes, 2) siearedynamic, erlauben EasyDitionSsandremovals, 3) sie antelluitive Operationenslikesklikationen, Buth), sie ohne Ereignis-effosidentandslowentlaunenfeuer.

Wie können Sie in einem Python -Array auf Elemente zugreifen?Wie können Sie in einem Python -Array auf Elemente zugreifen?Apr 29, 2025 am 12:11 AM

ToaccesselementSinapythonarray, useIndexing: my_array [2] AccessaThThirtelement, returning3.pythonuseszero-basiertindexing.1) usepositiveAndnegativeIndexing: my_list [0] fORGHEFIRSTELEMENT, MY_LIST [-1] Forthelast.2) VerwendungsforArange: my_list [1: 5] extractsselemen

Ist das Tupelverständnis in Python möglich? Wenn ja, wie und wenn nicht warum?Ist das Tupelverständnis in Python möglich? Wenn ja, wie und wenn nicht warum?Apr 28, 2025 pm 04:34 PM

In Artikel wird die Unmöglichkeit des Tupelverständnisses in Python aufgrund von Syntax -Mehrdeutigkeiten erörtert. Alternativen wie die Verwendung von Tuple () mit Generatorausdrücken werden vorgeschlagen, um Tupel effizient zu erstellen (159 Zeichen)

Was sind Module und Pakete in Python?Was sind Module und Pakete in Python?Apr 28, 2025 pm 04:33 PM

Der Artikel erläutert Module und Pakete in Python, deren Unterschiede und Verwendung. Module sind einzelne Dateien, während Pakete Verzeichnisse mit einer __init__.py -Datei sind, die verwandte Module hierarchisch organisieren.

Was ist Docstring in Python?Was ist Docstring in Python?Apr 28, 2025 pm 04:30 PM

In Artikel werden Docstrings in Python, deren Nutzung und Vorteile erörtert. Hauptproblem: Bedeutung von DocStrings für die Code -Dokumentation und -zugriffsfunktion.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

WebStorm-Mac-Version

WebStorm-Mac-Version

Nützliche JavaScript-Entwicklungstools

Sicherer Prüfungsbrowser

Sicherer Prüfungsbrowser

Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.