


Warum bekomme ich den Fehler 'Listenliste außerhalb des Reichweite' bei der Verwendung von Python Crawler?
Fehler "Listenindex außerhalb des Bereichs" Fehler in Python Crawler: Ursache und Lösung
Wenn Sie Python und BeautifulSoup für das Web -Crawling verwenden, stoßen Sie häufig list index out of range
. Dieses Problem kann auch dann auftreten, wenn der Code nicht geändert wird, insbesondere wenn es sich um dynamische Webseiten oder Website -Strukturänderungen handelt. Dieser Artikel analysiert die Ursache dieses Fehlers und bietet eine effektive Lösung.
Hier ist ein Beispielcode, der demonstriert, was diesen Fehler verursachen könnte:
Anfragen importieren Aus BS4 Import BeautifulSoup Headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebkit/537.36 (KHTML, wie Gecko) Chrome/124.0.0.0 Safari/537.36 EDG/124.0.0.0'} Antwort = Requests.get ("https://www.iqiyi.com/ranks1/3/0", Headers = Headers) print (Antwort.Status_code) Antwort = Antwort.text Suppe = BeautifulSoup (Antwort, "html.parser") Def extract_data (): titles = [title.get_text (). strip () für Titel in Suppe.find_all ("div", class _ = "rvi__tit1")] heat = [heat.get_text (). strip () für hitze in suppe.find_all ("span", class _ = "rvi__Index__num")] Einführungen = [intro.get_text (). Strip () für Intro in Suppe.find_all ("P", Klasse _ = "rvi__Des2")] Rückgabetitel, Wärme, Einführungen Def display_data (Titel, Wärme, Einführungen): min_len = min (Len (Titel), Len (Hitze), Len (Einführungen)) Für i in Reichweite (min_len): print (f "Ranking: {i 1}, Titel: {Titel [i]}, Popularität: {Wärme [i]}, Einführung: {Einführungen [i]}") Wenn __name__ == '__main__': Titel, Wärme, Einführungen = extract_data () display_data (Titel, Wärme, Einführungen)
In diesem Beispiel erfolgt list index out of range
in display_data
in der Lage ist, normalerweise in der DILD_DATA. Der Grund ist: Die Längen der drei Listen von titles
, heat
und introductions
können inkonsistent sein. Wenn eine der Listen eine Länge von weniger als 10 (oder den Reichweite von Schleifen) hat, tritt bei dem Zugriff auf die Listenelemente ein Index-Fehler auf.
Lösung:
Der Schlüssel besteht darin, sicherzustellen, dass vor dem Zugriff auf das Listenelement die Länge der Liste überprüft wird und nur Elemente innerhalb des gültigen Indexbereichs zugegriffen werden. Der verbesserte Code lautet wie folgt:
Anfragen importieren Aus BS4 Import BeautifulSoup # ... (Header und Anfrage bleibt gleich) ... Def extract_data (): # ... (Extraktion bleibt gleich) ... Def display_data (Titel, Wärme, Einführungen): min_len = min (Len (Titel), Len (Hitze), Len (Einführungen)) # Die kürzeste Liste finden Für i in Reichweite (min_len): print (f "Ranking: {i 1}, Titel: {Titel [i]}, Popularität: {Wärme [i]}, Einführung: {Einführungen [i]}") Wenn __name__ == '__main__': Titel, Wärme, Einführungen = extract_data () display_data (Titel, Wärme, Einführungen)
Durch die Berechnung der kürzesten Länge der drei Listen min_len
und die Verwendung min_len
als Bereich der Schleife stellen wir sicher, dass keine Elemente außerhalb des List -Indexbereichs zugegriffen werden, wodurch list index out of range
unzureichend vermieden werden. Dies ist eine robustere Verarbeitungsmethode, die sich an Änderungen in verschiedenen Webseitenstrukturen und Datenvolumina anpassen kann. Zusätzlich ist das Hinzufügen von Fehlerbehandlungsmechanismen (z. B. try-except
Blöcken) auch eine gute Programmierpraxis, die komplexere Situationen bewältigen kann.
Das obige ist der detaillierte Inhalt vonWarum bekomme ich den Fehler 'Listenliste außerhalb des Reichweite' bei der Verwendung von Python Crawler?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Durch die folgenden Schritte können mehrdimensionale Arrays mit Numpy erstellt werden: 1) Verwenden Sie die Funktion numpy.array (), um ein Array wie NP.Array ([1,2,3], [4,5,6]) zu erstellen, um ein 2D-Array zu erstellen; 2) Verwenden Sie np.zeros (), np.ones (), np.random.random () und andere Funktionen, um ein Array zu erstellen, das mit spezifischen Werten gefüllt ist; 3) Verstehen Sie die Form- und Größeneigenschaften des Arrays, um sicherzustellen, dass die Länge des Unterarrays konsistent ist und Fehler vermeiden. 4) Verwenden Sie die Funktion np.reshape (), um die Form des Arrays zu ändern. 5) Achten Sie auf die Speichernutzung, um sicherzustellen, dass der Code klar und effizient ist.

SendeminnumpyissamethodtoperformoperationsonarraysofdifferentShapesByAutomaticaligningTHem.itsimplifiesCode, Verbesserung der Verschiebbarkeit, und BoostSPerformance.her'Showitworks: 1) kleinereArraysArepaddedwithonestOMatchDimens.2) compatibledimens

Forpythondatastorage, ChooselistsforflexibilitätswithmixedDatatypes, Array.Arrayformemory-effizientesHomogenoususnumericalData und NumpyArraysForAdvancedNumericalComputing.ListsareversAntileffictionForLarGenicalDataSetsetaSets;

PythonlistsarebetterTterThanarraysFormAnagingDiversedatatypes.1) ListScanholdElements ofdifferenttypes, 2) siearedynamic, erlauben EasyDitionSsandremovals, 3) sie antelluitive Operationenslikesklikationen, Buth), sie ohne Ereignis-effosidentandslowentlaunenfeuer.

ToaccesselementSinapythonarray, useIndexing: my_array [2] AccessaThThirtelement, returning3.pythonuseszero-basiertindexing.1) usepositiveAndnegativeIndexing: my_list [0] fORGHEFIRSTELEMENT, MY_LIST [-1] Forthelast.2) VerwendungsforArange: my_list [1: 5] extractsselemen

In Artikel wird die Unmöglichkeit des Tupelverständnisses in Python aufgrund von Syntax -Mehrdeutigkeiten erörtert. Alternativen wie die Verwendung von Tuple () mit Generatorausdrücken werden vorgeschlagen, um Tupel effizient zu erstellen (159 Zeichen)

Der Artikel erläutert Module und Pakete in Python, deren Unterschiede und Verwendung. Module sind einzelne Dateien, während Pakete Verzeichnisse mit einer __init__.py -Datei sind, die verwandte Module hierarchisch organisieren.

In Artikel werden Docstrings in Python, deren Nutzung und Vorteile erörtert. Hauptproblem: Bedeutung von DocStrings für die Code -Dokumentation und -zugriffsfunktion.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Dreamweaver CS6
Visuelle Webentwicklungstools

WebStorm-Mac-Version
Nützliche JavaScript-Entwicklungstools

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.
