


Pourquoi puis-je obtenir l'erreur 'liste hors de portée' lors de l'utilisation de Crawler Python?
Erreur "lister l'index hors de portée" dans Python Crawler: Cause et solution
Lorsque vous utilisez Python et BeautifulSoup pour la rampe Web, vous rencontrez souvent des erreurs list index out of range
. Ce problème peut se produire même si le code n'est pas modifié, en particulier lorsqu'il s'agit de pages Web dynamiques ou de modifications de la structure du site Web. Cet article analyse la cause de cette erreur et fournit une solution efficace.
Voici un exemple de code qui démontre ce qui pourrait provoquer cette erreur:
Demandes d'importation De BS4 Import BeautifulSoup En-têtes = {'User-Agent': 'Mozilla / 5.0 (Windows NT 10.0; Win64; X64) Applewebkit / 537.36 (Khtml, comme Gecko) Chrome / 124.0.0.0 Safari / 537.36 EDG / 124.0.0.0'} Response = requers.get ("https://www.iqiyi.com/ranks1/3/0", en-têtes = en-têtes) print (réponse.status_code) réponse = réponse.Text Soup = BeautifulSoup (réponse, "html.parser") def extract_data (): titres = [title.get_text (). strip () pour le titre dans soup.find_all ("div", classe _ = "rvi__tit1")] Heat = [Heat.get_text (). Strip () For Heat in Soup.find_all ("Span", classe _ = "RVI__Index__Num")] introductions = [intro.get_text (). strip () pour intro dans soup.find_all ("p", classe _ = "rvi__des2")] Titres de retour, chaleur, introductions Def Display_data (titres, chaleur, introductions): min_len = min (len (titres), len (chaleur), len (introductions))) pour i dans la gamme (min_len): print (f "classement: {i 1}, titre: {titres [i]}, popularité: {Heat [i]}, introduction: {introductions [i]}") Si __Name__ == '__MAIN__': Titres, Heat, introductions = extract_data () Display_data (titres, chaleur, introduction)
Dans cet exemple, list index out of range
se produit généralement dans display_data
. La raison en est la suivante: les longueurs des trois listes de titles
, heat
et introductions
peuvent être incohérentes. Si l'une des listes a une longueur inférieure à 10 (ou la plage de boucles), une erreur de non-limite d'index se produira lors de l'accès aux éléments de la liste.
Solution:
La clé est de s'assurer qu'avant d'accès à l'élément de liste, la longueur de la liste est vérifiée et que les éléments de la plage d'index valides sont accessibles. Le code amélioré est le suivant:
Demandes d'importation De BS4 Import BeautifulSoup # ... (les en-têtes et la demande restent les mêmes) ... def extract_data (): # ... (l'extraction reste la même) ... Def Display_data (titres, chaleur, introductions): min_len = min (len (titres), Len (Heat), len (introductions)) # trouvez la liste la plus courte pour i dans la gamme (min_len): print (f "classement: {i 1}, titre: {titres [i]}, popularité: {Heat [i]}, introduction: {introductions [i]}") Si __Name__ == '__MAIN__': Titres, Heat, introductions = extract_data () Display_data (titres, chaleur, introduction)
En calculant la longueur la plus courte des trois listes min_len
et en utilisant min_len
comme plage de la boucle, nous nous assurons qu'aucun éléments en dehors de la plage d'index de liste ne soit accessible, évitant efficacement les erreurs list index out of range
. Il s'agit d'un moyen de traitement plus robuste qui peut s'adapter aux modifications dans différentes structures de pages Web et volumes de données. De plus, l'ajout de mécanismes de gestion des erreurs (tels que les blocs try-except
) est également une bonne pratique de programmation qui peut gérer des situations plus complexes.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Créer des tableaux multidimensionnels avec Numpy peut être réalisé via les étapes suivantes: 1) Utilisez la fonction numpy.array () pour créer un tableau, tel que np.array ([[1,2,3], [4,5,6]]) pour créer un tableau 2D; 2) utiliser np.zeros (), np.ones (), np.random.random () et d'autres fonctions pour créer un tableau rempli de valeurs spécifiques; 3) Comprendre les propriétés de forme et de taille du tableau pour vous assurer que la longueur du sous-réseau est cohérente et éviter les erreurs; 4) Utilisez la fonction NP.Reshape () pour modifier la forme du tableau; 5) Faites attention à l'utilisation de la mémoire pour vous assurer que le code est clair et efficace.

BroadcastingInNumpyIsAmethodToperformOperations OnerwaysofdifferentShapesByAutomAticalAligningThem.itImplienScode, améliore la réadabilité et BoostsTerformance.He'showitwork

Forpythondatastorage, chooseListsforflexibilitywithMixedDatatyS, array.Arrayformmemory-efficienthomogeneousnumericalData, andNumpyArraysforaSvancedNumericalComputing.ListaSaRaySatilebutless

PythonlistsArebetterThanArraysformMagingDiversEDATATYPES.1) ListScan HoldingElementoSoFferentTypes, 2) Ils ont été aaredamique, permettant à la manière dont 4) ils ne sont pas entièrement efficaces et les opérations sont en train de les affirmer.

ToaccesElementsInapythonArray, useIndexing: my_array [2] AccessEstheThirdElement, returning3.pythonusZero-basedIndexing.

L'article discute de l'impossibilité de la compréhension des tuples dans Python en raison de l'ambiguïté de la syntaxe. Des alternatives comme l'utilisation de Tuple () avec des expressions de générateur sont suggérées pour créer efficacement les tuples. (159 caractères)

L'article explique les modules et les packages dans Python, leurs différences et leur utilisation. Les modules sont des fichiers uniques, tandis que les packages sont des répertoires avec un fichier __init__.py, organisant des modules connexes hiérarchiquement.

L'article traite des docstrings dans Python, de leur utilisation et des avantages. Problème principal: Importance des docstrings pour la documentation du code et l'accessibilité.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

Listes Sec
SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

SublimeText3 Linux nouvelle version
Dernière version de SublimeText3 Linux
