recherche
Maisondéveloppement back-endTutoriel PythonPourquoi puis-je obtenir l'erreur 'liste hors de portée' lors de l'utilisation de Crawler Python?

Pourquoi puis-je obtenir l'erreur

Erreur "lister l'index hors de portée" dans Python Crawler: Cause et solution

Lorsque vous utilisez Python et BeautifulSoup pour la rampe Web, vous rencontrez souvent des erreurs list index out of range . Ce problème peut se produire même si le code n'est pas modifié, en particulier lorsqu'il s'agit de pages Web dynamiques ou de modifications de la structure du site Web. Cet article analyse la cause de cette erreur et fournit une solution efficace.

Voici un exemple de code qui démontre ce qui pourrait provoquer cette erreur:

 Demandes d'importation
De BS4 Import BeautifulSoup

En-têtes = {'User-Agent': 'Mozilla / 5.0 (Windows NT 10.0; Win64; X64) Applewebkit / 537.36 (Khtml, comme Gecko) Chrome / 124.0.0.0 Safari / 537.36 EDG / 124.0.0.0'}
Response = requers.get ("https://www.iqiyi.com/ranks1/3/0", en-têtes = en-têtes)
print (réponse.status_code)
réponse = réponse.Text
Soup = BeautifulSoup (réponse, "html.parser")

def extract_data ():
    titres = [title.get_text (). strip () pour le titre dans soup.find_all ("div", classe _ = "rvi__tit1")]
    Heat = [Heat.get_text (). Strip () For Heat in Soup.find_all ("Span", classe _ = "RVI__Index__Num")]
    introductions = [intro.get_text (). strip () pour intro dans soup.find_all ("p", classe _ = "rvi__des2")]
    Titres de retour, chaleur, introductions

Def Display_data (titres, chaleur, introductions):
    min_len = min (len (titres), len (chaleur), len (introductions)))
    pour i dans la gamme (min_len):
        print (f "classement: {i 1}, titre: {titres [i]}, popularité: {Heat [i]}, introduction: {introductions [i]}")


Si __Name__ == '__MAIN__':
    Titres, Heat, introductions = extract_data ()
    Display_data (titres, chaleur, introduction)

Dans cet exemple, list index out of range se produit généralement dans display_data . La raison en est la suivante: les longueurs des trois listes de titles , heat et introductions peuvent être incohérentes. Si l'une des listes a une longueur inférieure à 10 (ou la plage de boucles), une erreur de non-limite d'index se produira lors de l'accès aux éléments de la liste.

Solution:

La clé est de s'assurer qu'avant d'accès à l'élément de liste, la longueur de la liste est vérifiée et que les éléments de la plage d'index valides sont accessibles. Le code amélioré est le suivant:

 Demandes d'importation
De BS4 Import BeautifulSoup

# ... (les en-têtes et la demande restent les mêmes) ...

def extract_data ():
    # ... (l'extraction reste la même) ...

Def Display_data (titres, chaleur, introductions):
    min_len = min (len (titres), Len (Heat), len (introductions)) # trouvez la liste la plus courte
    pour i dans la gamme (min_len):
        print (f "classement: {i 1}, titre: {titres [i]}, popularité: {Heat [i]}, introduction: {introductions [i]}")


Si __Name__ == '__MAIN__':
    Titres, Heat, introductions = extract_data ()
    Display_data (titres, chaleur, introduction)

En calculant la longueur la plus courte des trois listes min_len et en utilisant min_len comme plage de la boucle, nous nous assurons qu'aucun éléments en dehors de la plage d'index de liste ne soit accessible, évitant efficacement les erreurs list index out of range . Il s'agit d'un moyen de traitement plus robuste qui peut s'adapter aux modifications dans différentes structures de pages Web et volumes de données. De plus, l'ajout de mécanismes de gestion des erreurs (tels que les blocs try-except ) est également une bonne pratique de programmation qui peut gérer des situations plus complexes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Comment créez-vous des tableaux multidimensionnels à l'aide de Numpy?Comment créez-vous des tableaux multidimensionnels à l'aide de Numpy?Apr 29, 2025 am 12:27 AM

Créer des tableaux multidimensionnels avec Numpy peut être réalisé via les étapes suivantes: 1) Utilisez la fonction numpy.array () pour créer un tableau, tel que np.array ([[1,2,3], [4,5,6]]) pour créer un tableau 2D; 2) utiliser np.zeros (), np.ones (), np.random.random () et d'autres fonctions pour créer un tableau rempli de valeurs spécifiques; 3) Comprendre les propriétés de forme et de taille du tableau pour vous assurer que la longueur du sous-réseau est cohérente et éviter les erreurs; 4) Utilisez la fonction NP.Reshape () pour modifier la forme du tableau; 5) Faites attention à l'utilisation de la mémoire pour vous assurer que le code est clair et efficace.

Expliquez le concept de «diffusion» dans les tableaux Numpy.Expliquez le concept de «diffusion» dans les tableaux Numpy.Apr 29, 2025 am 12:23 AM

BroadcastingInNumpyIsAmethodToperformOperations OnerwaysofdifferentShapesByAutomAticalAligningThem.itImplienScode, améliore la réadabilité et BoostsTerformance.He'showitwork

Expliquez comment choisir entre les listes, Array.array et les tableaux Numpy pour le stockage de données.Expliquez comment choisir entre les listes, Array.array et les tableaux Numpy pour le stockage de données.Apr 29, 2025 am 12:20 AM

Forpythondatastorage, chooseListsforflexibilitywithMixedDatatyS, array.Arrayformmemory-efficienthomogeneousnumericalData, andNumpyArraysforaSvancedNumericalComputing.ListaSaRaySatilebutless

Donnez un exemple de scénario où l'utilisation d'une liste Python serait plus appropriée que l'utilisation d'un tableau.Donnez un exemple de scénario où l'utilisation d'une liste Python serait plus appropriée que l'utilisation d'un tableau.Apr 29, 2025 am 12:17 AM

PythonlistsArebetterThanArraysformMagingDiversEDATATYPES.1) ListScan HoldingElementoSoFferentTypes, 2) Ils ont été aaredamique, permettant à la manière dont 4) ils ne sont pas entièrement efficaces et les opérations sont en train de les affirmer.

Comment accéder aux éléments dans un tableau Python?Comment accéder aux éléments dans un tableau Python?Apr 29, 2025 am 12:11 AM

ToaccesElementsInapythonArray, useIndexing: my_array [2] AccessEstheThirdElement, returning3.pythonusZero-basedIndexing.

La compréhension des tuples est-elle possible à Python? Si oui, comment et sinon pourquoi?La compréhension des tuples est-elle possible à Python? Si oui, comment et sinon pourquoi?Apr 28, 2025 pm 04:34 PM

L'article discute de l'impossibilité de la compréhension des tuples dans Python en raison de l'ambiguïté de la syntaxe. Des alternatives comme l'utilisation de Tuple () avec des expressions de générateur sont suggérées pour créer efficacement les tuples. (159 caractères)

Que sont les modules et les packages dans Python?Que sont les modules et les packages dans Python?Apr 28, 2025 pm 04:33 PM

L'article explique les modules et les packages dans Python, leurs différences et leur utilisation. Les modules sont des fichiers uniques, tandis que les packages sont des répertoires avec un fichier __init__.py, organisant des modules connexes hiérarchiquement.

Qu'est-ce que Docstring in Python?Qu'est-ce que Docstring in Python?Apr 28, 2025 pm 04:30 PM

L'article traite des docstrings dans Python, de leur utilisation et des avantages. Problème principal: Importance des docstrings pour la documentation du code et l'accessibilité.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Adaptateur de serveur SAP NetWeaver pour Eclipse

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

Télécharger la version Mac de l'éditeur Atom

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

Listes Sec

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

SublimeText3 Linux nouvelle version

SublimeText3 Linux nouvelle version

Dernière version de SublimeText3 Linux