Python Crawler의 "인덱스 목록"오류 : 원인 및 솔루션
웹 크롤링에 Python과 BeautifulSoup을 사용하는 경우 종종 list index out of range
만날 수 있습니다. 이 문제는 코드가 수정되지 않은 경우에도 발생할 수 있습니다. 특히 동적 웹 페이지 또는 웹 사이트 구조 변경을 처리 할 때는이 문제가 발생할 수 있습니다. 이 기사는이 오류의 원인을 분석하고 효과적인 솔루션을 제공합니다.
다음은이 오류가 발생할 수있는 원인을 보여주는 샘플 코드입니다.
가져 오기 요청 BS4 Import BeautifulSoup에서 헤더 = { '사용자 에이전트': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebkit/537.36 (Gecko Like Gecko) Chrome/124.0.0.0 Safari/537.36 EDG/124.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0. 응답 = requests.get ( "https://www.iqiyi.com/ranks1/3/0", 헤더 = 헤더) print (response.status_code) 응답 = response.text 수프 = BeautifulSoup (응답, "html.parser") def extract_data () : titles = [title.get_text (). strip () stour.find_all ( "div", class _ = "rvi__tit1")의 제목에 대한 strip ()] heat = [heat.get_text (). Strip () 수프 열에 대한 스트립 () .find_all ( "span", class _ = "rvi__ index__num")] 소개 = [intro.get_text (). Strip ()의 소개에 대한 Strip () .find_all ( "p", class _ = "rvi__des2")] 제목, 열, 소개를 반환합니다 def display_data (제목, 열, 소개) : min_len = min (Len (제목), Len (Heat), Len (소개))) IN RANGE (Min_LEN)의 경우 : print (f "순위 : {i 1}, 제목 : {제목 [i]}, population : {heat [i]}, 소개 : {소개 [i]}") __name__ == '__main__': 제목, 열, 소개 = Extract_Data () Display_Data (제목, 열, 소개)
이 예에서는 list index out of range
일반적으로 display_data
함수에서 발생합니다. 그 이유는 다음과 같습니다. titles
, heat
및 introductions
의 세 목록의 길이는 일관성이 없을 수 있습니다. 목록 중 하나가 길이가 10 미만 (또는 루프 범위)을 갖는 경우 목록 요소에 액세스 할 때 인덱스 외부 오류가 발생합니다.
해결책:
열쇠는 목록 요소에 액세스하기 전에 목록의 길이를 확인하고 유효한 인덱스 범위 내의 요소 만 액세스하는 것입니다. 개선 된 코드는 다음과 같습니다.
가져 오기 요청 BS4 Import BeautifulSoup에서 # ... (헤더와 요청은 동일하게 유지됩니다) ... def extract_data () : # ... (추출은 동일하게 유지됩니다) ... def display_data (제목, 열, 소개) : min_len = min (Len (제목), Len (Heat), Len (소개)) # 가장 짧은 목록 찾기 IN RANGE (Min_LEN)의 경우 : print (f "순위 : {i 1}, 제목 : {제목 [i]}, population : {heat [i]}, 소개 : {소개 [i]}") __name__ == '__main__': 제목, 열, 소개 = Extract_Data () Display_Data (제목, 열, 소개)
세 목록 중 가장 짧은 길이를 min_len
가장 짧은 길이를 계산하고 min_len
루프 범위로 사용함으로써 목록 인덱스 범위 외부의 요소가 액세스되지 않아 list index out of range
피하십시오. 이것은 다른 웹 페이지 구조 및 데이터 볼륨의 변경에 적응할 수있는보다 강력한 처리 방법입니다. 또한 오류 처리 메커니즘 (예 : try-except
블록)을 추가하는 것도 더 복잡한 상황을 처리 할 수있는 좋은 프로그래밍 연습입니다.
위 내용은 Python Crawler를 사용할 때 '범위에서 목록'오류를 가져 오는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

다음 단계를 통해 Numpy를 사용하여 다차원 배열을 만들 수 있습니다. 1) Numpy.array () 함수를 사용하여 NP.Array ([[1,2,3], [4,5,6]]과 같은 배열을 생성하여 2D 배열을 만듭니다. 2) np.zeros (), np.ones (), np.random.random () 및 기타 함수를 사용하여 특정 값으로 채워진 배열을 만듭니다. 3) 서브 어레이의 길이가 일관되고 오류를 피하기 위해 배열의 모양과 크기 특성을 이해하십시오. 4) NP.Reshape () 함수를 사용하여 배열의 모양을 변경하십시오. 5) 코드가 명확하고 효율적인지 확인하기 위해 메모리 사용에주의를 기울이십시오.

BroadcastingInnumpyIsamethodtoperformoperationsonArraysoffferentShapesByAutomicallyAligningThem.itsimplifiesCode, enourseadability, andboostsperformance.here'showitworks : 1) smalraysarepaddedwithonestomatchdimenseare

forpythondatastorage, chooselistsforflexibilitywithmixeddatatypes, array.arrayformemory-effic homogeneousnumericaldata, andnumpyarraysforadvancednumericalcomputing.listsareversatilebutlessefficipforlargenumericaldatasets.arrayoffersamiddlegro

pythonlistsarebetterthanarraysformanagingDiversEdatatypes.1) 1) listscanholdementsofdifferentTypes, 2) thearedynamic, weantEasyAdditionSandremovals, 3) wefferintufiveOperationsLikEslicing, but 4) butiendess-effectorlowerggatesets.

toaccesselementsInapyThonArray : my_array [2] AccessHetHirdElement, returning3.pythonuseszero 기반 인덱싱 .1) 사용 positiveAndnegativeIndexing : my_list [0] forthefirstelement, my_list [-1] forstelast.2) audeeliciforarange : my_list

기사는 구문 모호성으로 인해 파이썬에서 튜플 이해의 불가능성에 대해 논의합니다. 튜플을 효율적으로 생성하기 위해 튜플 ()을 사용하는 것과 같은 대안이 제안됩니다. (159 자)

이 기사는 파이썬의 모듈과 패키지, 차이점 및 사용법을 설명합니다. 모듈은 단일 파일이고 패키지는 __init__.py 파일이있는 디렉토리이며 관련 모듈을 계층 적으로 구성합니다.

기사는 Python의 Docstrings, 사용법 및 혜택에 대해 설명합니다. 주요 이슈 : 코드 문서 및 접근성에 대한 문서의 중요성.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Dreamweaver Mac版
시각적 웹 개발 도구

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음
