찾다

 >  Q&A  >  본문

웹 크롤러 - Python을 사용하여 Blog Park 블로그의 사진을 크롤링하는 방법은 무엇입니까?

Blog Park 블로그의 사진을 크롤링하기 위해 작은 코드를 작성했습니다. 이 코드는 일부 링크에 효과적이지만 일부 링크는 크롤링되자마자 오류를 보고합니다. 이유는 무엇입니까?

으아악

사진과 같이 이미지 크롤링이 제대로 가능합니다

URL을

로 변경하면 으아악

그러면 즉시 오류가 보고됩니다

해결해주세요, 감사합니다!

某草草某草草2754일 전910

모든 응답(1)나는 대답할 것이다

  • 我想大声告诉你

    我想大声告诉你2017-05-18 10:47:39

    오류 메시지는 이미 매우 명확합니다. 웹 페이지의 소스 코드를 보면 일치하는 첫 번째 이미지가 GIF 형식이고 여전히 상대 경로이므로 다운로드할 수 없으므로 IOerror가 발생합니다. 다운로드한 경우에는 형식을 JPG로 지정했기 때문에 열 수 없습니다. 그러니 판단하고 필터링만 하면 됩니다

    으아악

    내가 추가한 곳을 보세요. 물론 이것은 가장 단순한 판단일 뿐이지만 두 번째 프로그램이 오류를 보고하지 않도록 보장할 수 있고 아이디어도 제공합니다!

    회신하다
    0
  • 취소회신하다