Blog Park 블로그의 사진을 크롤링하기 위해 작은 코드를 작성했습니다. 이 코드는 일부 링크에 효과적이지만 일부 링크는 크롤링되자마자 오류를 보고합니다. 이유는 무엇입니까?
으아악사진과 같이 이미지 크롤링이 제대로 가능합니다
URL을
로 변경하면 으아악그러면 즉시 오류가 보고됩니다
해결해주세요, 감사합니다!
我想大声告诉你2017-05-18 10:47:39
오류 메시지는 이미 매우 명확합니다. 웹 페이지의 소스 코드를 보면 일치하는 첫 번째 이미지가 GIF 형식이고 여전히 상대 경로이므로 다운로드할 수 없으므로 IOerror가 발생합니다. 다운로드한 경우에는 형식을 JPG로 지정했기 때문에 열 수 없습니다. 그러니 판단하고 필터링만 하면 됩니다
으아악내가 추가한 곳을 보세요. 물론 이것은 가장 단순한 판단일 뿐이지만 두 번째 프로그램이 오류를 보고하지 않도록 보장할 수 있고 아이디어도 제공합니다!