検索

ホームページ  >  に質問  >  本文

Web クローラー - Python を使用して Blog Park ブログ内の写真をクロールするにはどうすればよいですか?

Blog Park ブログ内の画像をクロールするための小さなコードを書きました。このコードは一部のリンクでは有効ですが、一部のリンクはクロールされるとすぐにエラーを報告します。理由は何ですか?

リーリー

図に示すように、画像は正しくクロールできます

URLを

に変更した場合 リーリー

その後、すぐにエラーを報告してください

解決してください、ありがとう!

某草草某草草2754日前914

全員に返信(1)返信します

  • 我想大声告诉你

    我想大声告诉你2017-05-18 10:47:39

    Web ページのソース コードを見ると、エラー メッセージはすでに非常に明白です。一致する最初の画像は GIF 形式であり、まだ相対パスであるため、ダウンロードできないため、IOerror が表示されます。ダウンロードした場合、形式を JPG として指定したため、開くことができません。 したがって、必要なのは判断してフィルタリングすることだけです

    リーリー

    もちろん、これは最も単純な判断にすぎませんが、2 番目のプログラムがエラーを報告しないようにすることができ、またアイデアも得られます。

    返事
    0
  • キャンセル返事