ホームページ  >  に質問  >  本文

Web クローラー - Java クローラーはイメージのリンクを取得しましたが、イメージをダウンロードできません

クローラーが取得した対応画像リソースsrcのhtmlコードは以下の通りです

しかし、画像をダウンロードするためにコードを介してリソースをリンクに変換すると、400 エラーが報告されました

しかし、Chromeを使ってリンクが存在するかどうかテストしてみたところ、相手のWebサイトサーバーが認識できる本物は

であることがわかりました。

つまり、Web ページから画像リソースを取得するためのリンクは
http://www.neofactory.co.jp/i... 2.jpg
ですが、取得するためのリンクは画像は通常
http://www.neofactory.co.jp/i...

です

次に何をすべきかアドバイスをください。インターネットで多くの情報を調べましたが、まだ解決策がありません。
ps: 奇妙なことに、Firefox を使用すると、上のリンクから画像も取得できるので、困惑しています。

######コード:######

パブリック クラス イメージ { リーリー

}

黄舟黄舟2692日前533

全員に返信(2)返信します

  • 高洛峰

    高洛峰2017-05-17 10:03:58

    ドメイン名+取得したimg src属性を組み合わせるだけではだめでしょうか?

    返事
    0
  • 过去多啦不再A梦

    过去多啦不再A梦2017-05-17 10:03:58

    URLエンコード

    返事
    0
  • キャンセル返事