検索

ホームページ  >  に質問  >  本文

Python - リダイレクトされた Web サイトからデータをクロールする方法

私は現在、クローラーに関する知識を学習し、Selenium を使用して複雑な Web サイトをクロールしています。
問題が発生しました。クロールする必要がある作業指示書 Web サイト (パスワードがわかりません) は、まず認証システムにログインする必要があり、次に認証システム ページで作業指示書システム接続をクリックします。作業指示書システムの Web サイトにアクセスします。このシステムのデータをクロールするには、クローラをどのように使用すればよいですか?
以下は、作業指示システムに関する認証システム Selenium で取得した HTML です。 リーリー

怪我咯怪我咯2755日前1031

全員に返信(2)返信します

  • 漂亮男人

    漂亮男人2017-05-19 10:09:30

    Firefox 拡張機能である Selenium ide を使用して操作を記録します。
    次にPythonファイルにエクスポートします。
    変更して実行するだけです。

    昆虫マスターが書いた本を読むことをお勧めします。

    返事
    0
  • 曾经蜡笔没有小新

    曾经蜡笔没有小新2017-05-19 10:09:30

    たとえば、リクエスト ライブラリをクローラーとして使用する場合、最初に session() を作成し、A がログインし、B がジャンプ先のページになります。

    リーリー

    作成された T は保存された Cookie を表し、永久に保持されます

    返事
    0
  • キャンセル返事