찾다

 >  Q&A  >  본문

python - 리디렉션된 웹사이트에서 데이터를 크롤링하는 방법

현재 저는 크롤러에 대한 지식을 배우고 셀레늄을 사용하여 일부 복잡한 웹사이트를 크롤링하고 있습니다.
크롤링해야 하는 작업 주문 웹사이트(비밀번호를 모릅니다)에 먼저 인증 시스템에 로그인한 후 인증 시스템 페이지에서 작업 주문 시스템 연결을 클릭해야 하는 데 문제가 발생했습니다. 로그인하지 않고 자동으로 작업 주문으로 이동합니다. 단일 시스템 웹사이트에서 이 시스템의 데이터를 크롤링하려면 크롤러를 어떻게 사용해야 합니까?
다음은 셀레늄으로 얻은 작업 지시 시스템, 인증 시스템에 대한 html입니다

으아아아
怪我咯怪我咯2755일 전1030

모든 응답(2)나는 대답할 것이다

  • 漂亮男人

    漂亮男人2017-05-19 10:09:30

    Firefox 확장 프로그램인 Selenium ide를 사용하여 작업을 기록하세요.
    그런 다음 Python 파일로 내보냅니다.
    변경하고 실행하면 됩니다.

    곤충의 달인이 쓴 책을 읽어보시길 권합니다.

    회신하다
    0
  • 曾经蜡笔没有小新

    曾经蜡笔没有小新2017-05-19 10:09:30

    예를 들어 요청 라이브러리를 크롤러로 사용하는 경우 먼저 session()을 생성하고 A가 로그인하면 B가 이동할 페이지입니다.

    으아아아

    생성된 T는 영원히 유지되는 저장된 쿠키를 나타냅니다.

    회신하다
    0
  • 취소회신하다