Rumah  >  Soal Jawab  >  teks badan

python - Cara merangkak data dari tapak web yang diubah hala

Pada masa ini saya sedang mempelajari sedikit pengetahuan tentang perangkak dan menggunakan selenium untuk merangkak beberapa tapak web yang kompleks.
Saya menghadapi masalah Tapak web pesanan kerja yang perlu saya crawl (saya tidak tahu kata laluan) perlu log masuk ke sistem pengesahan dahulu, dan kemudian klik pada sambungan sistem pesanan kerja pada halaman sistem pengesahan, dan ia akan secara automatik melompat ke perintah kerja tanpa log masuk. Satu tapak web sistem, bagaimanakah saya harus menggunakan perangkak untuk merangkak data sistem ini?
Berikut ialah html tentang sistem pesanan kerja yang diperolehi oleh selenium, sistem pengesahan

<a href="/link-test001" target="_blank" title="工单系统" rel="link-test001" data="1" datasrc="工单系统|||/files/link/test001.gif|||new|||/link-test001">
    <img src="/files/link/test001.gif" width="25" height="25" alt="工单系统" align="absmiddle"><span>工单系统</span>
</a>
怪我咯怪我咯2710 hari yang lalu982

membalas semua(2)saya akan balas

  • 漂亮男人

    漂亮男人2017-05-19 10:09:30

    Gunakan ide selenium, sambungan firefox, untuk merekodkan operasi.
    Kemudian eksport ke fail python.
    Hanya tukar dan jalankan.

    Saya cadangkan anda membaca buku yang ditulis oleh tuan serangga.

    balas
    0
  • 曾经蜡笔没有小新

    曾经蜡笔没有小新2017-05-19 10:09:30

    Sebagai contoh, jika anda menggunakan pustaka permintaan sebagai perangkak, buat session() dahulu, A log masuk dan B ialah halaman untuk melompat ke.

    T=requests.session()
    A=T.post(url=url,data=data)
    B=T.get(url=url)

    T yang dicipta mewakili kuki yang disimpan, yang akan disimpan selama-lamanya

    balas
    0
  • Batalbalas