cari

Rumah  >  Soal Jawab  >  teks badan

Perangkak web - python merangkak tapak web dan menghuraikan kandungan bukan json

Saya baru belajar mendapatkan kandungan json, tetapi tapak web yang saya crawl hari ini tidak mengembalikan kandungan json, dan nombor rawak dijana selepas setiap pautan permintaan

Saya tidak tahu sama ada ia akan menjejaskan kandungan yang saya ingin merangkak

Kandungan yang perlu anda perolehi ialah kandungan di tengah-tengah gambar di bawah


Pautan laman web http://www.szse.cn/main/discl...

Kod yang saya cuba sendiri:

import requests

dir = '/Users/S1Lence/Desktop/new_html/szse/许可类重组问询函'

headers = {'Host': 'www.szse.cn',
       'Referer': 'http://www.szse.cn/main/disclosure/jgxxgk/wxhj/',
       'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36'
       }
payload= {'ACTIONID': '7',          
       'AJAX': 'AJAX-TRUE',
      'CATALOGID': 'main_wxhj',
      'TABKEY': 'tab1',
      'selecthjlb': '许可类重组问询函',
      'tab1PAGENO': '1',
      'tab1PAGECOUNT': '7',
      'tab1RECORDCOUNT': '63',
      'REPORT_ACTION': 'navigate'}
res = requests.post('http://www.szse.cn/szseWeb/FrontControllere', data=payload)
print(res.text)

Kandungan keluaran tidak seperti yang saya mahukan?

学习ing学习ing2704 hari yang lalu1098

membalas semua(2)saya akan balas

  • 黄舟

    黄舟2017-06-28 09:28:28

    Salin maklumat pengepalanya dan gunakannya. .

    balas
    0
  • 漂亮男人

    漂亮男人2017-06-28 09:28:28

    Alamat url siaran anda salah, sepatutnya

    http://www.szse.cn/szseWeb/FrontController.szse

    balas
    0
  • Batalbalas