requests - 关于python模拟登陆抓取网站信息

Question

我想用requests实现在www.lu.com模拟登陆后抓取一些产品信息，通过chrome的抓包工具我抓到了登陆时的form data和header(变量header)，以及访问需要抓取的页面时的header(变量listheader),但运行完程序后我输入r.u...

大家讲道理 · Answer

# coding=utf-8

__author__ = 'Rich'

import requests

session = requests.session()
session.headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36'
}
data = {
    'userName': 'XXXXXXX',
    'password': 'XXXXXXXX',
    'isTrust': 'Y',
    'loginFlag': '1',
    'validNum': '',
    'loginagree': 'on'
}

session.post('https://user.lu.com/user/login', data=data)

r = session.get('https://list.lu.com/list/productDetail/transferFa?riskFlag=false&productId=31398999')
print r.text

requests - 关于python模拟登陆抓取网站信息

répondre à tous(1)je répondrai