程序模拟浏览器请求及会话保持-python实现-Python教程-PHP中文网

首页

后端开发

Python教程

程序模拟浏览器请求及会话保持-python实现

高洛峰

Oct 18, 2016 am 09:20 AM

python下读取一个页面的数据可以通过urllib2轻松实现请求

import urllib2
print urllib2.urlopen(&#39;http://www.pythontab.com&#39;).read()

涉及到页面的POST请求操作的话需要提供头信息，提交的post数据和请求页面。

其中的post数据需要urllib.encode()一下，其实就是将字典转换成“data1=value1&data2=value2”的格式。

import urllib
import urllib2
  
HEADER = {
    &#39;User-Agent&#39; : &#39;Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20100101 Firefox/31.0&#39;,
    &#39;Referer&#39; : &#39;http://202.206.1.163/logout.do&#39;
}
  
POSTDATA = {
    &#39;data1&#39;: &#39;value1&#39;,
    &#39;data2&#39;: &#39;value2&#39;
}
  
HOSTURL = &#39;http://xxx.com&#39;
  
enpostdata = urllib.urlencode(POSTDATA)
urlrequest = urllib2.Request(hosturl,enpostdata,HEADER)
urlresponse = urllib2.urlopen(urlrequest)
  
print urlresponse.read()

请求之后浏览器会有一个会话保持的过程，会话都是保存在一个cookie里面的，下一次页面的请求会把cookie放到请求头，如果cookie丢失会话也就断开了。

在python下面需要设置一下cookie的保持

# cookie set
# 用来保持会话
cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)

下面是将以上知识点汇总写的一个库文件，方便使用：

# filename: analogop.py
  
#!/usr/bin/python
# -*-coding:UTF-8 -*-
  
# author: 初行
# qq: 121866673
# mail: zxbd1016@163.com
# message: I need a python job
# time: 2014/10/8
  
import urllib
import urllib2
import cookielib
  
# cookie set
# 用来保持会话
cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)
  
# default header
HEADER = {
    &#39;User-Agent&#39; : &#39;Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20100101 Firefox/31.0&#39;,
    &#39;Referer&#39; : &#39;http://202.206.1.163/logout.do&#39;
}
  
# operate method
def geturlopen(hosturl, postdata = {}, headers = HEADER):
    # encode postdata
    enpostdata = urllib.urlencode(postdata)
    # request url
    urlrequest = urllib2.Request(hosturl, enpostdata, headers)
    # open url
    urlresponse = urllib2.urlopen(urlrequest)
    # return url
    return urlresponse

这个是测试文件，因为读者没有测试环境，需要自己搭建或者找个网站测试：

#filename: test.py
from analogop import geturlopen
  
postd = {
    &#39;usernum&#39;: &#39;2011411111&#39;,
    &#39;upw&#39;: &#39;124569&#39;,
    &#39;userip&#39;: &#39;192.168.10.1&#39;,
    &#39;token&#39;: &#39;xxx&#39;
}
  
urlread = geturlopen(&#39;http://127.0.0.1:8000/login/&#39;, postd)
print urlread.read().decode(&#39;utf-8&#39;)
urlread = geturlopen(&#39;http://127.0.0.1:8000/chafen/&#39;, {})
print urlread.read().decode(&#39;utf-8&#39;)

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

您如何切成python阵列？May 01, 2025 am 12:18 AM

Python列表切片的基本语法是list[start:stop:step]。1.start是包含的第一个元素索引，2.stop是排除的第一个元素索引，3.step决定元素之间的步长。切片不仅用于提取数据，还可以修改和反转列表。

在什么情况下，列表的表现比数组表现更好？May 01, 2025 am 12:06 AM

ListSoutPerformarRaysin：1）DynamicsizicsizingandFrequentInsertions/删除，2）储存的二聚体和3）MemoryFeliceFiceForceforseforsparsedata，butmayhaveslightperformancecostsinclentoperations。

如何将Python数组转换为Python列表？May 01, 2025 am 12:05 AM

toConvertapythonarraytoalist，usEthelist（）constructororageneratorexpression.1）intimpthearraymoduleandcreateanArray.2）USELIST（ARR）或[XFORXINARR] to ConconverTittoalist，请考虑performorefformanceandmemoryfformanceandmemoryfformienceforlargedAtasetset。

当Python中存在列表时，使用数组的目的是什么？May 01, 2025 am 12:04 AM

choosearraysoverlistsinpythonforbetterperformanceandmemoryfliceSpecificScenarios.1）largenumericaldatasets：arraysreducememoryusage.2）绩效 - 临界杂货：arraysoffersoffersOffersOffersOffersPoostSfoostSforsssfortasssfortaskslikeappensearch orearch.3）testessenforcety：arraysenforce：arraysenforc