検索

ホームページ  >  に質問  >  本文

网页爬虫 - python爬虫翻页问题,请问各位大神我这段代码怎样翻页,还有价格要登陆后才能看到,应该怎么解决

import urllib.request
import re
web=urllib.request.urlopen('https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=')
neirong=web.read()
def getPage(self,pageIndex):
    url = self.siteURL + "?pageNum=" + str(pageIndex)
    request = urllib2.Request(url)
    response = urllib2.urlopen(request)
    return response.read().decode('gbk')
jiangrenhua=neirong.decode('UTF-8')
RegularExpression='<td>(.*)<\/td>'
Valuable=re.findall(RegularExpression,jiangrenhua)
information=[]
for i in range(173):
    print(Valuable[i]
黄舟黄舟2787日前593

全員に返信(2)返信します

  • 黄舟

    黄舟2017-04-18 10:34:00

    リーリー

    これはページ番号コントロールではありませんか?
    ログイン後に表示された場合は、Cookie またはユーザー名とパスワードを使用してログインをシミュレートし、取得してください

    返事
    0
  • 迷茫

    迷茫2017-04-18 10:34:00

    httplib2 は基本的にすべての http リクエストのターミネータである必要があります。

    リーリー

    返事
    0
  • キャンセル返事