首頁  >  問答  >  主體

linux - python 抓取公眾號文章遇到驗證問題

linux 下抓取微信公眾號文章遇到驗證問題! ! ! ! ! ! ! !

這是我要抓取的人民日報連結:http://mp.weixin.qq.com/profile?src=3×tamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjNV7C9V4ohwPbx pcSJKFdmGMx5g==
1:首先瀏覽器上訪問是正常的。
2:linux下存取提示需要驗證,以下是簡單的程式碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==
response = urllib2.urlopen(url)
print response.read()

存取的結果如下:

#補充說明下公眾號連結的取得方式:
1:先造訪連結:http://weixin.sogou.com/weixi...
2:再取得人民日報公眾號的連結進行跳轉。

大家讲道理大家讲道理2713 天前606

全部回覆(4)我來回復

  • 習慣沉默

    習慣沉默2017-05-16 13:35:44

    都不模擬header請求頭的,就能抓嗎,建議先模擬request header再試一次

    回覆
    0
  • 某草草

    某草草2017-05-16 13:35:44

    雷雷

    回覆
    0
  • 淡淡烟草味

    淡淡烟草味2017-05-16 13:35:44

    現在在請求中加了header後,回傳的錯誤是這樣的。請各位大神麻煩再支下招

    回覆
    0
  • 習慣沉默

    習慣沉默2017-05-16 13:35:44

    用request可以,本地環境Mac OSX , python3.6.1

    import requests
    
    headers = {'user-agent' : 'Mozilla/5.0'}
    respon = requests.get('http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==', headers = headers)
    respon.encoding = 'utf-8'
    print(respon.text)

    內容在紅色框那一行

    回覆
    0
  • 取消回覆