首頁 >後端開發 >php教程 >網頁爬蟲 - php如何透過curl模擬登入帶驗證碼網站並抓取資料?

網頁爬蟲 - php如何透過curl模擬登入帶驗證碼網站並抓取資料?

WBOY
WBOY原創
2016-08-04 09:19:442595瀏覽

現要模擬登入一個有驗證碼的網站(模擬一個登入頁面,手動輸入驗證碼),並即時擷取訂單資料。能否提供一個思路?

  1. 驗證碼圖片是否需要curl帶cookie抓取,儲存到本地,然後顯示在頁面上?
    2.我現在的做法是模擬登錄頁面的驗證碼圖片直接設置img的src為遠程鏈接,這樣貌似導致了我抓取到本​​地的cookie和瀏覽器緩存的cookie不一致,登錄結果會顯示登錄超時

回覆內容:

現要模擬登入一個有驗證碼的網站(模擬一個登入頁面,手動輸入驗證碼),並即時擷取訂單資料。能否提供一個思路?

  1. 驗證碼圖片是否需要curl帶cookie抓取,儲存到本地,然後顯示在頁面上?
    2.我現在的做法是模擬登錄頁面的驗證碼圖片直接設置img的src為遠程鏈接,這樣貌似導致了我抓取到本​​地的cookie和瀏覽器緩存的cookie不一致,登錄結果會顯示登錄超時

一般來說是訪問login頁面,保存cookie,用這個cookie去請求驗證碼,然後把帳號、密碼、cookie、驗證碼一起post過去

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn