C# 網頁抓取驗證:POST 和 GET 請求實用指南
網頁抓取受保護的網站需要使用者驗證。本指南詳細介紹如何使用 C# 登入網站,繞過進階庫的典型限制。 我們將專注於使用 WebRequest
和 WebResponse
來精確控制 HTTP 請求。
先決條件:
- 需要登入才能存取內容的網站。
- 熟悉 C# 程式設計和網頁抓取基礎。
實作步驟:
身份驗證涉及兩個關鍵步驟:
-
發佈登入憑證:
- 建立登入 URL 並正確編碼表單參數(使用者名稱、密碼)。
- 使用 POST 方法、內容類型(「application/x-www-form-urlencoded」)和資料長度配置
WebRequest
。 - 發送包含編碼表單資料的 POST 請求。
- 從回應的「Set-Cookie」標頭中提取身份驗證 cookie。這個cookie對於後續請求至關重要。
-
取得受保護的內容:
- 為受保護頁面建立
WebRequest
。 - 將步驟1中獲得的身份驗證cookie加入到請求標頭中。
- 伺服器驗證 cookie,授予對受保護資源的存取權。
- 使用
StreamReader
檢索並處理頁面的HTML原始碼。
- 為受保護頁面建立
程式碼範例:
此範例示範登入與擷取受保護的頁面:
string loginUrl = "http://www.mmoinn.com/index.do?PageModule=UsersAction&Action=UsersLogin"; string loginParams = string.Format("email_address={0}&password={1}", "your email", "your password"); string cookieHeader; WebRequest loginRequest = WebRequest.Create(loginUrl); loginRequest.ContentType = "application/x-www-form-urlencoded"; loginRequest.Method = "POST"; byte[] data = Encoding.ASCII.GetBytes(loginParams); loginRequest.ContentLength = data.Length; using (Stream requestStream = loginRequest.GetRequestStream()) { requestStream.Write(data, 0, data.Length); } WebResponse loginResponse = loginRequest.GetResponse(); cookieHeader = loginResponse.Headers["Set-cookie"]; string protectedPageUrl = "http://www.mmoinn.com/protected_page.html"; WebRequest protectedRequest = WebRequest.Create(protectedPageUrl); protectedRequest.Headers.Add("Cookie", cookieHeader); WebResponse protectedResponse = protectedRequest.GetResponse(); using (StreamReader reader = new StreamReader(protectedResponse.GetResponseStream())) { string pageSource = reader.ReadToEnd(); // Process the protected page's HTML }
此程式碼說明了完整的身份驗證流程:發送 POST 請求、檢索 cookie,並使用該 cookie 透過 GET 請求存取受保護的內容。 請記得將 "your email"
和 "your password"
替換為實際憑證。 應該為健壯的應用程式添加錯誤處理(例如,無效憑證)。
以上是如何在 C# 中使用 POST 和 GET 請求驗證 Web 抓取?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文解釋了C標準模板庫(STL),重點關注其核心組件:容器,迭代器,算法和函子。 它詳細介紹了這些如何交互以啟用通用編程,提高代碼效率和可讀性t

本文詳細介紹了c中有效的STL算法用法。 它強調了數據結構選擇(向量與列表),算法複雜性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和並行執行。 常見的陷阱

本文詳細介紹了C中的有效異常處理,涵蓋了嘗試,捕捉和投擲機制。 它強調了諸如RAII之類的最佳實踐,避免了不必要的捕獲塊,並為強大的代碼登錄例外。 該文章還解決了Perf

本文討論了使用C中的移動語義來通過避免不必要的複制來提高性能。它涵蓋了使用std :: Move的實施移動構造函數和任務運算符,並確定了關鍵方案和陷阱以有效

C 20範圍通過表現力,合成性和效率增強數據操作。它們簡化了複雜的轉換並集成到現有代碼庫中,以提高性能和可維護性。

本文討論了C中的動態調度,其性能成本和優化策略。它突出了動態調度會影響性能並將其與靜態調度進行比較的場景,強調性能和之間的權衡

文章討論了在C中有效使用RVALUE參考,以進行移動語義,完美的轉發和資源管理,重點介紹最佳實踐和性能改進。(159個字符)


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Dreamweaver CS6
視覺化網頁開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器