問題:我的網頁抓取程式需要登入使用者才能存取網站上的特定原始碼。如何在我的程式中實現登入功能來繞過此限制?
答案:要登入指定的網站(mmoinn.com/index.do?PageModule=UsersLogin),您可以按照以下步驟操作:
1. 向登入表單發送POST請求
將您的登入憑證格式化為表單POST:
<code class="language-csharp">string formUrl = "http://www.mmoinn.com/index.do?PageModule=UsersAction&Action=UsersLogin"; string formParams = string.Format("email_address={0}&password={1}", "您的邮箱地址", "您的密码"); WebRequest req = WebRequest.Create(formUrl); req.ContentType = "application/x-www-form-urlencoded"; req.Method = "POST"; byte[] bytes = Encoding.ASCII.GetBytes(formParams); req.ContentLength = bytes.Length; using (Stream os = req.GetRequestStream()) { os.Write(bytes, 0, bytes.Length); } WebResponse resp = req.GetResponse(); string cookieHeader = resp.Headers["Set-cookie"];</code>
2. 取得登入後的頁面
建立一個GET請求到所需的頁面,其中包含您從登入表單中檢索到的cookie標頭:
<code class="language-csharp">string getUrl = "登录后页面的URL"; WebRequest getRequest = WebRequest.Create(getUrl); getRequest.Headers.Add("Cookie", cookieHeader); WebResponse getResponse = getRequest.GetResponse(); using (StreamReader sr = new StreamReader(getResponse.GetResponseStream())) { string pageSource = sr.ReadToEnd(); }</code>
附加說明:
如果您想驗證登入POST的回應,您可以新增以下幾行程式碼:
<code class="language-csharp">using (StreamReader sr = new StreamReader(resp.GetResponseStream())) { string pageSource = sr.ReadToEnd(); }</code>
檢查pageSource字串以檢查伺服器的回應。
以上是如何使用 C# 以程式設計方式登入網站?的詳細內容。更多資訊請關注PHP中文網其他相關文章!