在.NET中通過程式填寫和提交表單還是比較簡單。比如,要提交一個如所示的登入表單:
填寫和提交以上表單的代碼如下:
// 要提交表單的URI字串。
string uriString = "http://www.xxx.com/Login.aspx";
// 要提交的字串資料。
string postString = "userName=user1&password=password1";
// 初始化WebClient
WebClient webClient = new WebClient();
webClient.Headers.Add("Content-Type", "application/x-www-form-urlencoded");
// 將字串轉換成位元組數組
byte[] postData = Encoding.ASCII.GetBytes(postString);
// 上傳資料,返回頁面的位元組數組
byte[] responseData = webClient.UploadData(uriString, "POST", postData);
// 返回的將位元組數群組轉換成字串(HTML)
string srcString = Encoding.UTF8.GetString(responseData);
srcStrinig 就是提交表單後所返回頁面的HTML。怎麼樣,很簡單吧。
但是,以上代碼可以提交ASP或JSP產生的表單,卻不能提交ASP.NET表單。因為提交ASP.NET表單時,必須給“__VIEWSTATE”和“__EVENTVALIDATION”賦值。“__VIEWSTATE”和“__EVENTVALIDATION”的值可以通過在要提交的頁面上按右鍵“查看源檔案”中找到。如下:
id="__VIEWSTATE" value="/wEPDwUKMTg0NTgwMzM2M2RksjXHwIOzdq/skwDy1k6qTexm2j0="
id="__EVENTVALIDATION" value="/wEWBAKxhbOEAQKPpuq2CALyveCRDwLejM6fDwP2723lUdzBJVBIAVzbpM2sXYqc"
通過“查看源檔案”得到的“__VIEWSTATE”和“__EVENTVALIDATION”的值還不能直接提交給表單,還需要轉換成URL編碼的字串。
viewState = System.Web.HttpUtility.UrlEncode(viewState);
eventValidation = System.Web.HttpUtility.UrlEncode(eventValidation);
完整的代碼如下:
// 提交按鈕的文本
string submitButton = "登入";
// 頁面的 VeiwState(可以通過IE開啟頁面,右鍵“查看源檔案”取得)
string viewState = "/wEPDwUKMTg0NTgwMzM2M2RksjXHwIOzdq/skwDy1k6qTexm2j0=";
// 頁面的 EventValidation(可以通過IE開啟頁面,右鍵“查看源檔案”取得)
string eventValidation = "/wEWBAKxhbOEAQKPpuq2CALyveCRDwLejM6fDwP2723lUdzBJVBIAVzbpM2sXYqc";
submitButton = System.Web.HttpUtility.UrlEncode(submitButton);
viewState = System.Web.HttpUtility.UrlEncode(viewState);
eventValidation = System.Web.HttpUtility.UrlEncode(eventValidation);
try
{
// 要提交表單的URI字串。
string uriString = "http://www.xxx.com/Login.aspx";
// 要提交的字串資料。格式形如:user=uesr1&password=123
string postString = "userName=1&password=1" + "&loginButton=" + submitButton + "&__VIEWSTATE=" + viewState + "&__EVENTVALIDATION=" + eventValidation;
// 初始化WebClient
WebClient webClient = new WebClient();
webClient.Headers.Add("Content-Type", "application/x-www-form-urlencoded");
// 將字串轉換成位元組數組
byte[] postData = Encoding.ASCII.GetBytes(postString);
// 上傳資料,返回頁面的位元組數組
byte[] responseData = webClient.UploadData(uriString, "POST", postData);
// 將返回的將位元組數群組轉換成字串(HTML);
// ASP.NET 返回的頁面一般是Unicode,如果是簡體中文應使用
// Encoding.GetEncoding("GB2312").GetString(responseData)
string srcString = Encoding.UTF8.GetString(responseData);
}
catch (WebException we)
{
string msg = we.Message;
}
幾點說明:
1) srcStrinig 是提交表單後所返回頁面的HTML,可以使用Regex等來分析之,以獲得你所需要的資料。
2) “__VIEWSTATE”和“__EVENTVALIDATION”的值不是不是一成不變的。
3) 查看網頁POST的資料還可以通過一些工具來查看,比如: 網頁資料分析工具HttpWatch,網路嗅探器等。
4) 如果提交的表單有驗證碼,則不在本文討論的範圍內。
相關文章:使用WebClient自動填寫並提交ASP.NET頁面表單的原始碼
在C#中使用Regex自動匹配並擷取所需要的資料
本文地址:http://www.cnblogs.com/anjou/archive/2006/12/25/602943.html