WebClient 訪問間歇性返回403解決方案
說明:前段時間做的一個專案莫名的返回403的錯誤,這種情況也多大是程式設計師最不喜歡的了,沒辦法先來分析一下錯誤資訊。之前的程式碼如下:
WebClient webclient = new WebClient();
string u9Str = webclient.DownloadString("http://www.uuu9.com/");
很簡單的請求返回string資訊的程式碼,最詫異的是這個返回 “遠端伺服器返回錯誤: (403) 已禁止。”的錯誤還是間歇性的,報錯的機率很小但是肯定存在,因為檢視錯誤日誌讓我找到了這個bug.
解決方案:
1.根據以往的經驗推測403錯誤的原因分析。
2.既然是模擬訪問,那麼真實的訪問是哪些東東呢,訪問引數對比。
實施:
1.一般造成403原因是許可權設定問題,也就是說可能沒有許可權造成的,那麼訪問的時候加上信任許可權即可。
程式碼:webclient.Credentials = CredentialCache.DefaultCredentials; // 新增授權證書
2.真實請求的資訊截圖:
下面引用一段請求標頭引數代表含義的資訊:
Accept:瀏覽器可接受的MIME型別。
Accept-Charset:瀏覽器可接受的字符集。
Accept-Encoding:瀏覽器能夠進行解碼的資料編碼方式,比如gzip。Servlet能夠向支援gzip的瀏覽器返回經gzip編碼的HTML頁面。許多情形下這可以減少5到10倍的下載時間。
Accept-Language:瀏覽器所希望的語言種類,當伺服器能夠提供一種以上的語言版本時要用到。 Authorization:授權資訊,通常出現在對伺服器傳送的WWW-Authenticate頭的應答中。
Connection:表示是否需要持久連線。如果Servlet看到這裡的值為“Keep-Alive”,或者看到請求使用的是HTTP 1.1(HTTP 1.1預設進行持久連線),它就可以利用持久連線的優點,當頁面包含多個元素時(例如Applet,圖片),顯著地減少下載所需要的時間。要實現這一點,Servlet需要在應答中傳送一個Content-Length頭,最簡單的實現方法是:先把內容寫入ByteArrayOutputStream,然後在正式寫出內容之前計算它的大小。
Content-Length:表示請求訊息正文的長度。
Cookie:這是最重要的請求頭資訊之一
From:請求傳送者的email地址,由一些特殊的Web客戶程式使用,瀏覽器不會用到它。
Host:初始URL中的主機和埠。
If-Modified-Since:只有當所請求的內容在指定的日期之後又經過修改才返回它,否則返回304“Not Modified”應答。
Pragma:指定“no-cache”值表示伺服器必須返回一個重新整理後的文件,即使它是代理伺服器而且已經有了頁面的本地拷貝。
Referer:包含一個URL,使用者從該URL代表的頁面出發訪問當前請求的頁面。
User-Agent:瀏覽器型別,如果Servlet返回的內容與瀏覽器型別有關則該值非常有用。
UA-Pixels,UA-Color,UA-OS,UA-CPU:由某些版本的IE瀏覽器所傳送的非標準的請求頭,表示螢幕大小、顏色深度、作業系統和CPU型別。
每個標頭獨佔一行, 最後必須要有一個空行。
看來以上的對照覺得有用的就是2個資訊需要設定,Host和User-Agent需要設定,如下:
webclient.Headers.Add("User-Agent", "Microsoft Internet Explorer");
webclient.Headers.Add("Host", "www.uuu9.com");
總結,完整程式碼如下:
WebClient webclient = new WebClient();
string u9Str = webclient.DownloadString("http://www.uuu9.com/");
// 以下為解決方案webclient.Credentials = CredentialCache.DefaultCredentials; // 新增授權證書webclient.Headers.Add("User-Agent", "Microsoft Internet Explorer");
webclient.Headers.Add("Host", "www.uuu9.com");
如果對您有用請點選支援,謝謝。