1. 程式人生 > >使用URL訪問http服務器

使用URL訪問http服務器

重定向 一個 標識 狀態碼 自己 字符串 授權 .com 請求

一、概念定義

1、URI - 通用資源標識符

URI通常由三部分組成,

  • 資源訪問機制
  • 存放資源的主機名
  • 資源自身名稱

如: http://www.baidu.com/html

http://www.baidu.com/html/talk.html

file://www.xxx.com/xxx/dirA

file://www.xxx.com/xxx/xxx.txt

2、URL - 統一資源定位符

uri的子集,Internet上描述信息資源的字符串

二、使用url

1、方式一:使用URL類

通過創建URL對象來獲得InputStream,像操作本地文件一樣操作網絡資源。

URL url = new URL("http://www.baidu.com/html/talk.html");

InputStream is = url.openStream();

用java.net包來模擬瀏覽器客戶端,這種方式代碼量大, 要處理的情況很多。

更簡單的,一般采用開源軟件 HttpClient 來訪問 URL.

2、使用HttpClient的GetMethod

2.1、引入依賴

技術分享

2.2、編寫代碼

技術分享

2.3、執行結果

技術分享

3、使用HttpClient的PostMethod

3.1、引入依賴

3.2、編寫代碼

技術分享

3.3、執行結果

同上!

4、使用HttpClient的PostMethod

4.1、引入依賴

4.2、編寫代碼

技術分享

4.3、執行結果

三、一個例子

1、抓取頁面

1.1、編寫代碼

技術分享

1.2、執行結果

技術分享

2、處理http狀態碼

2.1、2xx

200 成功

204

2.2、3xx 通常進行轉向

300 3xx的默認解釋

301 重定向分配到的url

302 重定向到臨時的url

304 請求的資源未更新,請求丟棄

2.3、4xx

400 非法請求,請求丟棄

401 未授權,請求丟棄

403 禁止,請求丟棄

404 沒有找到,請求丟棄

2.4、5xx

5xx 狀態碼 表示 服務器發現自己出現錯誤,不能繼續執行該請求

使用URL訪問http服務器