使用URL訪問http服務器
阿新 • • 發佈:2017-09-17
重定向 一個 標識 狀態碼 自己 字符串 授權 .com 請求
一、概念定義
1、URI - 通用資源標識符
URI通常由三部分組成,
- 資源訪問機制
- 存放資源的主機名
- 資源自身名稱
如: http://www.baidu.com/html
http://www.baidu.com/html/talk.html
file://www.xxx.com/xxx/dirA
file://www.xxx.com/xxx/xxx.txt
2、URL - 統一資源定位符
uri的子集,Internet上描述信息資源的字符串
二、使用url
1、方式一:使用URL類
通過創建URL對象來獲得InputStream,像操作本地文件一樣操作網絡資源。
URL url = new URL("http://www.baidu.com/html/talk.html");
InputStream is = url.openStream();
用java.net包來模擬瀏覽器客戶端,這種方式代碼量大, 要處理的情況很多。
更簡單的,一般采用開源軟件 HttpClient 來訪問 URL.
2、使用HttpClient的GetMethod
2.1、引入依賴
2.2、編寫代碼
2.3、執行結果
3、使用HttpClient的PostMethod
3.1、引入依賴
3.2、編寫代碼
3.3、執行結果
同上!
4、使用HttpClient的PostMethod
4.1、引入依賴
4.2、編寫代碼
4.3、執行結果
三、一個例子
1、抓取頁面
1.1、編寫代碼
1.2、執行結果
2、處理http狀態碼
2.1、2xx
200 成功
204
2.2、3xx 通常進行轉向
300 3xx的默認解釋
301 重定向分配到的url
302 重定向到臨時的url
304 請求的資源未更新,請求丟棄
2.3、4xx
400 非法請求,請求丟棄
401 未授權,請求丟棄
403 禁止,請求丟棄
404 沒有找到,請求丟棄
2.4、5xx
5xx 狀態碼 表示 服務器發現自己出現錯誤,不能繼續執行該請求
使用URL訪問http服務器