tomcat之web容器
深入學習Java Web伺服器系列一
一個簡單的靜態web容器
我們下面來實現一個簡單的靜態web容器。
這個伺服器要實現的功能很簡單,就是啟動監聽,當用戶在瀏覽器輸入URL傳送http請求時,伺服器進行解析並返回請求的靜態資源。系統的時序圖如下所示:
下面我們一起來實現這個簡單的靜態web伺服器。
本文分成三個部分,第一和第二部分為知識介紹,簡單介紹一下http協議和Socket協議,因為這兩個協議是實現伺服器的核心,我們只有熟悉這兩個協議才能理解伺服器的整個運作流程,第三部分我們將用程式碼實現這個伺服器。
1. HTTP協議
HTTP是一種協議,允許web伺服器和瀏覽器通過網際網路進行來發送和接受資料。它是一種請求和響應協議。客戶端請求一個檔案而伺服器響應請求。HTTP使用可靠的TCP連線–TCP預設使用80埠。
在HTTP中,始終都是客戶端通過建立連線和傳送一個HTTP請求從而開啟一個事務。web伺服器不需要聯絡客戶端或者對客戶端做一個回撥連線。無論是客戶端或者伺服器都可以提前終止連線。舉例來說,當你正在使用一個web瀏覽器的時候,可以通過點選瀏覽器上的停止按鈕來停止一個檔案的下載程序,從而有效的關閉與web伺服器的HTTP連線。
HTTP請求
一個HTTP請求包括三個組成部分:
- 方法—統一資源識別符號(URI)—協議/版本
- 請求的頭部
- 主體內容
下面是一個HTTP請求的例子:
POST /examples/default.jsp HTTP/1.1
Accept: text/plain; text/html
Accept-Language: en-gb
Connection: Keep-Alive
Host: localhost
User-Agent: Mozilla/4.0 (compatible; MSIE 4.01; Windows 98) Content-Length: 33 Content-Type : application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
請求的頭部包含了關於客戶端環境和請求的主體內容的有用資訊。例如它可能包括瀏覽器設定的語言,主體內容的長度等等。每個頭部通過一個回車換行符(CRLF)來分隔的。 對於HTTP請求格式來說,頭部和主體內容之間有一個回車換行符(CRLF)是相當重要的。CRLF告訴HTTP伺服器主體內容是在什麼地方開始的。
HTTP響應
類似於HTTP請求,一個HTTP響應也包括三個組成部分:
- 方法—統一資源識別符號(URI)—協議/版本
- 響應的頭部
- 主體內容
下面是一個HTTP響應的例子:
HTTP/1.1 200 OK
Server: Microsoft-IIS/4.0
Date: Mon, 5 Jan 2004 13:13:33 GMT
Content-Type: text/html
Last-Modified: Mon, 5 Jan 2004 13:13:12 GMT
Content-Length: 112
<html>
<head>
<title>HTTP Response Example</title>
</head>
<body>
Welcome!
</body>
</html>
響應頭部的第一行類似於請求頭部的第一行。第一行告訴你該協議使用HTTP 1.1,請求成功(200=成功),表示一切都執行良好。 響應頭部和請求頭部類似,也包括很多有用的資訊。響應的主體內容是響應本身的HTML內容。頭部和主體內容通過CRLF分隔開來。
2. Socket
Socket類
套接字是網路連線的一個端點。套接字使得一個應用可以從網路中讀取和寫入資料。放在兩個不同計算機上的兩個應用可以通過連線傳送和接受位元組流。為了從你的應用傳送一條資訊到另一個應用,你需要知道另一個應用的IP地址和套接字埠。在Java裡邊,套接字指的是java.net.Socket類。 要建立一個套接字,你可以使用Socket類眾多構造方法中的一個。其中一個接收主機名稱和埠號:
public Socket (java.lang.String host, int port)
在這裡主機是指遠端機器名稱或者IP地址,埠是指遠端應用的埠號。
ServerSocket類
Socket類代表一個客戶端套接字,即任何時候你想連線到一個遠端伺服器應用的時候你構造的套接字,現在,假如你想實施一個伺服器應用,例如一個HTTP伺服器或者FTP伺服器,你需要一種不同的做法。這是因為你的伺服器必須隨時待命,因為它不知道一個客戶端應用什麼時候會嘗試去連線它。為了讓你的應用能隨時待命,你需要使用java.net.ServerSocket類。這是伺服器套接字的實現。
ServerSocket和Socket不同,伺服器套接字的角色是等待來自客戶端的連線請求。一旦伺服器套接字獲得一個連線請求,它建立一個Socket例項來與客戶端進行通訊。 要建立一個伺服器套接字,你需要使用ServerSocket類提供的四個構造方法中的一個。你需要指定IP地址和伺服器套接字將要進行監聽的埠號。通常,IP地址將會是127.0.0.1,也就是說,伺服器套接字將會監聽本地機器。伺服器套接字正在監聽的IP地址被稱為是繫結地址。伺服器套接字的另一個重要的屬性是backlog,這是伺服器套接字開始拒絕傳入的請求之前,傳入的連線請求的最大佇列長度。 其中一個ServerSocket類的構造方法如下所示:
public ServerSocket(int port, int backLog, InetAddress bindingAddress);
3. 程式碼實現
下面我們來實現這個簡單的伺服器吧。
我們先分析一下功能,首先,我們需要有一個伺服器的入口,用來監聽客戶端的http請求,然後還需要進行httprequest和httpresponse的請求。
所以在這裡我們新建三個類,分別是
HttpServer
Request
Response
HttpServer類的功能是啟動伺服器監聽,呼叫request解析http請求,呼叫response構造http響應
Request的功能就是解析http協議並獲得請求靜態資源的名稱
Response的功能就是根據request來返回資料
根據上面的分析,我們可以畫出下面的類圖
下面來實現上面的三個類:
HttpServer類
這個類是函式的入口函式,我們在這裡啟動了8090埠的監聽,並使用一個while輪詢來進行處理httprequest,再把request傳給response進行Response物件的構建。
package Series1;
import java.net.Socket;
import java.net.ServerSocket;
import java.net.InetAddress;
import java.io.InputStream;
import java.io.OutputStream;
import java.io.IOException;
import java.io.File;
public class HttpServer {
//WEB_ROOT為我們靜態資源的目錄地址,在專案的根目錄下建立一個資料夾webroot
public static final String WEB_ROOT =
System.getProperty("user.dir") + File.separator + "webroot";
//入口方法
public static void main(String[] args) {
HttpServer server = new HttpServer();
server.await();
}
//伺服器監聽方法,伺服器監聽8090埠
public void await() {
ServerSocket serverSocket = null;
int port = 8090;
try {
//開啟serversocket
serverSocket = new ServerSocket(port, 1, InetAddress.getByName("127.0.0.1"));
}
catch (IOException e) {
e.printStackTrace();
System.exit(1);
}
//輪詢客戶端請求
while (true) {
Socket socket = null;
InputStream input = null;
OutputStream output = null;
try {
socket = serverSocket.accept();
input = socket.getInputStream();
output = socket.getOutputStream();
// request處理
Request request = new Request(input);
request.parse();
// 建立response
Response response = new Response(output);
response.setRequest(request);
response.sendStaticResource();
//關閉連線
socket.close();
}
catch (Exception e) {
e.printStackTrace();
continue;
}
}
}
}
Request類
Response類用來獲取request解析的uri的內容併發送到客戶端
Request類需要實現的功能就是解析http請求,獲取請求的靜態資源名稱
package Series1;
import java.io.InputStream;
import java.io.IOException;
public class Request {
private InputStream input;
private String uri;
public Request(InputStream input) {
this.input = input;
}
/**
* 獲取http請求的頭資料
*/
public void parse() {
//讀取httprequest的請求資料
StringBuffer request = new StringBuffer(2048);
int i;
byte[] buffer = new byte[2048];
try {
i = input.read(buffer);
}
catch (IOException e) {
e.printStackTrace();
i = -1;
}
for (int j=0; j<i; j++) {
request.append((char) buffer[j]);
}
System.out.print(request.toString());
uri = parseUri(request.toString());
}
/**
* 獲取http請求的資源名稱uri
* @param requestString
* @return
*/
private String parseUri(String requestString) {
int index1, index2;
index1 = requestString.indexOf(' ');
if (index1 != -1) {
index2 = requestString.indexOf(' ', index1 + 1);
if (index2 > index1)
return requestString.substring(index1 + 1, index2);
}
return null;
}
public String getUri() {
return uri;
}
}
Response類
package Series1;
import java.io.OutputStream;
import java.io.IOException;
import java.io.FileInputStream;
import java.io.File;
public class Response {
private static final int BUFFER_SIZE = 1024;
Request request;
OutputStream output;
public Response(OutputStream output) {
this.output = output;
}
public void setRequest(Request request) {
this.request = request;
}
/**
* 傳送靜態資源
* @throws IOException
*/
public void sendStaticResource() throws IOException {
byte[] bytes = new byte[BUFFER_SIZE];
FileInputStream fis = null;
try {
File file = new File(HttpServer.WEB_ROOT, request.getUri());
if (file.exists()) {
fis = new FileInputStream(file);
int ch = fis.read(bytes, 0, BUFFER_SIZE);
while (ch!=-1) {
output.write(bytes, 0, ch);
ch = fis.read(bytes, 0, BUFFER_SIZE);
}
}
else {
//檔案不存在
String errorMessage = "HTTP/1.1 404 File Not Found\r\n" +
"Content-Type: text/html\r\n" +
"Content-Length: 23\r\n" +
"\r\n" +
"<h1>File Not Found</h1>";
output.write(errorMessage.getBytes());
}
}
catch (Exception e) {
// 傳送異常
System.out.println(e.toString() );
}
finally {
if (fis!=null)
fis.close();
}
}
}
上面三個類就是這個靜態web伺服器的實現了,我們執行HttpServer類,在專案的根目錄下新建一個webroot資料夾,並新建一個index.html檔案。
<html>
<title>This is my index</title>
<body>
Welcome!
</body>
</html>
我們可以看到瀏覽器上輸出了我們的index.html,說明我們的靜態web伺服器實現成功了。
總結
當我們在瀏覽器中輸入http://127.0.0.1:8090/index.html時,瀏覽器會發s送一個http請求(http底層是採用socket短連線實現的)。
GET /index.html HTTP/1.1
Accept: text/html, application/xhtml+xml, image/jxr, */*
Accept-Language: zh-CN
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.79 Safari/537.36 Edge/14.14393
Accept-Encoding: gzip, deflate
Host: 127.0.0.1:8090
Connection: Keep-Alive
http請求會觸發HttpServer的serverSocket.accept()這個阻塞方法,繼續執行後面的await()方法的程式碼。
然後呼叫 request.parse()來獲取到http請求的uri=/index.html
最後通過response.sendStaticResource()獲取/index.html的檔案流併發送給socket客戶端,也就是瀏覽器,這樣子瀏覽器就可以顯示index.html了。