1. 程式人生 > >Java之HTTP網路程式設計(一):TCP/SSL網頁下載

Java之HTTP網路程式設計(一):TCP/SSL網頁下載

目錄

一、簡介:HTTP程式設計

    1、HTTP系統設計

    2、HTTP客戶端工作過程

    3、HTTP服務端工作過程

二、基於TCP Socket的HTTP網頁下載

三、基於SSL Socket的HTTPS網頁下載

四、HTTP客戶端完整程式碼

五、介面完整程式碼

六、最後+演示


一、簡介:HTTP程式設計

期末複習之HTTP網路程式設計,主要學習記錄HTTP(s)協議的網路程式設計,包括使用TCP Socket進行三次握手的HTTP網頁下載,和使用SSL Socket的安全傳輸的HTTPs網頁下載,通過案例實踐自行完成程式設計,認識http(s)的實際工作機制!

現在的HTTP客戶端比早期的複雜得多,不僅包括了網頁檔案下載和顯示,還有許多新的功能:跨平臺的顯示、引數的傳遞、動態網頁的實現和使用者互動等。

1、HTTP系統設計

  • 客戶端軟體(web瀏覽器:Chrome、360瀏覽器等)
  • 服務端軟體(web伺服器:微軟的IIS、Apache Tomcat)

2、HTTP客戶端工作過程

  • 客戶端軟體和伺服器建立連線(TCP的三次握手);
  • 傳送HTTP頭格式協議;
  • 接收網頁檔案;
  • 顯示網頁。

3、HTTP服務端工作過程

  • 伺服器軟體開啟80埠;
  • 響應客戶的要求、完成TCP連線;
  • 檢查客戶端的HTTP頭格式傳送客戶請求的網頁檔案(含動態網頁)。 

圖1 HTTP請求-響應完整過程

網頁下載技術是搜尋引擎、網路爬蟲、網頁採集器或網路推送服務等相關應用領域內的基礎技術,下面會介紹日常使用到的兩種協議(http和https)的網頁訪問下載。

二、基於TCP Socket的HTTP網頁下載

對於TCP套接字的連線過程已經有很深刻的認識了,在本地測試通訊也使用過TCP的Socket建立連線,同理,與HTTP伺服器建立連線,也是利用TCP進行資訊互動的。

建立連線之後,需要傳送HTTP請求頭,伺服器確認請求者,開啟兩端的通訊,客戶端可以接收網頁檔案資訊,進而經過渲染後顯示網頁頁面。這裡我們先實現接收網頁檔案資訊,在下一篇實現瀏覽器對網頁渲染之後的功能。

以www.baidu.com為例,與HTTP伺服器建立連線之後,需要我們傳送網頁請求,也就是HTTP請求頭。構造請求頭如下:

GET / HTTP/1.1  

HOST: www.baidu.com

Accept: */*

Accept-Language: zh-cn

User-Agent: User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64)

Connection: Keep-Alive

 需要嚴格按照格式傳送,並且通常用StringBuffer類的toString()方法可將完整的HTTP請求頭轉換為字串,一致傳送到HTTP伺服器。

StringBuffer msg = new StringBuffer();
msg.append("GET / HTTP/1.1\r\n"+
            "HOST: "+domainName+"\r\n"+
            "Accept: */*\r\n"+
            "Accept-Language: zh-CN\r\n"+
            "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)\r\n"+
            "Connection: Keep-Alive\r\n"
);

 

 換行符使用\r\n是為了避免由於編碼問題出錯。

傳送請求之後如果網頁資訊顯示區返回的第一條資訊是“HTTP/1.1 200 OK”,則說明訪問正常。

可以看到HTTP伺服器返回許多資訊,這也是響應頭,包含了許多關鍵資訊內容。

三、基於SSL Socket的HTTPS網頁下載

以上面設計的基於TCP通訊傳輸的HTTP,我們嘗試訪問www.sina.com.cn,結果發現響應頭資訊第一行是HTTP/1.1 302 Moved Temporarily(站點被移除),出於安全考慮,現在絕大部分的web站點都將放棄HTTP而啟用HTTPS,都使用了安全加密傳輸的HTTPS協議,而關閉了HTTP,只允許啟用了SSL/TLS的HTTPS安全連線,這種連線預設是使用443埠。所以TCP Socket建立連線的方式無正常訪問網頁。

那只是埠改為443能正常嗎,答案如下。

原因在前面也能看出,需要使用SSL/TLS的HTTPS安全連線,來建立與HTTPS伺服器的通訊,因此需要修改Socket型別。

這裡使用到了Java安全套接字擴充套件(Java Secure Socket Extension,JSSE),基於SSL和TLS協議的Java網路應用程式提供了Java API以及參考實現,這裡使用其客戶端的SSLSocket套接字。SSLSocket相對之前學習的客戶端套接字,只是建立方法不同,SSLSocket物件由SSLSocketFactory建立。

在類中宣告成員變數以及建立Socket連線:

private SSLSocket socket;
private SSLSocketFactory factory;


factory=(SSLSocketFactory)SSLSocketFactory.getDefault();
socket=(SSLSocket)factory.createSocket(ip,Integer.parseInt(port));

 

 對SSL Socket的使用與TCP相同,只是建立方法不同,經過稍微修改之後,可以成功請求HTTPS網站的網頁資訊。

四、HTTP客戶端完整程式碼

這裡給出HTTP客戶端的完整程式碼,HTTPS只需改改上述講到的SSL Socket。

/*
 * HTTPClient.java
 * Copyright (c) 2020-12-21
 * author : Charzous
 * All right reserved.
 */

package chapter08;

import java.io.*;
import java.net.Socket;

public class HTTPClient {
    private Socket socket;

    private PrintWriter pw;
    private BufferedReader br;
    /**
     * @param ip
     * @param port
     * @return 
     * @author Charzous
     * @date 2020/12/21 14:52
     *
     */
    public HTTPClient(String ip, String port) throws IOException{
        //主動向伺服器發起連線,實現TCP三次握手
        //不成功則丟擲錯誤,由呼叫者處理錯誤
        socket =new Socket(ip,Integer.parseInt(port));

        //得到網路流輸出位元組流地址,並封裝成網路輸出字元流
        OutputStream socketOut=socket.getOutputStream();
        //引數true表示自動flush資料
        pw=new PrintWriter(new OutputStreamWriter(socketOut,"utf-8"),true);

        //得到網路輸入位元組流地址,並封裝成網路輸入字元流
        InputStream socketIn=socket.getInputStream();
        br=new BufferedReader(new InputStreamReader(socketIn,"utf-8"));

    }

    public void send(String msg) throws InterruptedException {
        //輸出字元流,由socket呼叫系統底層函式,經網絡卡傳送位元組流
        try {
            Thread.sleep(500);
        }catch (InterruptedException e){
            e.printStackTrace();
        }

        pw.println(msg);
    }

    public String receive(){
        String msg=null;
        try {
            //從網路輸入字元流中讀取資訊,每次只能接受一行資訊
            //不夠一行時(無行結束符),該語句阻塞
            //直到條件滿足,程式往下執行
            msg=br.readLine();
        }catch (IOException e){
            e.printStackTrace();
        }
        return msg;
    }

    public void close(){
        try {
            if (socket!=null)
                socket.close();
        }catch (IOException e){
            e.printStackTrace();
        }
    }

}

 

五、介面完整程式碼

我直接用一個圖形介面來訪問http和https,融合以上兩個圖形客戶端的功能,使得該圖形客戶端既能訪問443的https內容,也可以訪問非443埠(一般是80)的http內容。

/*
 * HTTPAllClientFX.java
 * Copyright (c) 2020-12-21
 * author : Charzous
 * All right reserved.
 */

package chapter08;

import javafx.application.Application;
import javafx.application.Platform;
import javafx.geometry.Insets;
import javafx.geometry.Pos;
import javafx.scene.Scene;
import javafx.scene.control.Button;
import javafx.scene.control.Label;
import javafx.scene.control.TextArea;
import javafx.scene.control.TextField;
import javafx.scene.layout.BorderPane;
import javafx.scene.layout.HBox;
import javafx.scene.layout.Priority;
import javafx.scene.layout.VBox;
import javafx.stage.Stage;


public class HTTPAllClientFX extends Application {

    private Button btnExit=new Button("退出");
    private Button btnSend = new Button("網頁請求");

//    private TextField tfSend=new TextField();//輸入資訊區域

    private TextArea taDisplay=new TextArea();//顯示區域
    private TextField ipAddress=new TextField();//填寫ip地址
    private TextField tfport=new TextField();//填寫埠
    private Button btConn=new Button("連線");
    private HTTPSClient httpsClient;
    private HTTPClient httpClient;
    private Thread readThread;

    public static void main(String[] args) {
        launch(args);
    }

    @Override
    public void start(Stage primaryStage) {
        BorderPane mainPane=new BorderPane();

        //連線伺服器區域
        HBox hBox1=new HBox();
        hBox1.setSpacing(10);
        hBox1.setPadding(new Insets(10,20,10,20));
        hBox1.setAlignment(Pos.CENTER);
        hBox1.getChildren().addAll(new Label("網頁地址:"),ipAddress,new Label("埠:"),tfport,btConn);
        mainPane.setTop(hBox1);

        VBox vBox=new VBox();
        vBox.setSpacing(10);

        vBox.setPadding(new Insets(10,20,10,20));
        vBox.getChildren().addAll(new Label("網頁資訊顯示區"),taDisplay);

        VBox.setVgrow(taDisplay, Priority.ALWAYS);
        mainPane.setCenter(vBox);


        HBox hBox=new HBox();
        hBox.setSpacing(10);
        hBox.setPadding(new Insets(10,20,10,20));
        hBox.setAlignment(Pos.CENTER_RIGHT);
        hBox.getChildren().addAll(btnSend,btnExit);
        mainPane.setBottom(hBox);

        Scene scene =new Scene(mainPane,700,500);
        primaryStage.setScene(scene);
        primaryStage.show();



        //連線按鈕
        btConn.setOnAction(event -> {
            String ip=ipAddress.getText().trim();
            String port=tfport.getText().trim();
            taDisplay.clear();

            try {
                if (port.equals("443")){
                    httpsClient = new HTTPSClient(ip, port);
                    //成功連線伺服器,接受伺服器發來的第一條歡迎資訊
                    taDisplay.appendText("伺服器連線成功。\n");

                    readThread = new Thread(()->{
                        String receiveMsg=null;//從伺服器接收一串字元
                        if (port.equals("443")){
                            while ((receiveMsg=httpsClient.receive())!=null){
                                //lambda表示式不能直接訪問外部非final型別區域性變數,需要定義一個臨時變數
                                //若將receiveMsg定義為類成員變數,則無需臨時變數
                                String msgTemp = receiveMsg;
                                Platform.runLater(()->{
                                    taDisplay.appendText(msgTemp+"\n");
                                });
                            }
                        }
                    });
                    readThread.start();
                }

                else if (port.equals("80")){
                    httpClient = new HTTPClient(ip, port);
                    taDisplay.appendText("伺服器連線成功。\n");
                    readThread = new Thread(()-> {
                        String receiveMsg = null;
                        while ((receiveMsg = httpClient.receive()) != null) {
                            String msgTemp = receiveMsg;
                            Platform.runLater(() -> {
                                taDisplay.appendText(msgTemp + "\n");
                            });
                        }
                    });
                    readThread.start();
                }


            }catch (Exception e){
                taDisplay.appendText("伺服器連線失敗!"+e.getMessage()+"\n");
            }
        });

        //網頁請求按鈕事件
        btnSend.setOnAction(event -> {
            String ip=ipAddress.getText().trim();
            String port=tfport.getText().trim();
            String domainName=ipAddress.getText().trim();
            try {
                StringBuffer msg = new StringBuffer();
                msg.append("GET / HTTP/1.1\r\n"+
                                "HOST: "+domainName+"\r\n"+
                                "Accept: */*\r\n"+
                                "Accept-Language: zh-CN\r\n"+
                                "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)\r\n"+
                                "Connection: Keep-Alive\r\n"
                        );
                if (port.equals("443"))
                    httpsClient.send(msg.toString());
                else if (port.equals("80"))
                    httpClient.send(msg.toString());

            } catch (InterruptedException e) {
                e.printStackTrace();
            }


        });


        btnExit.setOnAction(event -> {
            try {
                exit();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        });
        //窗體關閉響應的事件,點選右上角的×關閉,客戶端也關閉
        primaryStage.setOnCloseRequest(event -> {
            try {
                exit();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        });
    }

    private void exit() throws InterruptedException {
        if (httpsClient!=null||httpClient!=null){
            readThread.sleep(1000);//多執行緒等待,關閉視窗時還有執行緒等待IO,設定1s間隔保證所有執行緒已關閉
            httpsClient.close();
            httpClient.close();
        }
        System.exit(0);
    }

}
View Code

六、最後+演示

HTTP連線www.baidu.com,成功

HTTP連線www.sina.com.cn,失敗

HTTPS連線www.sina.com.cn,成功

期末複習,順便寫部落格記錄下來,這篇為上篇,介紹HTTP網頁請求下載,主要是HTTP(s)協議的網路程式設計,包括使用TCP Socket進行三次握手的HTTP網頁下載,和使用SSL Socket的安全傳輸的HTTPs網頁下載,通過案例實踐自行完成程式設計,認識http(s)的實際工作機制!

期待:Java之HTTP網路程式設計(下篇:網頁瀏覽器程式設計),將看到網頁的HTML原始碼,以及經過瀏覽器功能渲染之後的網頁!

 

如果覺得不錯歡迎“一鍵三連”哦,點贊收藏關注,有問題直接評論,交流學習!


我的部落格園:https://www.cnblogs.com/chenzhenhong/p/14435762.html

我的CSDN部落格:https://blog.csdn.net/Charzous/article/details/111470556


 

版權宣告:本文為博主原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處連結和本宣告。

 

本文連結:https://blog.csdn.net/Charzous/article/details/111470556