Socket通訊原理.一文了解Socket
什麼是 Socket?
Socket 的中文翻譯過來就是“套接字”。套接字是什麼,我們先來看看它的英文含義:插座。
Socket 就像一個電話插座,負責連通兩端的電話,進行點對點通訊,讓電話可以進行通訊,埠就像插座上的孔,埠不能同時被其他程序佔用。而我們建立連線就像把插頭插在這個插座上,建立一個 Socket 例項開始監聽後,這個電話插座就時刻監聽著訊息的傳入,誰撥通我這個“IP 地址和埠”,我就接通誰。
實際上,Socket 是在應用層和傳輸層之間的一個抽象層,它把 TCP/IP 層複雜的操作抽象為幾個簡單的介面,供應用層呼叫實現程序在網路中的通訊。Socket 起源於 UNIX,在 UNIX 一切皆檔案的思想下,程序間通訊就被冠名為檔案描述符(file descriptor),Socket 是一種“開啟—讀/寫—關閉”模式的實現,伺服器和客戶端各自維護一個“檔案”,在建立連線開啟後,可以向檔案寫入內容供對方讀取或者讀取對方內容,通訊結束時關閉檔案。
另外我們經常說到的Socket 所在位置如下圖:
Socket 通訊過程
Socket 保證了不同計算機之間的通訊,也就是網路通訊。對於網站,通訊模型是伺服器與客戶端之間的通訊。兩端都建立了一個 Socket 物件,然後通過 Socket 物件對資料進行傳輸。通常伺服器處於一個無限迴圈,等待客戶端的連線。
一圖勝千言,下面是面向連線的 TCP 時序圖:
客戶端過程:
客戶端的過程比較簡單,建立 Socket,連線伺服器,將 Socket 與遠端主機連線(注意:只有 TCP 才有“連線”的概念,一些 Socket 比如 UDP、ICMP 和 ARP 沒有“連線”的概念),傳送資料,讀取響應資料,直到資料交換完畢,關閉連線,結束 TCP 對話。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 建立 Socket 連線
sock.connect(('127.0.0.1', 8001)) # 連線伺服器
while True:
data = input('Please input data:')
if not data:
break
try:
sock.sendall(data)
except socket.error as e:
print('Send Failed...', e)
sys.exit(0)
print('Send Successfully')
res = sock.recv(4096) # 獲取伺服器返回的資料,還可以用 recvfrom()、recv_into() 等
print(res)
sock.close()
sock.sendall(data):這裡也可用send()方法:不同在於sendall()在返回前會嘗試傳送所有資料,並且成功時返回 None,而send()則返回傳送的位元組數量,失敗時都丟擲異常。
服務端過程:
咱再來聊聊服務端的過程,服務端先初始化 Socket,建立流式套接字,與本機地址及埠進行繫結,然後通知 TCP,準備好接收連線,呼叫accept()阻塞,等待來自客戶端的連線。如果這時客戶端與伺服器建立了連線,客戶端傳送資料請求,伺服器接收請求並處理請求,然後把響應資料傳送給客戶端,客戶端讀取資料,直到資料交換完畢。最後關閉連線,互動結束。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 建立 Socket 連線(TCP)
print('Socket Created')
try:
sock.bind(('127.0.0.1', 8001)) # 配置 Socket,繫結 IP 地址和埠號
except socket.error as e:
print('Bind Failed...', e)
sys.exit(0)
sock.listen(5) # 設定最大允許連線數,各連線和 Server 的通訊遵循 FIFO 原則
while True: # 迴圈輪詢 Socket 狀態,等待訪問
conn, addr = sock.accept()
try:
conn.settimeout(10) # 如果請求超過 10 秒沒有完成,就終止操作
# 如果要同時處理多個連線,則下面的語句塊應該用多執行緒來處理
while True: # 獲得一個連線,然後開始迴圈處理這個連線傳送的資訊
data = conn.recv(1024)
print('Get value ' + data, end='\n\n')
if not data:
print('Exit Server', end='\n\n')
break
conn.sendall('OK') # 返回資料
except socket.timeout: # 建立連線後,該連線在設定的時間內沒有資料發來,就會引發超時
print('Time out')
conn.close() # 當一個連線監聽迴圈退出後,連線可以關掉
sock.close()
conn, addr = sock.accept()
呼叫accept()時,Socket 會進入waiting狀態。客戶端請求連線時,方法建立連線並返回伺服器。accept()返回一個含有兩個元素的元組 (conn, addr)。第一個元素 conn 是新的 Socket 物件,伺服器必須通過它與客戶端通訊;第二個元素 addr 是客戶端的 IP 地址及埠。
data = conn.recv(1024)
接下來是處理階段,伺服器和客戶端通過send()和recv()通訊(傳輸資料)。
伺服器呼叫send(),並採用字串形式向客戶端傳送資訊,send()返回已傳送的字元個數。
伺服器呼叫recv()從客戶端接收資訊。呼叫recv()時,伺服器必須指定一個整數,它對應於可通過本次方法呼叫來接收的最大資料量。recv()在接收資料時會進入blocked狀態,最後返回一個字串,用它表示收到的資料。如果傳送的資料量超過了recv()所允許的,資料會被截短。多餘的資料將緩衝於接收端,以後呼叫recv()時,會繼續讀剩餘的位元組,如果有多餘的資料會從緩衝區刪除(以及自上次呼叫recv()以來,客戶端可能傳送的其它任何資料)。傳輸結束,伺服器呼叫 Socket 的close()關閉連線。
PPT模板下載大全https://www.wode007.com
從 TCP 連線的視角看 Socket 過程:
TCP 三次握手的 Socket 過程:
- 伺服器呼叫socket()、bind()、listen()完成初始化後,呼叫accept()阻塞等待;
- 客戶端 Socket 物件呼叫connect()向伺服器傳送了一個 SYN 並阻塞;
- 伺服器完成了第一次握手,即傳送 SYN 和 ACK 應答;
- 客戶端收到服務端傳送的應答之後,從connect()返回,再發送一個 ACK 給伺服器;
- 伺服器 Socket 物件接收客戶端第三次握手 ACK 確認,此時服務端從accept()返回,建立連線。
接下來就是兩個端的連線物件互相收發資料。
TCP 四次揮手的 Socket 過程:
- 某個應用程序呼叫close()主動關閉,傳送一個 FIN;
- 另一端接收到 FIN 後被動執行關閉,併發送 ACK 確認;
- 之後被動執行關閉的應用程序呼叫close()關閉 Socket,並也傳送一個 FIN;
- 接收到這個 FIN 的一端向另一端 ACK 確認。
總結:
上面的程式碼簡單地演示了 Socket 的基本函式使用,其實不管有多複雜的網路程式,這些基本函式都會用到。上面的服務端程式碼只有處理完一個客戶端請求才會去處理下一個客戶端的請求,這樣的伺服器處理能力很弱,而實際中伺服器都需要有併發處理能力,為了達到併發處理,伺服器就需要 fork 一個新的程序或者執行緒去處理請求。