【轉】一文了解Socket
原文連結:https://segmentfault.com/a/1190000013712747
什麼是Socket?
Socket的中文翻譯過來就是“套接字”。套接字是什麼,我們先來看看它的英文含義:插座。
Socket就像一個電話插座,負責連通兩端的電話,進行點對點通訊,讓電話可以進行通訊,埠就像插座上的孔,埠不能同時被其他程序佔用。而我們建立連線就像把插頭插在這個插座上,建立一個Socket例項開始監聽後,這個電話插座就時刻監聽著訊息的傳入,誰撥通我這個“IP地址和埠”,我就接通誰。
實際上,Socket是在應用層和傳輸層之間的一個抽象層,它把TCP/IP層複雜的操作抽象為幾個簡單的介面,供應用層呼叫實現程序在網路中的通訊。Socket起源於UNIX,在Unix一切皆檔案的思想下,程序間通訊就被冠名為檔案描述符(file desciptor),Socket是一種“開啟—讀/寫—關閉”模式的實現,伺服器和客戶端各自維護一個“檔案”,在建立連線開啟後,可以向檔案寫入內容供對方讀取或者讀取對方內容,通訊結束時關閉檔案。
另外我們經常說到的Socket所在位置如下圖:
Socket通訊過程
Socket保證了不同計算機之間的通訊,也就是網路通訊。對於網站,通訊模型是伺服器與客戶端之間的通訊。兩端都建立了一個Socket物件,然後通過Socket物件對資料進行傳輸。通常伺服器處於一個無限迴圈,等待客戶端的連線。
一圖勝千言,下面是面向連線的TCP時序圖:
客戶端過程:
客戶端的過程比較簡單,建立Socket,連線伺服器,將Socket與遠端主機連線(注意:只有TCP才有“連線”的概念,一些Socket比如UDP、ICMP和ARP沒有“連線”的概念),傳送資料,讀取響應資料,直到資料交換完畢,關閉連線,結束TCP對話。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 建立Socket連線
sock.connect(('127.0.0.1', 8001)) # 連線伺服器
while True:
data = input('Please input data:')
if not data:
break
try:
sock.sendall(data)
except socket .error as e:
print('Send Failed...', e)
sys.exit(0)
print('Send Successfully')
res = sock.recv(4096) # 獲取伺服器返回的資料,還可以用recvfrom()、recv_into()等
print(res)
sock.close()
sock.sendall(data)
這裡也可用send()方法:不同在於sendall()在返回前會嘗試傳送所有資料,並且成功時返回None,而send()則返回傳送的位元組數量,失敗時都丟擲異常。
服務端過程:
咱再來聊聊服務端的過程,服務端先初始化Socket,建立流式套接字,與本機地址及埠進行繫結,然後通知TCP,準備好接收連線,呼叫accept()阻塞,等待來自客戶端的連線。如果這時客戶端與伺服器建立了連線,客戶端傳送資料請求,伺服器接收請求並處理請求,然後把響應資料傳送給客戶端,客戶端讀取資料,直到資料交換完畢。最後關閉連線,互動結束。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 建立Socket連線(TCP)
print('Socket Created')
try:
sock.bind(('127.0.0.1', 8001)) # 配置Socket,繫結IP地址和埠號
except socket.error as e:
print('Bind Failed...', e)
sys.exit(0)
sock.listen(5) # 設定最大允許連線數,各連線和Server的通訊遵循FIFO原則
while True: # 迴圈輪詢Socket狀態,等待訪問
conn, addr = sock.accept()
try:
conn.settimeout(10) # 獲得一個連線,然後開始迴圈處理這個連線傳送的資訊
# 如果要同時處理多個連線,則下面的語句塊應該用多執行緒來處理
while True:
data = conn.recv(1024)
print('Get value ' + data, end='\n\n')
if not data:
print('Exit Server', end='\n\n')
break
conn.sendall('OK') # 返回資料
except socket.timeout: # 建立連線後,該連線在設定的時間內沒有資料發來,就會引發超時
print('Time out')
conn.close() # 當一個連線監聽迴圈退出後,連線可以關掉
sock.close()
conn, addr = sock.accept()
呼叫accept()時,Socket會進入“waiting”狀態。客戶請求連線時,方法建立連線並返回伺服器。accept()返回一個含有兩個元素的元組(conn, addr)。第一個元素conn是新的Socket物件,伺服器必須通過它與客戶通訊;第二個元素addr是客戶的IP地址及埠。
data = conn.recv(1024)
接下來是處理階段,伺服器和客戶端通過send()和recv()通訊(傳輸資料)。
伺服器呼叫send(),並採用字串形式向客戶傳送資訊,send()返回已傳送的字元個數。
伺服器呼叫recv()從客戶接收資訊。呼叫recv()時,伺服器必須指定一個整數,它對應於可通過本次方法呼叫來接收的最大資料量。recv()在接收資料時會進入“blocked”狀態,最後返回一個字串,用它表示收到的資料。如果傳送的資料量超過了recv()所允許的,資料會被截短。多餘的資料將緩衝於接收端,以後呼叫recv()時,多餘的資料會從緩衝區刪除(以及自上次呼叫recv()以來,客戶可能傳送的其它任何資料)。傳輸結束,伺服器呼叫Socket的close()關閉連線。
TCP三次握手的Socket過程:
伺服器呼叫socket()、bind()、listen()完成初始化後,呼叫accept()阻塞等待;
客戶端Socket物件呼叫connect()向伺服器傳送了一個SYN並阻塞;
伺服器完成了第一次握手,即傳送SYN和ACK應答;
客戶端收到服務端傳送的應答之後,從connect()返回,再發送一個ACK給伺服器;
伺服器Socket物件接收客戶端第三次握手ACK確認,此時服務端從accept()返回,建立連線。
接下來就是兩個端的連線物件互相收發資料。
TCP四次揮手的Socket過程:
某個應用程序呼叫close()主動關閉,傳送一個FIN;
另一端接收到FIN後被動執行關閉,併發送ACK確認;
之後被動執行關閉的應用程序呼叫close()關閉Socket,並也傳送一個FIN;
接收到這個FIN的一端向另一端ACK確認。
上面的程式碼是簡單的演示Socket的基本函式使用,其實不管有多複雜的網路程式,這些基本函式都會用到。上面的服務端程式碼只有處理完一個客戶端請求才會去處理下一個客戶端的請求,這樣的伺服器處理能力很弱,而實際中伺服器都需要有併發處理能力,為了達到併發處理,伺服器就需要fork一個新的程序或者執行緒去處理請求。