linux一切皆檔案之tcp socket描述符(三)
一、知識準備
1、在linux中,一切皆為檔案,所有不同種類的型別都被抽象成檔案(比如:塊裝置,socket套接字,pipe佇列)
2、操作這些不同的型別就像操作檔案一樣,比如增刪改查等
二、環境準備
元件 | 版本 |
---|---|
OS | CentOS Linux release 7.5.1804 |
三、tcp socket 檔案描述符
● 當我們建立一條TCP連線時,在linux作業系統中會建立一個socket檔案描述符
● 通過檔案描述符就能找到socket的幾本資訊,比如TCP四元組(client-ip:client-port --> server-ip:server-port
先準備2個指令碼:
server.py主要用於建立客戶端的連線請求,並且接收客戶端傳來的資料,然後將收到的資料回傳給客戶端
client.py每隔1秒向服務端傳送一次'hello world'
server.py
import socket server_addr = ('127.0.0.1' , 22222) sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.bind(server_addr) sock.listen(5) while True: conn, clientAddr = sock.accept() while True: data = conn.recv(100) conn.sendall(data) sock.close()
client.py
import socket
import time
server_addr = ('127.0.0.1' , 22222)
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(server_addr)
while True:
message = 'hello world!'
sock.send(message)
sock.recv(100)
time.sleep(1)
sock.close()
分別啟動server.py與client.py
[root [email protected] ~]# python /tmp/server.py &
[1] 14199
[[email protected] ~]# python /tmp/client.py &
[2] 14202
檢視server.py開啟的檔案描述符
[[email protected] ~]# ls -l /proc/14199/fd
total 0
lrwx------ 1 root root 64 Nov 7 07:42 0 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 7 07:42 1 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 7 07:42 2 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 7 07:42 3 -> socket:[99154]
lrwx------ 1 root root 64 Nov 7 07:42 4 -> socket:[99155]
[[email protected] ~]# lsof -n | grep -E '99154|99155'
python 14199 root 3u IPv4 99154 0t0 TCP 127.0.0.1:22222 (LISTEN)
python 14199 root 4u IPv4 99155 0t0 TCP 127.0.0.1:22222->127.0.0.1:56946 (ESTABLISHED)
我們主要關注ESTABLISHED
狀態的socket描述符,也就是4 -> socket:[99155]
[[email protected] fd]# more /proc/net/tcp
sl local_address rem_address st tx_queue rx_queue tr tm->when retrnsmt uid timeout inode
...
4: 0100007F:56CE 0100007F:DE72 01 00000000:00000000 00:00000000 00000000 0 0 99155 1 ffff90d8bb0145c0 20 4 31 10 -1
程序打開了tcp socket 描述符4 -> socket:[99155]
,socket描述符指向記憶體中的socket結構體,該結構體詳細描述了這個socket的詳細資訊
最重要的是TCP四元組(local_ip:local_port --> remote_ip:remote_port
),拆分轉換成10進位制
0100007F:56CE
[[email protected] ~]# ((d=0x01))
[[email protected] ~]# ((c=0x00))
[[email protected] ~]# ((b=0x00))
[[email protected] ~]# ((a=0x7F))
[[email protected] ~]# ((e=0x56CE))
[[email protected] ~]# echo "$a.$b.$c.$d:$e"
127.0.0.1:22222
0100007F:DE72
[[email protected] ~]# ((d=0x01))
[[email protected] ~]# ((c=0x00))
[[email protected] ~]# ((b=0x00))
[[email protected] ~]# ((a=0x7F))
[[email protected] ~]# ((e=0xDE72))
[[email protected] ~]# echo "$a.$b.$c.$d:$e"
127.0.0.1:56946
在/proc/net/tcp包含了tcp連線的重要狀態資訊:
00000000:00000000 : 傳送佇列與接收佇列 (正數第四個欄位)
-1 : 慢啟動門限 (倒數第一個欄位)
10 : 擁塞視窗 (倒數第二個欄位)
這裡面還有很多描述:比如慢啟動門限、傳輸佇列以及接收佇列、視窗探查等TCP相關的重要引數都可以查詢到,具體的大家可以去看下《TCP/IP詳解卷》
client.py也存在同樣的行為:
[[email protected] ~]# ls -l /proc/14202/fd
total 0
lrwx------ 1 root root 64 Nov 19 04:43 0 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 19 04:43 1 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 19 04:43 2 -> /dev/pts/0
lrwx------ 1 root root 64 Nov 19 04:43 3 -> socket:[28728]
[[email protected] ~]# lsof -n | grep 28728
python 14202 root 3u IPv4 28728 0t0 TCP 127.0.0.1:56946->127.0.0.1:22222 (ESTABLISHED)
[[email protected] fd]# more /proc/net/tcp
sl local_address rem_address st tx_queue rx_queue tr tm->when retrnsmt uid timeout inode
...
3: 0100007F:C31A 0100007F:DE72 01 00000000:00000000 00:00000000 00000000 0 0 28728 3 ffff8a74ba1a0f80 20 4 30 10 -1
0100007F:56CE
[[email protected] ~]# ((d=0x01))
[[email protected] ~]# ((c=0x00))
[[email protected] ~]# ((b=0x00))
[[email protected] ~]# ((a=0x7F))
[[email protected] ~]# ((e=0x56CE))
[[email protected] ~]# echo "$a.$b.$c.$d:$e"
127.0.0.1:22222
0100007F:DE72
[[email protected] ~]# ((d=0x01))
[[email protected] ~]# ((c=0x00))
[[email protected] ~]# ((b=0x00))
[[email protected] ~]# ((a=0x7F))
[[email protected] ~]# ((e=0xDE72))
[[email protected] ~]# echo "$a.$b.$c.$d:$e"
127.0.0.1:56946
總結一下:
● server.py與client.py各自開啟tcp socket 描述符,該描述符指向記憶體中的socket結構體
● socket結構體描述了關於TCP的所有資訊,其中通過TCP 4元組找到對端的通訊節點
● socket將使用者資料以及自身結構資料封裝完成之後會交給底層的TCP協議,然後是IP協議、鏈路層資訊,最後通過物理鏈路到達對端
● 對端也會依次解包,直至將傳送端資料寫入到指定的記憶體當中,最終由應用程式讀取(本文中的server.py或client.py)
client.py server.py
+---------------+ +---------------+
|pid:14202 | |pid:14199 |
| +-----+ | | +-----+ |
| |fd:3 | | | |fd:4 | |
| +-----+ | | +-----+ |
+---------------+ +---------------+
| |
user space | |
+---------------------------------------------------------------------+
kernel space | |
| |
v v
+------+-------+ +------+-------+
|socket:[28728]| |socket:[99155]|
+------+-------+ +------+-------+
| |
| |
v v
+----+----+ +----+----+
| socket | | socket |
+----+----+ +----+----+
| |
| |
v v
++---------------------------------+-
| tcp |
+------------------------------------
四、小結
● TCP連線中最重要的是TCP四元組,而程序開啟TCP socket描述符可以找到四元組資訊,從而確定雙方的IP和port
● 通過socket檔案描述符可以找到記憶體中的socket結構體,獲取到TCP連線的詳細資訊,包括必備四元組、檔案的inode、時間、出隊入隊狀態等等
● 1個程序可以建立多個TCP連線,也就是建立多個socket檔案描述符,這由該程序能夠開啟的檔案數量限制(ulimit -n
)
五、參考資料
http://www.cs.colostate.edu/~gersch/cs457/CS457_tutorial2.pdf
https://gist.github.com/jkstill/5095725
至此,本文結束
在下才疏學淺,有撒湯漏水的,請各位不吝賜教...