socket之黏包

阿新 • • 發佈：2018-12-09

true 本機 lis 字符串 void 第一個 while 傳輸直接

一、黏包成因
1、tcp協議的拆包機制
當發送端緩沖區的長度大於網卡的MTU時，tcp會將這次發送的數據拆成幾個數據包發送出去。 
MTU是Maximum Transmission Unit的縮寫。意思是網絡上傳送的最大數據包。MTU的單位是字節。 
大部分網絡設備的MTU都是1500。如果本機的MTU比網關的MTU大，大的數據包就會被拆開來傳送，
這樣會產生很多數據包碎片，增加丟包率，降低網絡速度。


2、tcp的合包機制
TCP（transport control protocol，傳輸控制協議）是面向連接的，面向流的，提供高可靠性服務。
收發兩端（客戶端和服務器端）都要有一一成對的socket，因此，發送端為了將多個發往接收端的包，更有效的發到對方，
使用了優化方法（Nagle算法），將多次間隔較小且數據量小的數據，合並成一個大的數據塊，然後進行封包。
但是這樣，接收端，就難於分辨出來了，必須提供科學的拆包機制。 即面向流的通信是無消息保護邊界的。 
對於空消息：tcp是基於數據流的，於是收發的消息不能為空，這就需要在客戶端和服務端都添加空消息的處理機制，防止程序卡住，
而udp是基於數據報的，即便是你輸入的是空內容（直接回車），也可以被發送，udp協議會幫你封裝上消息頭發送過去。 
可靠黏包的tcp協議：tcp的協議數據不會丟，沒有收完包，下次接收，會繼續上次繼續接收，己端總是在收到ack時才會清除緩沖區內容。數據是可靠的，但是會粘包。


 
3、說明
發送端可以是一K一K地發送數據，而接收端的應用程序可以兩K兩K地提走數據，當然也有可能一次提走3K或6K數據，或者一次只提走幾個字節的數據。
也就是說，應用程序所看到的數據是一個整體，或說是一個流（stream），一條消息有多少字節對應用程序是不可見的，因此TCP協議是面向流的協議，這也是容易出現粘包問題的原因。
而UDP是面向消息的協議，每個UDP段都是一條消息，應用程序必須以消息為單位提取數據，不能一次提取任意字節的數據，這一點和TCP是很不同的。
怎樣定義消息呢？可以認為對方一次性write/send的數據為一個消息，需要明白的是當對方send一條信息的時候，無論底層怎樣分段分片，TCP協議層會把構成整條消息的數據段排序完成後才呈現在內核緩沖區。


也就是：
用UDP協議發送時，用sendto函數最大能發送數據的長度為： 
65535- IP頭(20) – UDP頭(8)＝65507字節。用sendto函數發送數據時，如果發送數據長度大於該值，
則函數會返回錯誤。（丟棄這個包，不進行發送） 

用TCP協議發送時，由於TCP是數據流協議，因此不存在包大小的限制（暫不考慮緩沖區的大小），這是指在用send函數時，數據長度參數不受限制。
而實際上，所指定的這段數據並不一定會一次性發送出去，如果這段數據比較長，會被分段發送，如果比較短，可能會等待和下一次數據一起發送。




例如：
基於tcp的套接字客戶端往服務端上傳文件，發送時文件內容是按照一段一段的字節流發送的，在接收方看了，根本不知道該文件的字節流從何處開始，在何處結束
此外，發送方引起的粘包是由TCP協議本身造成的，TCP為提高傳輸效率，發送方往往要收集到足夠多的數據後才發送一個TCP段。若連續幾次需要send的數據都很少，
通常TCP會根據優化算法把這些數據合成一個TCP段後一次發送出去，這樣接收方就收到了粘包數據。



上代碼：
服務端：
 
import socket
sk = socket.socket()
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
sk.bind((‘127.0.0.1‘,8000))
sk.listen()

conn,addr = sk.accept()
ret = conn.recv(1024)
print(ret.decode(‘utf-8‘))
conn.close()
sk.close()


客戶端：
import socket
sk = socket.socket()
sk.connect((‘127.0.0.1‘,8000))
sk.send(b‘hello,‘)
sk.send(b‘world,‘)
sk.send(b‘hi‘)
sk.close()


結果：
hello,world,hi

解釋：
正常來說，一個send必須對應一個recv，
但是我們都知道python程序是由上至下執行的，那麽：
sk.send(b‘hello,‘)
sk.send(b‘world,‘)
sk.send(b‘hi‘)
上面這三句代碼幾乎在一瞬間就執行了，而由於要發送的數據很小，而且是時間間隔很短，
發送方就會把這幾條數據合成一條數據，再發送過去，在接收端其實收到的就是一次傳來的數據，
所以這個時候三次send，對應一次recv，這就是黏包。


4、總結
黏包現象只發生在tcp協議中：
1.從表面上看，黏包問題主要是因為發送方和接收方的緩存機制、tcp協議面向流通信的特點。
2.實際上，主要還是因為接收方不知道消息之間的界限，不知道一次性提取多少字節的數據所造成的


合包現象
    數據很短
    時間間隔短
拆包現象
    大數據會發生拆分
    不會一次性的全部發送到對方
    對方在接受的時候很可能沒有辦法一次性接收到所有的信息
    那麽沒有接受完的信息很可能和後面的信息黏在一起
粘包現象只發生在tcp協議
    tcp協議的傳輸 是 流式傳輸
    每一條信息與信息之間是沒有邊界的

udp協議中是不會發生粘包現象的
    適合短數據的發送
    不建議你發送過長的數據
    數據過長會增大你數據丟失的幾率

在程序中會出現粘包：收發數據的邊界不清晰
接收數據這一端不知道要接收數據的長度到底是多少





二、黏包解決方案
1、解決方案一
問題的根源在於，接收端不知道發送端將要傳送的字節流的長度，所以解決粘包的方法就是圍繞，如何讓發送端在發送數據前，
把自己將要發送的字節流總大小讓接收端知曉，然後接收端來一個死循環接收完所有數據。

就是說：
如果你要發送一個數據----hello，它是5個字節的，
你在接收端設置了只接收5個字節，那麽就算發生黏包也沒關系，
因為你只接收了5個字節，黏在一起的剩下的數據也就沒有讀取到了。
send(b‘hello‘)   ----->   recv(5)

那麽我們就有了一個思路，就是在發送消息的時候，我們主動告訴接收端我們要發送的數據的長度，
接收端按照接收的長度來接收數據。例如：
發送端：
send(b‘5hello‘)  


接收端：
num = recv(1)  # 代表接收第一個字節，也就是只把長度5接收了
num_len = int(num.decode(‘utf-8‘))  # 把長度的類型轉成整型
msg = recv(num_len)  # 按照長度接收數據


代碼：
服務端：
import socket
sk = socket.socket()
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
sk.bind((‘127.0.0.1‘,8001))
sk.listen()

conn,addr = sk.accept()
conn.send(b‘5hello‘)
conn.send(b‘2hi‘)

conn.close()
sk.close()


客戶端：
import socket
sk = socket.socket()
sk.connect((‘127.0.0.1‘,8001))

num = sk.recv(1)
num_len = int(num.decode(‘utf-8‘))
msg1 = sk.recv(num_len)
print(msg1)

num2 = sk.recv(1)
num2_len = int(num2.decode(‘utf-8‘))
msg2 = sk.recv(num2_len)
print(msg2)

sk.close()

結果：
hello
hi

但是這樣寫每次只能接收個位數的數據，我們可以把長度設置成4個長度，即0000-9999
發送端：
send(b‘0005hello‘)  


接收端：
num = recv(4)  # 代表接收前四個字節，也就是只把長度0005接收了
num_len = int(num.decode(‘utf-8‘))  # 把長度的類型轉成整型
msg = recv(num_len)  # 按照長度接收數據


但實際中，我們要傳的數據往往很大的而這種方式雖然能解決一些問題，但是這樣寫一次也最多發送9999個字節(大概9.7KB)，
那麽如果2G的東西就要發送大概21萬次循環才能發送完。


補充一個字符串的方法zfill：在左邊給字符補0
print(‘1‘.zfill(4))   # 0001



2、解決方案2
首先介紹一個模塊struct：該模塊可以把一個類型，如數字，轉成固定長度(4)的bytes
import struct
ret1 = struct.pack(‘i‘,10238976)    # i代表把整型的數據轉換成bytes類型的數據
ret2 = struct.pack(‘i‘,1)

print(ret1,len(ret1))  # b‘\x00<\x9c\x00‘  4
print(ret2,len(ret2))  # b‘\x01\x00\x00\x00‘ 4
可以看到：數字10238976轉成bytes後，長度為4，數字1轉成bytes後，長度也是為4。

num1 = struct.unpack(‘i‘,ret1)   # unpack把bytes類型轉成第一個參數代表的類型(這裏是i，也就是int 整型，但返回的是一個元組)
print(num1)  # (10238976,)  元組
print(num1[0])  # 10238976 取元組的第一個值即可

註意:‘i‘ 所能轉換的數字範圍是 -2147483648 <= number <= 2147483647 
超出這個範圍就會報錯，就是不能這樣寫  struct.pack(‘i‘,2147483648)



代碼：
服務端：
import socket
import struct
sk = socket.socket()
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
sk.bind((‘127.0.0.1‘,8002))
sk.listen()

conn,addr = sk.accept()
while True:
    msg = input(‘>>>:‘).encode(‘utf-8‘)  # 要發送的內容
    pack_num = struct.pack(‘i‘,len(msg))  # 計算內容的長度
    conn.send(pack_num)  
    conn.send(msg)
conn.close()
sk.close()




客戶端：
import socket
import struct

sk = socket.socket()
sk.connect((‘127.0.0.1‘,8002))

while True:
    pack_num = sk.recv(4)
    num = struct.unpack(‘i‘,pack_num)[0]
    ret = sk.recv(num)
    print(ret.decode(‘utf-8‘))
sk.close()

socket之黏包

true 本機 lis 字符串 void 第一個 while 傳輸直接一、黏包成因 1、tcp協議的拆包機制當發送端緩沖區的長度大於網卡的MTU時，tcp會將這次發送的數據拆成幾個數據包發送出去。 MTU是Maximum Transmission

Socket之心跳包實現思路

har date 超過 off comm padding int msg tar 由於最近要做一個客戶端，但是要求有一個掉線檢測的功能，下面讓我們看看使用自定義的HeartBeat方式來檢測客戶端的連接情況。心跳包的實現思路：客戶端連接上服務端後，在服務端會維護一個在

網絡編程之黏包

默認 author blog info bsp strip 結構 .html 時間間隔當我們同時執行多條命令之後，得到的結果很可能只有一部分，在執行其他命令的時候又接收到之前執行的另外一部分結果，這種現象就是黏包。黏包成因 TCP協議中的數據傳遞： tcp協議的拆包機制

《Python》網絡編程之黏包

con 傳輸技術分享一段程序 mage 方法網絡延遲永遠黏包一、黏包現象　　同時執行多條命令之後，得到的結果很可能只有一部分，在執行其他命令的時候又接收到之前執行的另外一部分結果，這種顯現就是黏包。　　server端 import socket sk

Python Socket通訊黏包問題分析及解決方法

參考：http://www.cnblogs.com/Eva-J/articles/8244551.html#_label5 1.黏包的表現(以客戶端遠端操作服務端命令為例) 注：只有以TCP協議通訊的情況下，才會產生黏包問題基於TCP協議實現的黏包 #!/usr/bin/env

python之黏包和黏包解決方案

黏包現象主要發生在TCP連線, 基於TCP的套接字客戶端往服務端上傳檔案，傳送時檔案內容是按照一段一段的位元組流傳送的，在接收方看來，根本不知道該檔案的位元組流從何處開始，在何處結束. 兩種黏包現象: 1 連續的小包可能會被優化演算法給組合到一起進行傳送 2 第一次如果

Python網絡編程之黏包問題

add read proc import accept inpu sub serve 編程二、解決黏包問題 2.1 解決黏包方法1 計算消息實體的大小服務端接受兩次，一次時消息大小，二次是消息實體，解決消息實體黏包客戶端發送兩次，一次是消息大小，一次是消息實體

python/socket編程之粘包

處理機制滿了 bytes true src exceptio 協議粘包問題時間間隔 python/socket編程之粘包粘包：只有TCP有尿包現象，UDP永遠不會粘包。首先需要掌握一個socket收發消息的原理發送端可以是1k，1k的發送數據而接受端的應用程

socket 黏包現象

utf href true 等待源地址緩存機制 .com 文件優化算法什麽是黏包: 　　同事執行多條命令之後,得到的結果很可能只有一部分,在執行其他命令的時候又接收到之前執行的另外一部分結果,這種顯現就是黏包　　註意：只有TCP有粘包現象，UDP永遠不會粘包

網路程式設計基礎【day09】：socket解決粘包問題之MD5（八）

本節內容 1、概述 2、程式碼實現一、概述　　上一篇部落格講到的用MD5來校驗還是用的之前解決粘包的方法，就是客戶端傳送一個請求，等待服務端的確認的這樣的一個笨方法。下面我們用另外一種方法：就是客戶端已經知道可接收多少資料了，既然客戶端已經知道接收多少資料了，那麼客戶端在接收資料的時候，正好接收已

網路知識,socket,黏包的解決方式

一.為什麼要學習socket? 你自己現在完全可以寫一些小程式了，但是前面的學習和練習，我們寫的程式碼都是在自己的電腦上執行的，雖然我們學過了模組引入，檔案引入import等等，我可以在程式中獲取到另一個檔案的內容，對吧，但是那麼突然有一天，你的朋友和你說："把你電腦上的一個檔案通過你自己寫的程

python摸爬滾打之day28----黏包處理

1、緩衝區和subprocess模組　　1.1 緩衝區　　　　　　每個 socket 被建立後，都會分配兩個緩衝區，輸入緩衝區和輸出緩衝區。

Java網路程式設計之Netty拆包和黏包-yellowcong

Netty中，解決拆包和黏包中，解決方式有三種 1、在每個包尾部，定義分隔符，通過回車符號，或者其他符號來解決 2、通過定義每個包的大小，如果包不夠就空格填充 3、自定義協議的方式，將訊息分為訊息頭和訊息體，在訊息頭中表示出訊息的總長度，

網絡編程- 解決黏包現象方案二之struct模塊（七）

ads size input load close pen socket server dump server端 import jsonimport structimport socketsk = socket.socket()sk.bind((‘127.0.0.1‘,8

socket tcp 粘包解決

connect line 應該字節 unpack otto stdout except soc 何為粘包：先看代碼 session=socket.socket(socket.AF_INET,socket.SOCK_STREAM) 在定義socket對象的時候有兩個參數

http和socket之長連接和短連接區別

系統 targe 多個參數到來備註結構 span tin 設計 TCP/IP TCP/IP是個協議組，可分為三個層次：網絡層、傳輸層和應用層。在網絡層有IP協議、ICMP協議、ARP協議、RARP協議和BOOTP協議。在傳輸層中有TCP協議與UDP協議。在應用層

JavaScript之閉包（重新認識）

log 變量 for 局部變量 ava logs 所在數組函數使用最近又重新學習了閉包，發現之前沒有深刻理解作用域鏈，學習作用域鏈後對閉包才可以做到真正的理解。閉包是指有權另一個函數作用域中變量的函數。要理解閉包首先理解作用域鏈。

python之閉包函數裝飾器作業

word bold 多個格式 color ebe 優先時間函數返回一：編寫函數，（函數執行的時間是隨機的） import randomdef t(): time.sleep(random.randrange(1,3)) print(‘hello‘)二：編

Day 19 函數之閉包、裝飾器

false print glob src true success 返回值 count please 一、什麽是裝飾器器即函數裝飾即修飾，意指為其他函數添加新功能裝飾器定義：本質就是函數，功能是為其他函數添加新功能二、裝飾器遵循的原則 1.不修改被裝飾函數

CentOS7安裝MySQL的方法之RPM包方式

centos7 mysql原帖地址： http://hostmaoo.com/frontend/help/help_details/id/35不是轉載，主機貓就是我的網站。其實是想看看推廣效果。嘿嘿。本文出自 “將所學所想記錄下來” 博客，請務必保留此出處http://351660060.blog.51ct

socket之黏包

相關推薦