TCP連線關閉狀態轉換圖
主要部分,四次握手:
斷開連線其實從我的角度看不區分客戶端和伺服器端,任何一方都可以呼叫close(or closesocket)之類
當被動關閉的一方收到FIN報文時,它會發送ACK確認報文(對於ACK這個東西你應該很熟悉了)。這裡有個
我可以告訴你,一旦當你呼叫close(or closesocket),這一端就會發送FIN報文。也就是說,現在被動 |
關於以上的四次握手,我補充下細節:
1. 預設情況下(不改變socket選項),當你呼叫close( or closesocket,以下說close不再重複)時,如果
傳送緩衝中還有資料,TCP會繼續把資料傳送完。
2. 傳送了FIN只是表示這端不能繼續傳送資料(應用層不能再呼叫send傳送),但是還可以接收資料。
3. 應用層如何知道對端關閉?通常,在最簡單的阻塞模型中,當你呼叫recv時,如果返回0,則表示對端
關閉。在這個時候通常的做法就是也呼叫close,那麼TCP層就傳送FIN,繼續完成四次握手。如果你不呼叫
close,那麼對端就會處於FIN_WAIT_2狀態,而本端則會處於CLOSE_WAIT狀態。這個可以寫程式碼試試。
4. 在很多時候,TCP連線的斷開都會由TCP層自動進行,例如你CTRL+C終止你的程式,TCP連線依然會正常關
閉,你可以寫程式碼試試。
特別的TIME_WAIT狀態:
從以上TCP連線關閉的狀態轉換圖可以看出,主動關閉的一方在傳送完對對方FIN報文的確認(ACK)報文後,
會進入TIME_WAIT狀態。TIME_WAIT狀態也稱為2MSL狀態。
什麼是2MSL?MSL即Maximum Segment Lifetime,也就是報文最大生存時間,引用<TCP/IP詳解>中的話:“
它(MSL)是任何報文段被丟棄前在網路內的最長時間。”那麼,2MSL也就是這個時間的2倍。其實我覺得沒
必要把這個MSL的確切含義搞明白,你所需要明白的是,當TCP連線完成四個報文段的交換時,主動關閉的
一方將繼續等待一定時間(2-4分鐘),即使兩端的應用程式結束。你可以寫程式碼試試,然後用netstat檢視下。
為什麼需要2MSL?根據<TCP/IP詳解>和<The TCP/IP Guide>中的說法,有兩個原因:
其一,保證傳送的ACK會成功傳送到對方,如何保證?我覺得可能是通過超時計時器傳送。這個就很難用
程式碼演示了。
其二,報文可能會被混淆,意思是說,其他時候的連線可能會被當作本次的連線。直接引用<The TCP/IP Guide>
的說法:The second is to provide a “buffering period” between the end of this connection
and any subsequent ones. If not for this period, it is possible that packets from different
connections could be mixed, creating confusion.
TIME_WAIT狀態所帶來的影響:
當某個連線的一端處於TIME_WAIT狀態時,該連線將不能再被使用。事實上,對於我們比較有現實意義的
是,這個埠將不能再被使用。某個埠處於TIME_WAIT狀態(其實應該是這個連線)時,這意味著這個TCP
連線並沒有斷開(完全斷開),那麼,如果你bind這個埠,就會失敗。
對於伺服器而言,如果伺服器突然crash掉了,那麼它將無法再2MSL內重新啟動,因為bind會失敗。解決這
個問題的一個方法就是設定socket的SO_REUSEADDR選項。這個選項意味著你可以重用一個地址。
對於TIME_WAIT的插曲:
當建立一個TCP連線時,伺服器端會繼續用原有埠監聽,同時用這個埠與客戶端通訊。而客戶端預設情況
下會使用一個隨機埠與伺服器端的監聽埠通訊。有時候,為了伺服器端的安全性,我們需要對客戶端進行
驗證,即限定某個IP某個特定埠的客戶端。客戶端可以使用bind來使用特定的埠。
對於伺服器端,當設定了SO_REUSEADDR選項時,它可以在2MSL內啟動並listen成功。但是對於客戶端,當使
用bind並設定SO_REUSEADDR時,如果在2MSL內啟動,雖然bind會成功,但是在windows平臺上connect會失敗。
而在linux上則不存在這個問題。(我的實驗平臺:winxp, ubuntu7.10)
要解決windows平臺的這個問題,可以設定SO_LINGER選項。SO_LINGER選項決定呼叫close時,TCP的行為。
SO_LINGER涉及到linger結構體,如果設定結構體中l_onoff為非0,l_linger為0,那麼呼叫close時TCP連線
會立刻斷開,TCP不會將傳送緩衝中未傳送的資料傳送,而是立即傳送一個RST報文給對方,這個時候TCP連
接就不會進入TIME_WAIT狀態。
如你所見,這樣做雖然解決了問題,但是並不安全。通過以上方式設定SO_LINGER狀態,等同於設定SO_DONTLINGER
狀態。
斷開連線時的意外:
這個算不上斷開連線時的意外,當TCP連線發生一些物理上的意外情況時,例如網線斷開,linux上的TCP實現
會依然認為該連線有效,而windows則會在一定時間後返回錯誤資訊。
這似乎可以通過設定SO_KEEPALIVE選項來解決,不過不知道這個選項是否對於所有平臺都有效