阻塞和非阻塞、同步和非同步 、五種IO模型
阻塞和非阻塞,同步和非同步
1 例子
故事:老王燒開水。
出場人物:老張,水壺兩把(普通水壺,簡稱水壺;會響的水壺,簡稱響水壺)。
老王想了想,有好幾種等待方式
1.老王用水壺煮水,並且站在那裡,不管水開沒開,每隔一定時間看看水開了沒。-同步阻塞
老王想了想,這種方法不夠聰明。
2.老王還是用水壺煮水,不再傻傻的站在那裡看水開,跑去寢室上網,但是還是會每隔一段時間過來看看水開了沒有,水沒有開就走人。-同步非阻塞
老王想了想,現在的方法聰明瞭些,但是還是不夠好。
3.老王這次使用高大上的響水壺來煮水,站在那裡,但是不會再每隔一段時間去看水開,而是等水開了,水壺會自動的通知他。-非同步阻塞
老王想了想,不會呀,既然水壺可以通知我,那我為什麼還要傻傻的站在那裡等呢,嗯,得換個方法。
4.老王還是使用響水壺煮水,跑到客廳上網去,等著響水壺自己把水煮熟了以後通知他。-非同步非阻塞
老王豁然,這下感覺輕鬆了很多。
同步和非同步
同步就是燒開水,需要自己去輪詢(每隔一段時間去看看水開了沒),非同步就是水開了,然後水壺會通知你水已經開了,你可以回來處理這些開水了。
同步和非同步是相對於操作結果來說,會不會等待結果返回。阻塞和非阻塞
阻塞就是說在煮水的過程中,你不可以去幹其他的事情,非阻塞就是在同樣的情況下,可以同時去幹其他的事情。阻塞和非阻塞是相對於執行緒是否被阻塞。
其實,這兩者存在本質的區別,它們的修飾物件是不同的。阻塞和非阻塞是指程序訪問的資料如果尚未就緒,程序是否需要等待,簡單說這相當於函式內部的實現區別,也就是未就緒時是直接返回還是等待就緒。
而同步和非同步是指訪問資料的機制,同步一般指主動請求並等待I/O操作完畢的方式,當資料就緒後在讀寫的時候必須阻塞,非同步則指主動請求資料後便可以繼續處理其它任務,隨後等待I/O,操作完畢的通知,這可以使程序在資料讀寫時也不阻塞。
2 詳細介紹
網路IO的模型大致包括下面幾種
- 同步模型(synchronous IO)
- 阻塞IO(bloking IO)
- 非阻塞IO(non-blocking IO)
- 多路複用IO(multiplexing IO)
- 訊號驅動式IO(signal-driven IO)
- 非同步IO(asynchronous IO)
- 非同步IO
網路IO的本質是socket的讀取,socket在linux系統被抽象為流,IO可以理解為對流的操作。對於一次IO訪問,資料會先被拷貝到作業系統核心的緩衝區中,然後才會從作業系統核心的緩衝區拷貝到應用程式的地址空間,所以一般會經歷兩個階段:
- 等待所有資料都準備好或者一直在等待資料,有資料的時候將資料拷貝到系統核心;
- 將核心快取中資料拷貝到使用者程序中;
對於socket流而言:
- 等待網路上的資料分組到達,然後被複制到核心的某個緩衝區;
- 把資料從核心緩衝區複製到應用程序緩衝區中;
2.1 阻塞IO
2.1.1 介紹
這也是最常用的模型,預設情況下所有的套接字都是 阻塞
的;
我們把recvfrom函式視為系統呼叫,因為我們正區分程序和核心,系統呼叫一般都會從在應用程序空間中執行切換到核心空間中執行,一段時間後又再切換回來;
我們可以從圖中看到,應用程序從 進行系統呼叫
到 複製資料報到應用程序的緩衝區完成
的整段時間內是被阻塞的;在這個過程中,要麼正確到達,要麼系統呼叫被訊號打斷;直到資料報被複制到使用者程序完成後,使用者程序才解除阻塞的狀態,當然,這是使用者程序自己進行的阻塞;
2.1.2 優點和缺點
- 優點:能夠及時返回資料,無延遲;方便除錯;
- 缺點:需要付出等待的代價;
2.2 非阻塞IO
2.2.1 介紹
非阻塞,當所請求的I/O操作非得把當前程序設定成睡眠才能完成時,不要把當前程序設定成睡眠,而是返回一個錯誤資訊(資料報沒有準備好的情況下),此時當前程序可以做其它的事情,不用阻塞;
從圖中可以得知,前三次系統呼叫時都沒有資料可以返回,核心均返回一個 EWOULDBLOCK
,並且不會阻塞當前程序,直到第四次詢問核心緩衝區是否有資料的時候,此時核心緩衝區中已經有一個準備好的資料,因此將核心資料複製到使用者空間,此時系統呼叫則返回成功;
當一個應用程序像這樣對一個非阻塞socket迴圈呼叫
recv/recvfrom
時,則稱為輪詢;應用程序持續輪詢核心,以檢視某個操作是否就緒,這麼做往往消耗大量的CPU時間。
2.2.2 優點和缺點
優點:相較於阻塞模型,非阻塞不用再等待任務,而是把時間花費到其它任務上,也就是這個當前執行緒同時處理多個任務;
缺點:導致任務完成的響應延遲增大了,因為每隔一段時間才去執行詢問的動作,但是任務可能在兩個詢問動作的時間間隔內完成,這會導致整體資料吞吐量的降低。
2.3 IO多路複用
2.3.1 介紹
有了I/O複用,我們就可以呼叫 select或poll
,讓其阻塞在兩個系統呼叫(1.詢問資料是否準備好並且直到資料準備好才返回;2.核心是否把資料全部複製完成到使用者程序)中的某一個之上
圖中阻塞於 select
呼叫,等待資料報套接字變為可讀。當select返回套接字可讀這一條件的時候,則呼叫 recvfrom
把所讀資料報復制到應用程序緩衝區;
之前的同步非阻塞方式需要使用者程序不停的輪詢,但是IO多路複用不需要不停的輪詢,而是派別人去幫忙迴圈查詢多個任務的完成狀態,UNIX/Linux 下的 select、poll、epoll
就是幹這個的;select呼叫是核心級別的,select輪詢相對非阻塞的輪詢的區別在於---前者可以等待多個socket,能實現同時對多個IO埠進行監聽,當其中任何一個socket的資料準好了,就能返回進行可讀,然後程序再進行recvform系統呼叫,將資料由核心拷貝到使用者程序,當然這個過程是阻塞的。select或poll呼叫之後,會阻塞程序,與blocking IO阻塞不同在於,此時的select不是等到socket資料全部到達再處理, 而是有了一部分資料(網路上的資料是分組到達的)就會呼叫使用者程序來處理。如何知道有一部分資料到達了呢?監視的事情交給了核心,核心負責資料到達的處理。
我認為上面那句話中存在兩個重要點:1.對多個socket進行監聽,只要任何一個socket資料準備好就返回可讀;2.不等一個socket資料全部到達再處理,而是一部分socket的資料到達了就通知使用者程序;
其實 select、poll、epoll
的原理就是不斷的遍歷所負責的所有的socket完成狀態,當某個socket有資料到達了,就返回可讀並通知使用者程序來處理;
2.3.2 優點和缺點
- 優點:能夠同時處理多個連線,系統開銷小,系統不需要建立新的額外程序或者執行緒,也不需要維護這些程序和執行緒的執行,降低了系統的維護工作量,節省了系統資源。
- 缺點:如果處理的連結數目不高的話,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server效能更好,可能延遲還更大。(因為阻塞可以保證沒有延遲,但是多路複用是處理先存在的資料,所以資料的順序則不管,導致處理一個完整的任務的時間上有延遲)
2.3.3 同步非阻塞和多執行緒+同步阻塞
高併發的程式一般使用同步非阻塞方式而非多執行緒 + 同步阻塞方式。要理解這一點,首先要扯到併發和並行的區別。比如去某部門辦事需要依次去幾個視窗,辦事大廳裡的人數就是併發數,而視窗個數就是並行度。也就是說併發數是指同時進行的任務數(如同時服務的 HTTP 請求),而並行數是可以同時工作的物理資源數量(如 CPU 核數)。通過合理排程任務的不同階段,併發數可以遠遠大於並行度,這就是區區幾個 CPU 可以支援上萬個使用者併發請求的奧祕。在這種高併發的情況下,為每個任務(使用者請求)建立一個程序或執行緒的開銷非常大。而同步非阻塞方式可以把多個 IO 請求丟到後臺去,這就可以在一個程序裡服務大量的併發 IO 請求。
2.4 訊號驅動式I/O模型
首先開啟套接字的訊號驅動式IO功能,並且通過 sigaction
系統呼叫安裝一個訊號處理函式,該函式呼叫將立即返回,當前程序沒有被阻塞,繼續工作;當資料報準備好的時候,核心則為該程序產生 SIGIO
的訊號,隨後既可以在訊號處理函式中呼叫 recvfrom
讀取資料報,並且通知主迴圈資料已經準備好等待處理,也可以通知主迴圈讓它讀取資料報;(其實就是一個待讀取的通知和待處理的通知);
2.5 非同步式I/O模型
我們呼叫 aio_read
函式,給核心傳遞描述符、緩衝區指標、緩衝區大小和檔案偏移,並且告訴核心當整個操作完成時如何通知我們。該函式呼叫後立即返回,不被阻塞;