Unix/Linux系統程式設計自學筆記-第十二章:塊裝置I/O和緩衝區管理
目錄
目錄概念介紹
-
塊裝置I/O緩衝區
用來代替磁碟I/O的檔案存取方法,基本原理是使用一系列的I/O緩衝區作為塊裝置的快取記憶體。當程序試圖讀取
(dev, blk)
標識的磁碟塊時,它首先在緩衝區快取中搜索分配給磁碟塊的緩衝區。如果該緩衝區存在並且包含有效資料,那麼它只需從緩衝區中讀取資料,而無須再次從磁碟中讀取資料塊。如果該緩衝區不存在,它會為磁碟塊分配一個緩衝區,將資料讀入緩衝區中,再從緩衝區中讀取資料。當某個塊被讀入時,該緩衝區將被儲存在緩衝區快取中,以供任意程序對同一個塊的下一次讀/寫請求使用。同樣,當程序寫入磁碟塊時,它首先會獲取一個分配給該塊的緩衝區。然後,它將資料寫入緩衝區,將緩衝區標記為髒,以延遲寫人,並將其釋放到緩衝區快取中。由於髒緩衝區包含有效的資料,因此可以使用它來滿足對同一塊的後續讀/寫請求,而不會引起實際磁碟L/O。髒緩衝區只有在被重新分配到不同的塊時才會寫入磁碟。 -
基本定義
-
bread(dev , blk)函式
返回一個包含有效資料的緩衝區指標
BUFFER *bread(dev,blk) { BUFFER *bp =» getblk(dev,blk)} //get a buffer for(dev,blk) if (bp data valid) return bp; bp -> opcode = READ; //issue READ operation start_io(bp); wait for I/O complete; return bp; }
-
write_block(dev , blk , data)函式
釋放緩衝區
write_block(dev , blk , data) { BUFFER *bp = bread(dev , data) //write data for U space write data to bp; (synchronous write)? bwrite(bp) : dwrite(bp); }
其中
bwrite(bp)
表示同步寫入,一般用於USB驅動器之類的裝置。dwrite(bp)
表示延遲寫入,是隨機訪問裝置如硬碟所使用的寫操作方式,dwrite會將緩衝區標記為髒,髒緩衝區只有在被重新分配到不同的磁碟塊時才會被寫入磁碟。
-
物理塊裝置I/O
每個裝置都有一個I/O佇列,其中包含等待I/O操作的緩衝區。
緩衝區上的
start_io()
操作如下:start_io(BUFFER *bp) { enter bp into device I/O queue; if (bp is first buffer in I/O queue) issue I/O command for bp to device; }
當I/O操作完成後,裝置中斷處理程式會完成當前緩衝區上的I/O操作,並啟動I/O佇列中的下一個緩衝區的I/O。裝置中斷處理程式的演算法如下:
InterruptHandler() { bp = dequeue(device I/O queue); //bp = remove head of I/O queue (bp -> opcode == ASYNC)? brelse(bp) : unblock process on bp; if (!empty(device I/O queue)) issue I/O command for first bp in I/O queue; }
-
Unix系統的 I/O緩衝區管理演算法
- Unix系統的I/O緩衝區管理子系統一般有以下個5部分:
- I/O緩衝區:核心中的一系列NBUF緩衝區
- 裝置表:每個塊裝置用一個裝置表結構表示
- 快取區初始化:系統啟動時的I/O緩衝區都處在空閒列表,所有裝置列表和I/O佇列皆為空\
- 緩衝區列表:當緩衝區被分配給(dev , blk)時,插入裝置列表的dev_list中
- Unix get/brelse演算法:用於重新分配緩衝區
- Unix演算法的缺點:
- 效率低下:該演算法依賴於重試迴圈,例如,釋放緩衝區可能會喚醒兩組程序:需要釋放的緩衝區的程序,以及只需要空閒緩衝區的程序。由於只有一個程序可以獲取釋放的緩衝區,所以,其他所有被喚醒的程序必須重新進入休眠狀態。從休眠狀態喚醒後,每個被喚醒的程序必須從頭開始重新執行演算法,因為所需的緩衝區可能已經存在。這會導致過多的程序切換。
- 快取效果不可預知:在Unix演算法中,每個釋放的緩衝區都可被獲取'如果緩衝區 由需要空閒緩衝區的程序獲取,那麼將會重新分配緩衝區,即使有些程序仍然需要當前的緩衝區。
- 可能會出現飢餓:Unix演算法基於“自由經濟”原則,即每個程序都有嘗試的機會,但不能保證成功,因此,可能會出現程序飢餓。
- 該演算法使用只適用於單處理器系統的休眠/喚醒操作
新的I/O緩衝區管理演算法
-
Unix演算法雖然簡單,但也有許多缺點,所以需要一個更可靠的I/O緩衝區管理演算法。這個新的演算法即使用訊號量的緩衝區管理演算法。
-
使用訊號量的緩衝區管理演算法
使用P/V訊號量實現程序同步的演算法:
BUFFER *getb1k(dev,blk): while(1){(1). P(free); //get a free buffer first if (bp in dev_1ist){(2). if (bp not BUSY){ remove bp from freelist;P(bp); // lock bp but does not wait (3).return bp; // bp in cache but BUSY V(free); // give up the free buffer (4).P(bp); // wait in bp queue return bp;v // bp not in cache,try to create a bp=(dev,blk) (5).bp = frist buffer taken out of freelist;P(bp); // lock bp,no wait (6).if(bp dirty){ awzite(bp); // write bp out ASYNC,no wait continue; // continue from (1) (7).reassign bp to(dev,blk);1/ mark bp data invalid,not dir return bp;- // end of while(1); brelse(BUFFER *bp), { (8).iF (bp queue has waiter)( V(bp); return; ] (9).if(bp dirty && free queue has waiter){ awrite(bp);zeturn;}(10).enter bp into(tail of) freelist;V(bp);V(free); }
-
P/V演算法的正確性驗證
- 緩衝區唯一
- 無重試迴圈
- 無不必要喚醒
- 快取效果
- 無死鎖或飢餓