1. 程式人生 > >硬碟的儲存原理和內部架構

硬碟的儲存原理和內部架構

磁碟讀寫資料所花費的時間

在瞭解了硬碟的基本原理之後,不難推算出,磁碟上資料讀取和寫入所花費的時間可以分為三個部分。

1.尋道時間

所謂尋道時間,其實就是磁臂移動到指定磁軌所需要的時間,這部分時間又可以分為兩部分:尋道時間=啟動磁臂的時間+常數*所需移動的磁軌數其中常數和驅動器的的硬體相關,啟動磁臂的時間也和驅動器的硬體相關

2.旋轉延遲

旋轉延遲指的是把扇區移動到磁頭下面的時間。這個時間和驅動器的轉數有關,我們通常所說的7200轉的硬碟的轉就是這個。平均旋轉延遲=1/(2*轉數每秒)比如7200轉的硬碟的平均旋轉延遲等於1/2*120≈4.17ms旋轉延遲只和硬體有關。3.傳輸時間傳輸時間指的是從磁碟讀出或將資料寫入磁碟的時間。
這個時間等於:所需要讀寫的位元組數/每秒轉速*每扇區的位元組數

磁碟排程演算法

通過上面硬碟讀寫資料所分的三部分時間不難看出,大部分引數是和硬體相關的,作業系統無力優化。只有所需移動的磁軌數是可以通過作業系統來進行控制的,所以減少所需移動的磁軌數是減少整個硬碟的讀寫時間的唯一辦法。因為作業系統內可能會有很多程序需要呼叫磁碟進行讀寫,因此合理的安排磁頭的移動以減少尋道時間就是磁碟排程演算法的目的所在,幾種常見的磁碟排程演算法如下。

1.先來先服務演算法(FCFS)

這種演算法將對磁碟的IO請求進行排隊,按照先後順序依次排程磁頭。這種演算法的特點是簡單,合理,但沒有減少尋道時間

2.最短尋道時間演算法(SSFT)

這種演算法優先執行所需讀寫的磁軌離當前磁頭最近的請求。這保證了平均尋道時間的最短,但缺點顯而易見:離當前磁頭比較遠的尋道請求有可能一直得不到執行,這也就是所謂的“飢餓現象”。

3.掃描演算法(SCAN)

這種演算法在磁頭的移動方向上選擇離當前磁頭所在磁軌最近的請求作為下一次服務物件,這種改進有效避免了飢餓現象,並且減少了尋道時間。但缺點依然存在,那就是不利於最遠一端的磁軌訪問請求。

3.迴圈掃描演算法(CSCAN)

也就是俗稱的電梯演算法,這種演算法是對最短尋道時間演算法的改進。這種演算法就像電梯一樣,只能從1樓上到15樓,然後再從15樓下到1樓。這種演算法的磁頭排程也是如此,磁頭只能從最裡磁軌到磁碟最外層磁軌。然後再由最外層磁軌移動到最裡層磁軌,磁頭是單向移動的,在此基礎上,才執行和最短尋道時間演算法一樣的,離當前磁頭最近的尋道請求。這種演算法改善了SCAN演算法,消除了對兩端磁軌請求的不公平。

其它優化手段以及SQL Server是如何利用這些手段

除去上面通過磁碟排程演算法來減少尋道時間之外。還有一些其它的手段同樣可以利用,在開始之前,我首先想講一下區域性性原理。

區域性性原理

所謂的區域性性原理分為時間和空間上的。由於程式是順序執行的,因此當前資料段附近的資料有可能在接下來的時間被訪問到。這就是所謂的空間區域性性。而程式中還存在著迴圈,因此當前被訪問的資料有可能在短時間內被再次訪問,這就是所謂的時間區域性性原理。因此在瞭解了局部性原理之後,我們可以通過以下幾個手段來減少磁碟的IO。

提前讀(Read-Ahead)

提前讀也被稱為預讀。根據磁碟原理我們不難看出,在磁碟讀取資料的過程中,真正讀取資料的時間只佔了很小一部分,而大部分時間花在了旋轉延遲和尋道時間上,因此根據空間區域性性原理,SQL Server每次讀取資料的時間不僅僅讀取所需要的資料,還將所請求資料附近的資料進行讀取。這在SQL Server中被稱為預讀。SQL Server通過預讀可以有效的減少IO請求。

延遲寫(Delayed write)

同樣,根據時間區域性性原理,最近被訪問的資料有可能再次被訪問,因此當資料更改之後不馬上寫回磁碟,而是繼續放在記憶體中,以備接下來的請求讀取或者修改,是減少磁碟IO的另一個有效手段,在SQL Server中,實現延遲寫是buffer pool,當一個修改請求被commit之後,並不會立刻寫回磁碟,而是將修改的頁標記為“髒”,然後根據某種機制通過checkpoint或lazy writer寫回磁碟,關於checkpoint和lazy writer的原理,可以參考我之前的文章:淺談SQL Server中的事務日誌(二)----事務日誌在修改資料時的角色.

優化物理分佈

根據磁碟原理不難看出,如果所請求的資料在磁碟物理磁軌之間是連續的,那麼會減少磁頭的移動距離,從而減少了尋道時間。因此相關的資料放在連續的物理空間上會減少尋道時間。SQL Server中,通過聚集索引使得資料根據主鍵在物理磁碟上連續,從而減少了尋道時間。