大資料儲存技術基礎
一、緒論
1.儲存的本質
資訊跨越空間的傳遞——通訊
資訊跨越時間的傳遞——儲存
通訊:利用具有跨越空間特性的物理現象 ---聲音、光、電
儲存:利用具有時間穩態的物理現象 ---物理穩態、磁穩態、半導體穩態
什麼是儲存?
儲存:
·它是資料臨時或長期駐留的物理媒介;
·它是保證資料完整安全存放的方式或行為。
計算機儲存系統:
指計算機中由存放程式和資料的各種儲存裝置(介質)、控制部件與介面及管理資訊排程的裝置(硬體)和演算法(軟體)所組成的系統。
儲存的主要指標:
容量:可以存下多少東西
速度:讀寫頻寬、讀寫次數/秒(IOPS)
永續性:資料能夠儲存多久 大小:體積是多少
方便性:是否方便移動和攜帶
功耗:消耗能耗高低
價效比:單位價格下主要指標如何,例如速度 、容量等指標;
1.1儲存介質的發展歷程
(1)儲存的歷史
象形文字、石刻楔形文字、竹簡、紙質印刷
現在進入“磁器時代”,大部分資料都是用硬碟儲存,磁碟稱為當今世界資料儲存的主流技術
儲存器裝置:計算機系統中的記憶裝置,用來存放程 序和資料
(2)儲存器的發展
儲存器類別:打孔紙卡、穿孔紙帶、威廉管、磁鼓、汞延遲線、超聲波儲存器、鐵電儲存磁芯、相變儲存、可擦除可程式設計只讀儲存器、Flash、磁阻式隨機存取記憶體
磁芯儲存器:核心使用微小的磁環(環),核心通過執行緒來寫入和讀取資訊。 每個核心代表一點資訊。 磁芯可以以兩種不同的方式(順時針或逆時針)磁化,儲存在磁芯中的位為零或一,取決於磁芯的磁化方向。 佈線被佈置成允許單個芯被設定為1或0,並且通過向所選擇的導線傳送適當的電流脈衝來改變其磁化。 讀取核心的過程會導致核心重置為零,從而將其擦除。 這稱為破壞性讀數。 在不進行讀寫操作時,即使關閉電源,核心也會保持最後的值。 這使它們成為非易失性的。
1955-1975:磁芯儲存器統治了計算機隨機儲存器(RAM)
1964年:靜態隨機存取儲存器(SRAM)
1969年:英特爾公司開發了第一個256位靜態RAM
1966年:IBM公司發明了動態隨機存取記憶體(DRAM)
各代DDR的主要改進:
1.SDRAM:(同步動態隨機儲存器)
Synchronous Dynamic Random Access Memory,一個時鐘 週期內只傳輸一次資料,它是在時鐘的上升期進行資料傳輸;
Memory工作需要同步時鐘,內部的命令的傳送與資料的傳 輸都以它為基準;
動態是指儲存陣列需要不斷的重新整理來保證資料不丟失;
2.DDR:Double Data Rate SDRAM
一個時鐘週期內傳輸兩次資料,它能夠在時鐘的上升期和 下降期各傳輸一次資料,稱為雙倍速率SDRAM ;
更先進的同步電路,使指定地址、資料的輸送和輸出主要 步驟既獨立執行,又保持與CPU完全同步;
3.DDR2:
在同等核心頻率下,DDR2的實際工作頻率是DDR的兩倍。這得益於 DDR2記憶體擁有兩倍於標準DDR記憶體的4BIT預讀取能力 ;
在採用更低發熱量、更低功耗的情況下,DDR2可以獲得更快的頻率 提升,突破標準DDR的400MHZ限制 ;
DDR2記憶體通常採用FBGA晶片封裝形式,功耗和發熱量更小。
4.DDR3:
突發長度(Burst Length,BL)。DDR3增加了一個4bit Burst Chop(突發突變)模式;
新增重置(Reset)功能,當Reset命令有效時,DDR3記憶體將停止所 有操作,並切換至少量活動狀態,以節約電力 ;
定址時序(Timing),DDR2的CL(CAS Latency)範圍一般在2~5 之間,而DDR3則在5~11之間。
5.DDR4:
相比DDR3大的區別有三點:16bit預取機制(DDR3為8bit),同樣核心頻率下理論速度是DDR3的兩倍;更可靠的傳輸規範,資料可 靠性進一步提升;工作電壓降為1.2V,更節能。
相變儲存
在1969年Charles Sie的論文中提出這項儲存技術 ;
三星公司成為第一個成為開發出PCRAM的公司, 美光公司則已經生產出容量為1Gb的晶片;
相變記憶體具有高速存取和非易失的特性
磁阻式隨機存取記憶體MRAM
1989年:磁阻式隨機存取記憶體MRAM (MagnetoresistiveRandom Access Memory)
MRAM接近靜態隨機儲存器(SRAM)的高速讀 取寫入能力,以及動態隨機儲存器(DRAM)的 高整合度
IBM在上世紀八九十年代最早開始研發,但其商業 化的步伐依然沒有取得進展,目前仍處於研發階段
(3)輔儲存器的變遷
磁帶、 磁碟、軟盤、 光碟、固態盤
快閃記憶體的主要優點:非易失、體積小、重量輕、低能耗、無噪聲、抗震動
我們平時用的固態硬碟(SSD)就是flash組成的磁碟陣列。
(2018年3月,100TB固態硬碟上 市:Nimbus Data公司的 ExaDriveDC100系列固態硬碟)
注:記憶體條一般是用DRAM技術做成的,而Cache一般是用SRAM做成的
1.2 硬體儲存介面技術的發展
匯流排技術:
System Bus :連線CPU 和Memory ;
Local (I/O) Bus :從外部裝置搬運資料 ;
Bus 指標:
BUS width measured in bits ;
Bus speed measured in MHz ;
Throughput measured in MB/S;
連線協議
1.儲存匯流排介面:IDE/ATA
· IDE:Integrated Device Electronics
· ATA指令集(Advanced Technology Attachment:1986 年)
· CalledPATA:並行的ATA80芯資料線
·上世紀90年代最流行的現代硬碟介面之一
·最大:133 Mbps,低價格上的好效能
·Desktop 和laptop系統
·Inexpensive 儲存連結interconnect
2.SCSI:Small Computer System Interface
SCSI:伺服器最流行的硬碟介面,1986標準化
·高速資料傳輸、頻寬大、熱插拔:320MB/S;連線裝置8-16個
·支援多個數據的同時訪問
較IDE/ATA價格昂貴
並行模式SCSI
主用在“高階計算” 環境中
3.儲存匯流排介面:SATA/ATA
SATA協議:Serial序列ATA(IDE:並行ATA)
·ATA指令集,序列線路傳輸資料,2000年
·傳輸率高、可靠性強、針腳少(6-8)
·目前最高速率600MB/S
·桌面系統和伺服器,稍貴的儲存連結:相對IDE
SAS(Serial Attached SCSI):序列模式SCSI介面
·3.0 Gbps-6Gbps
·高階伺服器
4.Internal DAS Connectivity Examples
主機外連儲存裝置的構件Components
FibreChannel:光纖通道FC
外部儲存介面SCSI與FC比較
FibreChannel:可支援SCSI 指令集
高頻寬:2-8Gbps
傳輸距離遠:長達150m ~ 50km
確定性低延遲:微秒級端到端 延遲;
低誤位元速率:小於10-12 ;
抗干擾能力強:對電磁干擾有 天然的免疫力
Dual-ported drives
SCSI :
320MB/S
有限的距離
有限的裝置數目: 大8-16
Usually limited to single initiator
Single-ported drives
Fibre Channel Connectivity
Bus 技術-PCI
PCI:Peripheral Component Interconnect(外設 部件互連)
計算機內的區域性並行匯流排標準
廣泛用於當前高檔微機和行動式微機。主要用於連線顯示 卡、網絡卡、音效卡。主機板帶有多數量的插槽型別
高速連結微處理器和外部裝置
即插即用功能
32/64 bit;133 MB/sec
Bus 技術-PCIe
PCI Express: Evolved from PCI and PCI-X™ architectures
高速序列替換協議for PCI and PCI-X;
高8GB/s總 線頻寬
PCI Express鏈路是兩個裝置之間(PCI Express埠) 的點對點通訊通道
Implements packet based protocol for information transfer
在物理層面上,一條鏈路由一條或多條通道組成,包含1 個到32個通道,更精確地包括1,2,4,8,12,16或32個通道
•例如,低速外設(例如802.11 Wi-Fi卡)使用單通道(×1) 鏈路,而圖形介面卡通常使用更寬更快的16通道鏈路。
PCI vs PCIe的速度比較
SCSI協議結構
1.3 儲存系統基本結構形式
儲存系統:
1)儲存資源組合:提供大容量、高效能、低價格、 高可用、高安全的儲存系統為目的
·•儲存資源單元:暫存器、SRAM、DRAM、Flash、硬碟、磁 帶、光碟
2)各種層次和規模的組合:大/快/便宜的儲存器
經典的組合---Cache和VM(虛擬記憶體)
•Cache-:SRAM與DRAM的組合
•VM:DRAM 與DISK的組合(看起來又大又快又便宜 的儲存器)
儲存層次–速度和開銷:
磁碟陣列
整合大量廉價的小型磁碟儲存器構造出磁碟陣列:
“分塊”、“交叉存取”以及冗餘容錯等技術
容量大、可靠性高、效能高
(個人認為磁碟陣列一般都要附加一個陣列控制器 例如RAID Controller)
直接附加儲存Direct Access Storage
以伺服器為中心:儲存裝置通過匯流排(SCIS線等) 直接連線到主機上,受控於主機
·儲存裝置內部利用SCSI匯流排通道或FC通道、IDE介面連接多個磁碟,實現RAID技術,形成一個磁碟陣列,從而解決了資料容錯、大儲存空間的問題
優點:簡單、便宜、易於安裝部署管理
儲存的邏輯卷和檔案系統概念
1.塊裝置
(1)以Block為基本讀寫單位的裝置
•磁碟:“Block”指Sector
•快閃記憶體:“Block”指Page或Subpage
•RAID:“Block”指Stride
(2)鍵盤、滑鼠不是塊裝置,它們以位元組流的形式讀寫
(3)網絡卡不是塊裝置,但通過網絡卡連線的iSCSI儲存裝置是塊裝置
2.物理卷(Physical Volume)
將一個塊裝置劃分成幾個部分,每部分稱作一個物理卷(也稱“分割槽”)
物理卷的引入使大容量塊裝置的管理更容易
每個物理卷被劃分成許多大小一致的Physical Extents(物理塊)
3.卷組(Volume Group)
大量的物理卷組成一個儲存池,叫卷組
•卷組可包含多個塊裝置上的物理卷
•一個塊裝置上的物理卷可處於多個卷組中
卷組的引入為可伸縮的儲存空間管理提供基礎
4.邏輯卷(Logical Volume)
卷組包含多個物理卷,每個物理捲包含大量Physical Extents,邏輯卷管理器從這些Physical Extents拿出一部分組成邏輯卷
•邏輯卷由大量Logical Extents組成
•邏輯卷的每個Logical Extent對應物理卷的一個Physical Extent
•同一邏輯卷的Logical Extents可來自不同的物理卷,同一物理卷的 Physical Extents可處於不同的邏輯卷中
每個邏輯捲上安裝一個檔案系統,邏輯卷通過增加和減少Logical Extent調整大小,導致檔案系統的容量是可伸縮的
&n