1. 程式人生 > >變與不變:走向十年的Intel資料中心SSD

變與不變:走向十年的Intel資料中心SSD

據今年5月DRAMeXchange釋出的企業級SSD市場統計顯示,Intel以40%的份額佔據了全球企業級SSD市場的榜首位置,240萬片出貨量傲視群雄,三星以25%的份額排名第二,西數/閃迪與東芝分列三四位。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

第一季度通常被認為是“淡季”,全球出貨量就達到600萬片,這意味著全年的全球出貨量將超過2400萬片,這還僅僅是SSD市場的冰山一角——企業級SSD出貨量僅佔全球SSD出貨量的10%。今年差不多也是Intel大舉進入SSD市場的第10個年頭——2008年推出的X25-E系列SSD迅速被市場所接受,開啟了晶片巨人在SSD市場的攻掠之旅。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

圖右黑框白殼的即為Intel X25-E SSD,剛推出時僅有32GB和64GB兩個容量版本,採用Intel 50nm的SLC快閃記憶體顆粒,使用3Gb/s SATA介面;圖左黑色外殼為2009年推出的X25-M系列SSD,使用34nm的MLC快閃記憶體顆粒,仍然是3Gb/s的SATA介面,但容量提升為80GB,並增加了TRIM支援

與“革命前輩”X25-E相比,現在的SSD雖然仍保留有2.5英寸外形的規格,但內涵卻不可同日而語。以Intel今年推出的DC P4600為例:

0?wx_fmt=jpeg

*2018年第一季度,DC P4600系列的最大容量將達到6.4TB

從上圖對比可以看出,經過近10年的發展,SSD容量提升超過100倍,IOPS和頻寬(效能)提升了數十倍。新技術如3D NAND、TLC以及全新NVMe的加入,使得SSD的容量和效能都有數十倍乃至上百倍的提升(注:此對比不代表平均水平,僅體現最大差異)。

3D之爭 後發能否先制

SSD的容量提升實際經歷了多個階段,比如傳統平面NAND的工藝提升,從早期的50nm到現在20nm,乃至1xnm(Intel DC S3510系列SSD就使用16nm工藝),從SLC到MLC,再到現在廣泛使用的TLC。在平面NAND技術很難進一步將密度提升之後,SSD又逐步過渡到3D NAND的軌道上。譬如三星推出其3D V-NAND技術並應用於SSD之後,結合TLC技術,進一步增大儲存密度,有效降低了SSD的每GB成本。

英特爾當然不願意喪失定價的主動權,於是和美光(Micron)在2015年宣佈聯合開發3DNAND技術,並在第二年(2016年)至強(Xeon)E5 v4處理器家族釋出的同時,推出了首款採用3D NAND技術的DC P3520系列SSD。

0?wx_fmt=png

Intel首款採用3D NAND技術的DCP3520系列SSD,提供兩種形態:用於各型別伺服器平臺的傳統PCIe插卡式(Add-In Card,AIC)SSD,和需要伺服器提供背板支援的(2.5英寸)U.2驅動器形式SSD。由於仍採用(平面)MLC顆粒和第三代控制器,P3520 SSD的最大容量為2TB

Intel的3D NAND採用標準的Floating-gate(FG,浮柵)技術,並宣稱:相比於電荷捕獲技術(Charge-Trap Flash,CTF),FG能夠實現更高的儲存密度,也更可靠;同時,CMOS位於FG單元堆疊陣列的底部,擁有更高的利用率。

0?wx_fmt=png

Intel公佈的3D NAND技術示意圖,採用32層堆疊,每die能達到256Gb(MLC)或者384Gb(TLC),單個NAND閃開顆粒支援最大16個die封裝,這意味著單個NAND快閃記憶體顆粒的最大容量就能達到512GB(MLC),乃至768GB(TLC)。由此算來,單個2.5英寸驅動器規格的SSD容量可以超過10TB

時隔一年之後,Intel推出了面向資料中心領域的新一代SSD——DC P4500/4600系列:使用3D NAND TLC快閃記憶體顆粒,最大容量達4TB(2018年第一季度,DC P4600系列的最大容量將達到6.4TB);全新的第四代快閃記憶體控制器和韌體,以及採用更新的NVMe 1.2規範……

伴隨DC P4500/4600系列SSD的釋出,作為其主要產地之一的大連工廠也宣佈擴建,以增加產能。英特爾大連工廠於2007年奠基,2010年正式投產。2015年10月,英特爾宣佈投資55億美元,升級大連工廠為非易失性儲存技術製造基地。2016年7月,英特爾大連工廠專案提前投產;2017年5月又宣佈擴建計劃,可謂一年一個大臺階,也反映出以中國為代表的市場對SSD的旺盛需求。

0?wx_fmt=jpeg

代號Fab 68的英特爾大連工廠肩負新一代SSD的生產重任

紅海藍海 品質唯先

在中國的資料中心市場,Intel品牌SSD佔有的份額更高,一度可達國內資料中心SSD市場的60%以上,包括BAT在內的網際網路公司都大量使用了Intel SSD。這一方面得益於競爭對手的“不給力”,更重要的則是Intel SSD本身所具備的品質。

NAND快閃記憶體顆粒可以說是SSD的PCB板上最主要的組成部分,更佔據SSD總體成本的80%以上,這可以通過DRAMeXchange網站公佈的價格來推算。當然,P4500/4600是Intel最新一代資料中心級SSD,採用了最新的3D NAND技術,以及新一代的控制器和韌體,DRAMeXchange網站並沒有相關資訊,但其成本構成比例應該不會有太大的變化。

0?wx_fmt=png

2010-2017全球NAND快閃記憶體市場份額,三星一直是排名第一,佔據了近40%的市場份額。以Intel的NAND產能,絕對不能打價格戰,把重心聚焦在資料中心藍海是明智之舉。圖源自:DRAMeXchange網站

Intel長期佔據統治地位的CPU業務會給其SSD業務帶來一些幫助,但並不總是正面效應。譬如一些OEM大廠的伺服器,出於種種考慮,標配的通常不是Intel品牌SSD。部分原因在於,OEM大廠通常有強大的研發能力,機型總數又相對有限,能夠針對性優化開發,而SSD供應商也樂於為大客戶服務,所以SSD的相容性基本不會成為問題。

但在白牌伺服器市場,或者從ODM直接採購/定製,面對各種型號、軟硬體配置都不確定的伺服器平臺,SSD本身的相容性和穩定性就顯得尤為重要。在這一市場,Intel品牌SSD無論是在口碑還是影響力上,都具有明顯的優勢,其中快閃記憶體控制器和韌體發揮了更重要的作用。

NAND快閃記憶體固然為SSD的容量和效能提供了基礎條件,但要將效能,以及企業使用者所關注的可靠性和穩定性發揮出來,還得靠快閃記憶體控制器和韌體。後兩者在很大程度上決定了SSD在實際應用中的品質,或者說體驗。

0?wx_fmt=jpeg

1.6TB容量的Intel DC P4600 SSD“裸照”,正反面共佈置了10顆NAND快閃記憶體顆粒(圖上為正面6顆,反面還有4顆NAND),每個die容量為48GB,單個NAND快閃記憶體顆粒封裝4個die——192GB容量,10個顆粒共計1920GB容量,實際可用容量1.6TB,剩餘320GB用於OP(Over-Provisioning,內部冗餘)。還可以看到,在整個PCB板上,控制器只佔了很小部分空間,即使加上控制器所需要的DRAM,也只佔據大約20%的空間。如果是更大容量的PCIe插卡式SSD,控制器在空間和成本上所佔的比重更小,而韌體則根本看不到——誰用誰知道

再戰NVMe P4500/4600能否延續輝煌?

打一個不太貼切的比喻,SSD中的快閃記憶體控制器和韌體,相當於PC中的CPU和作業系統,CPU的效能很大程度上決定了PC的效能,而作業系統與硬體適配的相容性,以及高階功能則決定了使用者體驗;同時,CPU與作業系統的相互支援優化能力也對使用者體驗無比重要。快閃記憶體控制器與韌體的關係也大致如此。

雖然NVMe SSD是一個全新的事物,但Intel在SATA時代的經驗可以繼續借鑑。Intel是SATA標準的發起者之一,參與規範制定,並在2003年推出支援SATA協議的南橋晶片(ICH5),現在獨立的(純)SATA控制器已經基本不存在,Intel晶片組整合的SATA控制器在多數情況下已經夠用。對SATA標準和控制器產品的熟練掌握,對Intel的SATA SSD產品意味著什麼,可謂不言而喻。近十年前,Intel X25-E系列SSD驚豔亮相,就離不開Intel在SATA上多年的經驗積累。

直到現在,SATA介面SSD仍佔據了Intel品牌SSD的半壁江山,但Intel早就清楚,以PCIe為代表的高效能接口才是SSD的未來。SATA介面誕生於磁碟時代,圍繞磁碟特性而設計;而快閃記憶體是一種完全有別於磁碟的儲存介質,要充分發揮快閃記憶體的優點,避開快閃記憶體的劣勢,新一代介面必須能夠“揚長避短”。眾所周知,PCIe介面具有極高的效能,同時還有可擴充套件性,比如單條PCIe 3.0通道能到到1GB/s的頻寬,隨著PCIe通道數的增加,其效能線性增長。並且,PCIe還有4.0乃至5.0規範,未來潛力無限。

0?wx_fmt=jpeg

但PCIe最初並不是專為儲存而設計的,要用於儲存,還得針對儲存特性進行專門設計。得益於PCIe介面的層次化架構,可在PCIe介面的基礎之上構建適用於儲存領域的新一代介面規範。

0?wx_fmt=png

PCIe介面的層次化示意圖,按照IEEE802網路協議模式來理解的話,其大致可以分為物理層、鏈路層和傳輸層三層,某些層下面可能又包含多個子層。NVMe實際上是一個暫存器級的邏輯裝置介面(logical device interface)規範,其基於PCIe規範,並使用PCIe的電氣介面

NVMe(NVM Express的簡稱),是專為快閃記憶體等非易失性儲存(Non-Volatile Memory,NVM)而全新設計的邏輯裝置介面規範,最早在2007年的Intel技術峰會(IDF2007)上提出,並於同年由Intel領導成立工作組著手製定相關規範,2008年在Intel官網釋出過一版草案(NVMHCI 1.0),真正意義的NVMe規範制定工作從2009年開始, 並於2011年3月釋出,即NVMe 1.0規範,此後NVMe工作組改為NVM Express標準組織,並在2014年釋出NVMe 1.2規範,增加了很多企業業務場景所需的功能。

0?wx_fmt=jpeg

NVMe規範釋出時間節點圖,從NVMe 1.0規範釋出之後,開始為NVMe增加企業級儲存功能,包括多路徑I/O、名稱空間共享與管理以及虛擬化等功能;又先後在2015和2016年增加了管理介面規範和NVMeover Fabrics(NVMeoF)規範等。規範與實際產品有一定的時間差,同時還得有測試驗證階段,Intel在今年全面支援NVMe 1.2規範已經是比較早的了

為了滿足企業級市場的需求,NVMe不斷完善自身功能,隨著功能的增加,這意味著快閃記憶體控制器需要更高的效能;另一方面,隨著平面NAND向3D NAND過渡,更大的容量管理也對快閃記憶體控制器的效能提出更高要求。在DC P4500/4600系列SSD中,Intel採用全新設計的第四代快閃記憶體控制器,資料顯示,新一代控制器能提供更高的效能,更利於發揮快閃記憶體的優勢:

  • 突破上一代2TB容量限制,最大可達4TB以上(如6.4TB、8TB或更高);

  • 增強硬體加速NVMe命令,提高效能;

  • 從上一代的每佇列最高32個4k命令提升到最高128個,提升伺服器效率;

  • 支援更新的NVMe 1.2規範;

  • 支援NVMe-MI規範,可帶外管理,便於運維。

值得注意的是,P4500/4600系列SSD在提升效能的同時,還完全支援NVMe-MI(NVMe Management Interface,NVMe管理介面)規範,其中最重要的一點就是帶外管理功能,這對大規模資料中心的意義不言而喻

快閃記憶體控制器與韌體在某些時候真的很難割裂開看,控制器是基礎,韌體則是對NVMe規範的具體實踐和針對性優化,Intel從另一個角度詮釋了全新韌體對DC P4500/4600的意義:

  • 增強韌體演算法,提供更好的QoS;

  • 增強TRIM,最小化效能影響;

  • 最大支援128個名稱空間(Namespace),增大應用範圍;

  • 升級TCG OPAL和Thermal Throttling,更高階的資料安全;

  • 免停機韌體升級,減少停機時間。

由於NAND快閃記憶體的本身特性導致SSD的讀寫效能差距較大,還有寫入壽命的限制,Intel按照以往慣例對DC P4500和P4600的應用場景進行了區分:P4500主要替代P3520(P3520替代P3500),用於面向讀密集型的應用場景:P4600系列SSD則用於替代P3600,面向中度寫負載的應用場景需求。

篇幅有限,關於Intel最新一代NVMe SSD的技術要點就介紹到此,在下一篇文章中,我們將對Intel最新一代的SSD在伺服器平臺上的應用進行介紹。同時,企事錄實驗室對於這兩款NVMe SSD的應用測試正在進行中,詳細結果將會在之後的文章中釋出。敬請關注!

640?wx_fmt=jpeg