固態硬碟壽命測試一年半 壽命指數超乎想象 連寫2500TB終於全掛
固態硬碟可靠性測試:寫入22TB資料之後……
SSD固態硬碟相比傳統HDD機械硬碟的優點是效能強、體積小、無噪音,但是特殊的工作原理也讓它的使用次數有限,而且這個次數還會隨著製程工藝的升級而降低,程式設計/擦寫迴圈次數從之前的5000+降低到3000次甚至1000次。
SSD使用壽命是個老生常談的話題了,廠商一次次強調隨著SSD容量的增加和主控技術的進步,SSD有限的寫入次數對使用壽命來說並不是嚴重問題了,不過想打消消費者的疑惑還沒這麼容易。
此前Hardware.info網站以TLC快閃記憶體的三星840 SSD為例做了一次長期的SSD使用壽命測試,結果顯示其可用寫入次數是大大超過官方標準的,TLC快閃記憶體的可靠性也不是問題。
現在又有媒體來接力了,TechReport也做了SSD使用壽命的長期測試,不過他們採集的樣本更多,使用了6款SSD,包括三星840 Pro、三星840、金士頓HyperX 3K(這個使用了兩款,一個進行可壓縮資料測試,一個進行不可壓縮資料測試)、Intel 335及海盜船Neutron GTX,容量都是256GB或者240GB的。
他們使用了Anvil's Storage Utilities軟體進行大規模資料寫入,現在過去了兩週多了,寫入的資料已經達到了22TB,是時候檢驗一下這六款SSD的情況了。
第一個節點選擇22TB是因為這個寫入量是Intel公佈的335 SSD正常使用壽命,官方稱它可以在每天20GB的寫入量情況下使用三年。
首先來看各個SSD的平均寫入速度,但是上述資料並不具備可比性,因為為了加快測試進度,這6個SSD是安裝到了兩套平臺上同步進行的,有的使用了SATA 6Gbps介面,有的使用了SATA 3Gbps介面。上面的平均寫入速度只能用於評估各SSD寫入22TB所用時間。
相比速度絕對值,他們更關注的是寫入22TB資料之後的SSD效能的前後變化。這時候的測試結果是恢復到之前測試平臺和系統上進行的,因此前後結果可以對比。
寫入22TB資料後的隨機、連續效能變化:
連續讀取速度變化
連續寫入速度變化
隨機讀取速度變化
隨機寫入速度變化
大部分測試中SSD前後效能變化都在1-2%左右,考慮到誤差因素,可以說他們在寫入22TB資料之後效能並沒有什麼變化。
讓人吃驚的是金士頓HyperX 3K SSD的隨機讀取效能,不論是可壓縮資料還是不可壓縮資料,效能都提升了30%以上,Intel的335 SSD也小幅提高了8%,這二者使用的都是SF主控。
此外,SMART資訊也會不斷追蹤SSD的壞塊、寫入資料量等資訊,不過目前為止還沒看到有壞塊出現,這些SSD依然很健康。
測試中有2個型號的SSD都使用了SF主控,而且隨機讀取速度在寫入22TB資料之後反而有46%的提升。另外,資料壓縮測試中,不可壓縮資料寫入了22.8TB,而可壓縮的那個只寫入了15.5TB資料,節省了32%,還是有用處的。
再看下SSD的寫入放大。兩款HyperX 3K SSD的本機寫入量都是21.6TB,實際寫入資料一個是22.8TB,可壓縮的則是15.5TB,寫入放大率分別是1.05和0.72(注:這種持續寫入資料的情況下寫入放大率不會很大,接近1是很正常的)。
Intel的335 SSD的NAND寫入量是22.9TB,主機寫入量是21.6TB,寫入放大跟金士頓HyeprX 3K差不多。至於其他SSD,因為追蹤不到NAND寫入量,所以無法計算寫入放大。
以上就是寫入22TB資料之後的基本情況,他們的下一個目標是100TB,估計還要等很長時間了
固態硬碟耐用性試驗:200TB重壓下的壞塊
TechReport從今年八月底開始了一項固態硬碟耐用性試驗,找來多款240/256GB的產品對它們持續進行寫入,看看什麼時候會掛掉,效能又會如何變化。
半個月後他們寫入了22TB資料,相當於連續三年每天20GB,所有硬碟都應付得很好。
現在,資料寫入量已經達到200TB,相當於連續五年每天100GB,終於有扛不住的了。
其實在寫入量超過100TB的時候,三星840就第一個出現了問題,S.M.A.R.T.屬性中顯示有11個重新分配的扇區,換句話說就是有了壞塊(bad block)。三星840採用的是3bit TLC快閃記憶體,寫入耐久性本來就比其它用2bit MLC的要差一些,這並不意外。
不過儘管如此,這塊硬碟的效能、容量都沒有絲毫變化,一切表現正常。
寫入了200TB之後,三星840重新分配的扇區已有370個,金士頓HyperX 3K也有了四個壞塊。值得一提的是,本次測試用了兩塊Hyper 3K,其中一塊寫入可壓縮資料(46%),另一塊則和其它一樣用不可壓縮資料,出問題的是後者。
這顯然是SandForce主控的緣故,經過它壓縮的前者實際只向快閃記憶體寫入了143GB。
金士頓HyperX 3K的區塊大小為4MB,所以損失的總容量為16MB。三星840的區塊大小不詳,三星也一直沒有迴應詢問,從測試看應該是1.5MB,那麼損失容量就達到了555MB。
不過由於損壞並替換的區塊都位於冗餘容量內,兩塊硬碟的實際可用量都沒有變化,Windows下仍然分別是HyperX 3K 224GB、840 234GB。
三星SSD Magician工具顯示840的健康狀況依然是“良好”(good),但是用來獲取S.M.A.R.T.屬性資料的Hard Disk Sentinel卻並不樂觀:
在它看來,寫入100TB資料後三星840的健康度就只剩下了66%,840 Pro也不過78%,另外Intel 335也損失了12%。
200TB寫入後,三星840 19%的健康度看上去岌岌可危,840 Pro 51%也不怎麼樣,不過金士頓HyperX 3K(不可壓縮資料)仍然有98%,寫入可壓縮資料的海盜船Neutron GTX都還是100%。
此外,海盜船的工具沒有健康度顯示,金士頓的不相容測試平臺。
儘管有損壞的區塊,以及看起來很嚇人的健康度指示,但不得不說這些固態硬碟都很好地經受了考驗,迄今仍可正常使用,而且不要忘了,連續五年每天寫入100GB在實際應用中幾乎是不可能的。
那麼,效能上都有了什麼變化呢?
持續讀取
持續寫入
隨機讀取
隨機寫入
100TB、200TB寫入後都對六塊硬碟的持續、隨機讀寫速度進行了測試,結果發現都和最初水準相差無幾,200TB後也沒有超過2%。
值得一提的是,金士頓HyperX 3K的效能在寫入22TB後反而大大高於最初,100TB之後仍然更高,200TB後才降下來。
此外,測試人員還使用了Anvil的耐久性測試工具,安全擦除全盤後寫入一系列隨機大小的檔案,直到預定的限制,然後在下次常規寫入前刪除它們,下邊就是每輪寫入的平均速度:
注意:六塊硬碟連線在兩套相同的系統上,但因為介面數量限制,兩塊HyperX使用的是SATA 3Gbps,其它都是SATA 6Gbps。這裡我們對彼此效能差異沒興趣,只看各自效能隨時間的變化。
金士頓、Intel都使用了SandForce的主控,峰值都出現在22TB、100TB寫入後的安全擦除,這使得主控暫時恢復了活力。
三星840 Pro每次擦除後也會復活,但是效能飄忽不定、波動太大,不過從一開始就這樣,可能和垃圾回收、內部管理機制有關,而不是快閃記憶體的問題。
三星840出現了最明顯的效能滑坡,從超過100MB/s跌到了大約85MB/s,但這和壞塊沒什麼關係。
海盜船的Neutron GTX反倒是越來越快了。
試驗還在繼續,等著看寫入300TB之後又會如何吧。
固態硬碟連續寫入300TB:Intel 335也“壞了”
TechReport堅持進行的固態硬碟耐用性馬拉松試驗再次達到關鍵節點,資料寫入量已經走過300TB,現在各位參賽選手的情況又是如何呢?
背景回顧:
最先出現問題的三星840 250GB情況正在持續惡化。100TB的寫入後就出現了11個重新分配扇區,200TB後增至370個,300TB後則達到了833個。三星依然拒絕透露每個扇區的具體尺寸,如果按照1.5MB的猜測計算那就是1.2GB。
看上去不少,但幸運的是,因為冗餘容量更多,使用者實際可用的仍未發生變化。
840是唯一一個使用TLC快閃記憶體顆粒的,其耐久性存在天然缺陷,因此這一切都並不意外。
寫入不可壓縮資料的金士頓HyperX 240GB之前出現了4個重新分配扇區,但此後表現穩健,沒有進一步增多。另一款寫入的是可壓縮資料,感謝SandForce主控的資料壓縮,實際寫入量僅有215TB。
除此之外,Intel SSD 335 240GB也加入了這一行列,出現了1個重新分配扇區。
健康度方面,S.M.A.R.T.屬性顯示840只有恐怖的1%,可謂岌岌可危,840 Pro 256GB也掉到了26%,不過三星自己的SSD Magician工具依然報告它們倆狀態“良好”(Good)。
Intel SSD Toolbox也報告其SSD 335狀態良好,儘管健康度指數已經跌至58%。
金士頓HyperX不可壓縮版仍舊維持在98%,可壓縮版和海盜船的Neutron GTX 240GB則堅挺在100%。
這裡其實反映了一個很現實的問題,那就是固態硬碟缺乏統一的磨損、健康狀態評判標準,每家都有自己的一套演算法,有的甚至根本不理會S.M.A.R.T屬性指標,而第三方工具也只是在估算。
那麼,此時的效能又有了什麼變化呢?
4MB持續讀取
4MB持續寫入
4KB持續讀取
4KB持續寫入
除了金士頓HyperX 4KB隨機讀取中的一些異常波動,所有硬碟都維持在了最初的水準上,即便是情況日益嚴重的840也變化非常小。
這是每一次寫入迴圈(大約190GB)完成後記錄的寫入速度。200TB節點後,840 Pro又爆發了一下,隨後迴歸往常的飄忽不定。其它的都幾乎紋絲不動,840也是如此,只有Neutron GTX又在逆天地緩慢增加了,雖然幅度極小。
不停地寫入300TB資料,相信這是絕大多數普通使用者都不會碰到的,而如此殘酷考驗下固態硬碟們都堅持了下來,雖然有些扇區出現了損壞但都能及時自我修復,且絲毫不影響效能。這確實可以讓我們對固態硬碟的長期可靠性大為放心了,尤其是TLC也沒有很多人想象的那麼糟糕。
測試還在繼續,我們等下一個節點……
固態硬碟連寫500TB:個個都是“豬堅強”
TechReport自去年八月開始的固態硬碟耐用性持久測試又跨過了一個關鍵點,持續寫入的數量已經突破500TB。有沒有誰被擊垮呢?
前景回顧:
參測成員:
- 海盜船Neutron GTX 240GB
- Intel SSD 335 240GB
- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮資料)
- 三星840 250GB
- 三星840 Pro 256GB
重分配扇區數量趨勢:
三星840是惟一一個採用TLC快閃記憶體顆粒的,其天然屬性決定了耐用性相對較差,也毫不意外地第一個出現了壞塊,100TB之後就有了11個重新分配的扇區,200TB之後增至370個,300TB之後達到了833個,如今則是1722個。
其它硬碟仍然只有寥寥幾個壞區,影響微乎其微,Neutron GTX、Hyper 3K(可壓縮版)則是唯一兩個至今完好無損的。
三星依然不肯披露840的扇區規格,但基本可以確定為1.5MB,那就是已經損失了大約2.5GB,但是因為冗餘容量足夠,這對實際可用容量仍無影響。
840雖然明顯是最糟的,但不能因此就說TLC快閃記憶體不靠譜。算一下你就知道,500TB相當於在十年的時間裡每天寫入140GB,平常誰能做到這一點?
在這樣的重壓之下,840的確有些吃力,好幾次都沒能通過重建測試中的HASH校驗。雖然最終還是過去了,但是檢視SMART屬性可以看到大量的不可恢復錯誤,實際應用中這很容易導致資料丟失,甚至系統崩潰。
但奇怪的是,三星自家工具Magician依然認為840很健康,它能訪問SMART資料但主介面上依然說健康程度良好。840 Pro終於也有了兩個重新分配扇區,沒有不可恢復的錯誤,健康度也是良好。
第三方工具的結果就差異太大了,HD Sentinel就把840、840 Pro的健康度都列為了1%,照它看來這倆硬碟都廢了。
接下來看看各塊固態硬碟的效能變化趨勢:
4MB持續讀取
4MB持續寫入
4KB隨機讀取
4KB隨機寫入
雖然有一些波動,但是總體而言,經過了這小半年的折磨,大家的效能基本都還維持了原樣,這下子大家可以徹底放心了。
不過,840 Pro的持續寫入最近開始有所下滑,從大幅領先變成了接近Neutron GTX,後續要重點觀察。
此外,Intel、金士頓的隨機讀取速度初期反常地偏高,至今原因不明,可能和它們使用的SandForce主控有關。
再看平均寫入速度:
840 Pro從一開始就飄忽不定,至今仍是這個樣子,不過似乎有衰退的趨勢,最高、最低值都不如早前了。
總的來說,大家的表現都很穩健,沒有出現重大變故,Neutron甚至還在逆天地緩慢增長中。
那些突起可以忽略,每次到達關鍵點後對所有硬碟進行安全擦除的緣故。
最後是個小插曲:測試進行到300-400TB之間的時候,三星840/840 Pro、金士頓HyperX 3K(可壓縮版)突然系統崩潰,沒有任何預先警告,當時系統也一切正常。系統日誌中出現了系統盤突然斷開的條目,可能就是罪魁禍首。
測試使用的系統盤是海盜船Force GT 60GB,壽命才兩年,資料寫入量不過幾個TB,按理說不應該有什麼問題,SMART屬性裡也沒有錯誤,不過它的主控是SandForce,鬧個脾氣也很正常。
為了避免類似問題重現,系統盤換成了Intel SSD 510,此後也確實一切順利。
測試仍在繼續,下一站:600TB。
固態硬碟連寫600TB:這都弄不死你們
TechReport發起的固態硬碟耐久性測試已經進行了整整半年的時間,資料寫入量也突破了600TB,那麼參賽選手們的最新狀況如何?
照例前景回顧:
參測成員:
- 海盜船Neutron GTX 240GB
- Intel SSD 335 240GB
- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮資料)
- 三星840 250GB
- 三星840 Pro 256GB
首先是個小八卦:你可能注意到了,500TB之後經過一個半月才有600TB的報告,明顯比以往的節奏慢。這倒不是測試硬碟們出了問題,而是TechReport的評測人員跑去泰國海邊度了兩個星期的假(恨……),所以才拖到現在。
好了迴歸正題,先來看重分配扇區的最新趨勢。
840在寫入100TB之後第一個出事兒了,開始出現壞塊並被重新分配,之後一直穩定增加,現在已經達到了2192個,遠遠超過其他硬碟,TLC NAND快閃記憶體的天然缺陷暴露無遺。
不過即便這樣也只損失了大約3GB的容量,而硬碟的冗餘容量有23GB,所以仍然不是回事兒,可用容量還是完整的。照目前這種線性增加的趨勢,要向耗盡這些冗餘容量可得不少時日。
其他硬碟都是MLC快閃記憶體的,情況好得多,壞塊在慢慢增加但基本可以忽略不計:HyperX 3K(不可壓縮資料版)的從4個增至10個,840 Pro則從2個增至28個。
Intel 335仍然是隻有1個,而海盜船的Neutron GTX堪稱逆天,至今仍無任何損失。
另一塊HyperX 3K因為寫入的是可壓縮資料,主控壓縮後的實際寫入量小得多,也安然無恙。
那麼效能呢?
4MB持續讀取
4MB持續寫入
4KB隨機讀取
4KB隨機寫入
真沒什麼好說的,不管壞塊多寡,各個硬碟的效能都始終極其穩定,除了偶爾莫名其妙的起伏之外根本沒受到任何影響。
擦除後的平均寫入速度也波瀾不驚。840開始階段明顯下滑了一些,之後就穩住了。海盜船Neutron GTX又一次逆天,竟然還在緩慢增長!
600TB是個什麼概念?即便是每天寫入300GB,足夠你用五年半。這就是說,就算是840這樣看似不靠譜的TLC固態硬碟,也足夠任何普通使用者折騰的,這種連續寫入的測試也不知道什麼時候才能弄死它。
TechReport最後表示,如果未來一段時間沒有太明顯的變化,700TB、800TB、900TB階段可能就不出來單獨報告了,直接等1PB(1000TB)。
固態硬碟連續寫入1000TB:終於弄死三個!
TechReport的固態硬碟連續寫入耐久性試驗仍在繼續。將近四個月前,他們公佈了600TB節點的情況,所有固態硬碟依然工作正常、效能穩定,只是三星840在以穩定的頻率損耗TLC快閃記憶體單元,部分MLC快閃記憶體的也出現了壞塊。
對於這些頑強的傢伙,測試人員表示有些“厭倦”了,不打算每100TB公佈一次報告,而是直接等1PB,也就是1000TB。
現在,這一里程碑終於達成了,想看熱鬧的絕對不要走開喲。
還是再次回顧一下參測的固態硬碟吧:
- 海盜船Neutron GTX 240GB
- Intel SSD 335 240GB
- 金士頓HyperX 3K 240GB(兩塊,分別寫入可壓縮、不可壓縮資料)
- 三星840 250GB
- 三星840 Pro 256GB
前景回顧:
迄今為止,已經有三塊最終倒下了,佔總量的一半,而且死去的方式各不相同。
【第一個犧牲品:金士頓HyperX 3K】
這一款其實有兩塊,分別測試可壓縮、不可壓縮資料。你應該能想到,失敗的是不可壓縮那塊。
它最後的寫入量是728TB,而可壓縮那塊只寫入了501TB。
第一次出現警告資訊是700TB的時候,忽視它繼續,725TB時再次報錯,而這次來自系統:“Windows檢測到一個硬碟錯誤。立即備份你的資料,以免資訊丟失。”
不管它接著繼續,又出現了幾次警告,只過了3TB就不行了,Anvil開始報錯。硬碟還能訪問,但是在匯出最後一批SMART資料之後就變磚了。
事實上,真正指示壽命的並非快閃記憶體顆粒完整性,而是損耗指數(MWI),大部分第一方和第三方工具都以它為基準,指示固態硬碟的剩餘壽命。
該指數在出廠時為100,一經使用就開始逐漸降低,最終為0的時候耗盡壽命(理論上仍然可以繼續使用一段時間),而它和重新分配的扇區數量是完全無關的。
檢視可知,700TB的時候降到了10,728TB時變為零。
再來看看錯誤趨勢:
其實過了上一次的門檻600TB,各種錯誤就開始迅速增加了,到最後有986個重分配扇區(600TB時僅有10個)、111個程式設計錯誤、381個擦除錯誤。這意味著,失效的扇區裡有一半是因為ECC錯誤校驗失敗。
HyperX 3K設定了一定比例的冗餘容量,但用途是內部管理功能和RAISE(SandForce的冗餘技術),能用來重新分配的很少,因此很快就會耗盡。
金士頓表示,壽命到期後硬碟就會拒絕載入,自然就檢測不到了。
【第二個犧牲品:Intel SSD 335】
寫入量同樣達到700TB的時候,SMART資訊就發出了失敗警告,但是使用起來仍然一切正常,快閃記憶體單元也幾乎都是完整的,只有一個重分配扇區,還是寫入300TB時候出現的。
於是繼續寫入,但僅僅又過了50TB,也就是到達750TB,最終就崩潰了。負責持續寫入的Anvil Storage Utilities工具裡出現了寫入錯誤,程式本身也失去了響應。幸運的是,再次啟動軟體成功了,至少能提取出日誌(稍後分析),但不能再繼續寫入了。
SSD 335寫入了700TB之後,WMI指數就已經歸零,標誌著快閃記憶體不再可靠,不能繼續使用了。
奇怪的是,寫入報錯後,SMART也不再返回任何資訊,任何工具都無法訪問,證明SMART技術已經掛掉。
重啟系統,Intel SSD Toolbox裡又出現了這塊硬碟,仍然檢測為儲存裝置,但容量是0GB,無法訪問。
Intel表示,這種結果完全符合預期,寫入錯誤意味著硬碟進入了只讀模式,並觸發一種自毀模式,讓硬碟不再響應。永別了……
【第三個犧牲品:三星840】
TLC快閃記憶體的它並不是率先倒下的,僅此一點就可以讓大家放心了。它堅持超過了900TB。
其實,剛過200TB她就出現了重分配扇區,之後不斷增加,最後有接近3500個,但因為可用的冗餘空間較多,所以堅持得比較久一些。
寫入量達到900TB的時候,840仍然看起來很正常,三星自己的SSD Magician工具也報告還有不少剩餘壽命,但是突然之間,它就掛了,Anvil崩潰,系統和工具都檢測不到,只有Intel儲存驅動報告了一個未知的三星SATA裝置,也只能看看而已。
由於沒有任何事先警告,死的又很徹底,最後一段時間的SMART資料就丟失了,無法得知最後確切寫入了多少,狀態分析也只能截止到900TB。
損耗指數在300TB的時候就變成了零,但是三星自己的工具仍然報告狀態健康,繼續使用也沒問題。
再看可使用的保留空間,一直在穩定減少,但是最後死亡的時候仍有大約40%,理論上還能堅持。由於SMART日誌丟失,無法得知死亡的確切原因,可能是突然就堅持不住了。
再看另一個重要引數:不可修復錯誤。它是在寫入300TB時候出現的,有176個,當時用來校驗資料完整性的200GB檔案確實Hash失敗了好幾次,不得不重新拷貝,但此後不可修復錯誤一直沒有增加。
在800-900TB之間的某個時刻,不可修復錯誤數量突然增加了119個,總量達到295個。雖然這時候Anvil沒有報錯,但這應該就是死亡元凶。
三星表示,840使用者最終是應該能看到錯誤提示的,比如說相容性錯誤、藍屏宕機等。至於這裡為何突然死亡,還在進一步調查。
【1PB俱樂部:三位堅強鬥士】
海盜船Neutron GTX、三星840 Pro、金士頓HyperX 3K(可壓縮資料)都挺過了1PB,真是奇蹟,因為它們標稱的終身寫入量沒一個超過200TB。
HyperX 3K因為對付的是壓縮資料,實際寫入快閃記憶體的其實只有716TB,節省了幾乎三成。
壽命指數最後只剩下了10,不過重分配扇區只有2個,沒有程式設計和擦寫錯誤(不可壓縮的有上千錯誤),快閃記憶體狀態良好。
它能堅持到何時還不好預測,估計還能使用很長一段時間,就看重分配扇區何時突增了。
三星840 Pro的壽命指數在400TB時就很低了,500TB後為零,700TB後開始大量使用冗餘容量,但最後也只用了20%。
SSD Magician顯示目前一切良好,但是不敢保證何時會突然死亡。
重分配扇區在600TB之後持續大幅增加,如今已有1836個。每扇區1.5MB,那就是2.7GB,理論上還有很多冗餘可用。
海盜船Neutron GTX仍然牛逼得一塌糊塗,壽命指數竟然至今還接近80!重分配扇區至今還是0!真是一個逆天的存在。照這樣的趨勢下去,至少能堅持到4PB。
坐等海盜船解釋……
【效能測試】
再來看看各款固態硬碟的效能趨勢,包括那些死去的。
4MB持續讀取
4MB持續寫入
4KB隨機讀取
4KB隨機寫入
大多數都始終如一。HyperX 3K最初曾有明顯的隨機讀取暴漲,但此後基本穩定。
海盜船Neutron GTX一直是最穩健的,不過最後一次持續讀取測試出現了大幅度下降,反覆測試五次都是如此。原因不明,等到1.1PB的時候再看看。
三星840最後一次隨機讀取速度有所下滑,可能和將死有關。
平均寫入速度也都波瀾不驚。840 Pro還在高低跳躍,Neutron GTX還在緩慢增加,真是無語了。
那些突起峰值不用理會,都是每100TB安全擦除後的乾淨狀態。
不妨再看看死去三款固態硬碟最後時刻的表現,很明顯都出現了波動,Intel、金士頓的還很輕微,三星840的就激烈多了,只可惜沒有死亡前的資料。
【結語:死得其所】
1PB是個里程碑。那些通過了的固態硬碟可喜可賀,沒有達成的也不用沮喪,你們同樣證明了自己的價值,並且提供了很多寶貴經驗。
直到最後時刻,失敗的固態硬碟才出現些許效能波動,這證明一款固態硬碟完全可以在整個生命週期內維持良好的效能。
不過,不同裝置最後終結的方式略有不同。Intel SSD 335預先設定好了界限,一旦越過就“自殺”,金士頓HyperX 3K則力圖壓榨出最後一絲潛力。
三星840一直是焦點,最終雖然死的很突然,很蹊蹺,但再一次證明TLC快閃記憶體也可以很耐用。雖然這是以大量重分配扇區為代價的,但對容量的影響很微小。
儘管測試的樣品不多,但完全可以拍著胸脯告訴大家:即便你在固態硬碟上每天不停地寫入,只要不是人品太差,700TB也是毫無問題的!
接下來,剩餘的三名鬥士將繼續接受考驗……
固態硬碟連寫1500TB:最神奇的莫名完蛋了!
TechReport進行的固態硬碟持續寫入試驗在不久前跨過了1.5PB的大關,換用大家更熟悉的計量單位就是1500TB。都說快閃記憶體很脆弱,但是消費級產品能夠堅持到PB級別,相信絕大多數人都沒有想到吧。
當然了,畢竟是消費級產品,畢竟不是專為超大資料量持久寫入而設計的,參與測試的六塊固態硬碟陸陸續續出現了各種問題。1PB就幹掉了其中的三塊,現在又犧牲了一個,而且是最沒想到的一個。
前景回顧:
參測固態硬碟:
- 海盜船Neutron GTX 240GB
- Intel SSD 335 240GB (已死)
- 金士頓HyperX 3K 240GB(可壓縮)
- 金士頓HyperX 3K 240GB(不可壓縮資料) (已死)
- 三星840 250GB (已死)
- 三星840 Pro 256GB
其中海盜船之前一直表現穩健,沒有任何錯誤,沒有任何效能下滑,事實上效能反而在持續緩慢上升,實在難以理解。
但同樣難以理解的,是它的突然死亡。
寫入約1.1PB之時,Neutron GTX出現了三個重分配區塊,按說不多,S.M.A.R.T.警告卻很快就出現了,說原始讀取錯誤率超過了閾值。
即便如此,仍然看似風平浪靜地堅持到了1.2PB,但檢測發現重分配區塊數量暴漲,已經超過了3400個。
然後就完蛋了。準備進入下一個階段的時候,系統無法啟動,而之前幾塊固態硬碟就是這麼死的。熱插拔也無效,能檢測到硬碟,但是訪問的時候磁碟管理器失去響應。
這根本不科學啊。固態硬碟掛掉之前,理應有一段緩衝期,尤其是應該進入一段只讀狀態,方便使用者轉移、儲存資料,但是Neutron GTX突然就徹底無法訪問了。
Neutron GTX S.M.A.R.T.屬性裡的引數還是很豐富的,但都比較奇怪。重分配扇區指標就有倆,一個從0開始,一個從256倒數,其中後者到死都沒有歸零。
剩餘壽命也在一直穩定遞減,但到最後也還有很多。
剛才說的原始讀取錯誤率最後顯示為零,但並不完全準確。1108TB之後它就已經到了最低值,也就是錯誤最初開始出現的時候。
Neutron GTX的死因仍待進一步調查,海盜船也未提供扇區尺寸、冗餘替換比例等指標。
【最後兩位勇士】
三星840 Pro、金士頓HyperX 3K(可壓縮資料)都突破了1.5PB,還都完成了另外一次不加電存留測試。1.5PB寫入後,二者都載入200GB測試檔案,然後斷電拔開,閒置一個星期,再次加電啟動,MD5 Hash測試順利通過,說明資料都完好無損。
Anvil Storage Utilities工具對720MB小檔案進行的Hash檢測同樣沒有任何錯誤。
840 Pro的出錯速度在降低,但也有了3400多個重分配扇區(跟海盜船死前的差不多),每個1.5MB那就是損失了大約5GB。
損耗均衡指數早在500TB前後的時候就徹底歸零了,到現在又寫入了1PB,但用掉的冗餘空間比例還是不到40%,仍然有很大的餘地。
三星SSD Magician工具顯示健康度仍然是良好(good),不過別忘了,840死前也是給的這個評級呢,看來很不靠譜。
HyperX 3K使用的SandForce主控支援壓縮寫入技術DuraWrite,這是第二塊堅持至今的一大功臣。
主控寫入1.5PB,而得益於壓縮,實際寫入快閃記憶體的之後大約1.07PB,也就是節省了三分之一。另一塊寫入不可壓縮資料的,因為寫入放大的存在,實際寫入一直略高於主控寫入。
如果壓縮是維持其生存的唯一原因,那麼在1.1PB左右就應該支撐不住了,不可壓縮版就是這時候掛掉的,內建的健康指數也在那時候報警了。
但是,1.5PB寫入完成後,這貨仍然只有區區12個重分配扇區!不知道是不是這塊盤的體質特別好,這種差異在半導體產品上是極為正常的,不過至少兩塊盤是同時抵達的,測試方法也完全相同。
再細挖S.M.A.R.T.資料,又發現了一些有趣的地方。
900-1000TB之間出現了2個不可恢復錯誤,恰恰就是頭兩個重分配扇區出現的時候,不知道是否巧合。無論如何,不可恢復錯誤是很致命的,它們會損壞資料、崩潰程式,甚至搞死整個系統。
程式設計與擦寫錯誤分別有2個、3個,但它們都不致命,能夠將其中的資料轉移到其他完好區塊上。效能可能會略有影響,但關係不大。
【現在效能咋樣?】
好了,來看看讀寫效能的歷史變化吧。當然到最後就倆了。
持續讀取
持續寫入
隨機讀取
隨機寫入
儘管有一些波動,但幾乎所有固態硬碟自始自終效能都很平穩。
海盜船Neutron GTX在到達1PB的時候,持續讀取出現了大幅度下滑,但在1.1PB節點恢復正常,可惜死之前又下去了。
三星840 Pro的持續寫入有些反覆,其他很穩定。
金士頓HyperX 3K雖然效能相對較低,但也表現穩健。
安全擦除後的效能,840 Pro依然頻繁跳躍,HyperX 3K還是穩定但週期性來個峰值。
Neutron GTX之前一直在緩慢爬升,不可思議,不過到最後,很突然地,它就完蛋了。
再放大看最後一段。發現沒?其他固態硬碟失效之前都出現了微弱的下滑,唯有海盜船,升著升著,就走了。
【下一個目標:2PB!】
雖然只剩下了兩位,但是TechReport表示試驗仍將繼續進行下去,而獲得的那麼多寶貴經驗是以前從來沒有過的。
最關鍵的是,現代消費級固態硬碟的可靠性遠遠超出了一般想象,應付典型的日常使用實在是綽綽有餘。全部六個試驗品都毫無問題地寫入了幾百TB資料,後期雖然有各種各樣的小毛病,但繼續使用仍然影響不大。
另一方面,固態硬碟在到達預期壽命之後,問題和失效現象各有不同。大多數都能預先給出警告,甚至包括海盜船Neutron GTX,但也有說死就死的,因此在使用了很久之後,備份很重要。
840 Pro作為三星的旗艦產品,表現著實不俗(當年誇
它完美還真不虧),而且至今看起來很健康,還能繼續堅持下去。
金士頓HyperX 3K雖然憑藉資料壓縮堅持至今,但也出現了一些致命錯誤,下一步很可能會倒下。
因此,840 Pro已經成了事實上的贏家。
截至目前,這兩塊盤都已經寫入了1.6PB,而不把它們弄死,這個試驗就不會結束!
2PB見……如果你們能堅持到的話……
固態硬碟連寫2000TB:這倆貨還不死!
2013年8月份,TechReport發起了一項固態硬碟耐久性試驗,找來六塊盤進行持續的資料寫入,看看它們能堅持多久。結果是驚人的,這些消費級產品標稱的壽命都不是很長,但最終都大大超出了理論值。
上一次檢查截止到1500TB寫入資料,三星840 250GB、Intel SSD 335 240GB、金士頓HyperX 3K 240GB(不可壓縮)、海盜船Neutron GTX 240GB先後光榮地倒下了(具體過程參見此前的文章),只剩下了金士頓HyperX 3K 240GB(可壓縮)、三星840 Pro 256GB。
近日,2000TB(2PB)節點也達成了,後邊這兩個竟然還在頑強地堅持著,都沒什麼問題,第五次不斷電資料完整性測試也順利通過。
前景回顧:
【三星840 Pro:近乎完美的表現】
不愧是三星的招牌產品,本次測試中基本找不到什麼毛病,不可恢復錯誤至今為零,只有一些重分配扇區,寫入600TB的時候開始出現,此後一直緩慢增長,如今已有5591個。
這相當於大約8GB的容量,看起來不少,但只佔256GB總容量的3%。
SMART屬性顯示,目前已經消耗了61%的冗餘容量。
損耗均衡指數在500TB左右的時候就歸零了,再次證明這個引數並不等於壽命。
三星的監控軟體裡仍然將健康狀態標註為“良好”,不過別忘了,三星840在掛掉之前也一直是良好狀態,所以並不足為信。
從目前的情況看,840 Pro堅持到3PB基本不會有啥問題。
【金士頓HyperX 3K:主控演算法立大功】
金士頓本次貢獻了兩塊盤,分別寫入可壓縮、不可壓縮資料。SandForce主控支援DuraWrite技術,可以對資料進行壓縮再寫入,減輕快閃記憶體負擔,並加速效能,堅持至今的就是可壓縮版本。
不過它寫入的也不是純粹的可壓縮資料,還有46%是不可壓縮的連續資料。其他盤都是100%不可壓縮資料。
快閃記憶體實際寫入了1.4PB多點,節省了將近600TB,不過這顯然不是它一直活著的唯一原因,SMART引數裡還有祕密。
標稱壽命也早就到期了,但重分配扇區都極少,至今僅僅31個,也就是相當於124MB。比上次檢查時的12個多了一些,但依然太少了!
不可恢復錯誤還是最早出現的那2個,沒再增加,多出來的都是程式設計或者擦寫錯誤,它們都是可以恢復的,不會導致資料丟失。
繼續下去,這塊盤似乎遠未到終點,但是死亡隨時可能突然降臨。另一塊金士頓的盤在最後128TB寫入中,重分配扇區就從10個突然猛增到了1000個,然後就掛了。
【這時候的效能咋樣?840 Pro有些“跳”】
所有盤都在測試開始前記錄了原始效能,然後每隔100TB重新測試一次,觀察變化趨勢。
持續讀取
持續寫入
隨機讀取
隨機寫入
840 Pro的持續寫入效能在1.2PB之後開始有了一些上下波動,但在接近2PB時似乎又穩定下來了。
HyperX 3K的隨機