SSD(固態硬盤)的壽命問題是用戶使用全閃陣列時關注的焦點。如何能夠讓用戶放心使用全閃陣列,保障在5年內存儲系統不會因為SSD壽命耗盡而出現問題,是全閃陣列廠商面臨的挑戰。浪潮存儲通過優化智能全閃G2-F的軟件棧,實現了SSD介質的磨損均衡,使得智能全閃G2-F可以在長達5-10年的全生命周期內,給閃存介質上的數據提供安全保障。
HDD和SSD可靠性上存在天然差異
HDD(硬盤驅動器)是通過機械旋轉加磁介質記錄數據的,而SSD則通過硅晶半導體記錄數據。二者記錄數據方式的差異決定了兩種類型的盤在存取速度和可靠性方面具有本質差異。
HDD由磁頭和盤片組成,數據存放在盤片上的某個位置,當對數據進行讀寫,需要將磁頭移動到磁道上,盤片轉動到指定的位置。所以HDD是一個機械設備,只要加電,磁盤就處于高速旋轉工作狀態。磁介質本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數據量,而取決于磁盤的上電時間。不過,磁盤的壽命跟工作環境有很大的關系,比如震動對磁盤的壽命影響就非常大。
兩種存儲介質
而NAND的存儲單元為三端器件,與場效應管有相同的名稱:源極、漏極和柵極。如下圖所示,浮柵極是用來保存電荷的的,浮柵極與硅襯底之間是隧道氧化層,與控制柵極間也有一層絕緣層,上下兩層絕緣層保護浮柵極中的電荷不會泄漏。采用這種結構,使得存儲單元具有了電荷保持能力,通過讓絕緣浮置柵極捕獲不同數量的電子以實現bit值定義。就像是裝進瓶子里的水,當你倒入水后,水位就一直保持在那里,直到你再次倒入或倒出,所以閃存具有記憶能力。
NAND Flash原理示意圖
而對浮柵極的充放電,是利用量子隧道效應實現的。當我們要對FLASH進行寫入操作的時候,在控制柵極上加高電壓,源極和漏極接地,使電子穿越隧道氧化層到達浮柵極,并聚集在浮柵上保持,形成電壓,用來存儲信息。進行擦除時仍利用隧道效應,把電壓反過來加,從而消除浮柵上的電子,達到清除信息的結果。
由于在寫入和擦除的操作過程中,電子反復來回穿越隧道氧化層會損壞隧道氧化層,當絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導致存儲單元物理損壞。這就是NAND Flash會有寫入次數限制的原因。
由于在寫入和擦除的操作過程中,電子反復來回穿越隧道氧化層會損壞隧道氧化層,當絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導致存儲單元物理損壞。這就是NAND Flash會有寫入次數限制的原因。
HDD的實現原理和Flash完全不一樣,HDD由磁頭和盤片組成,數據存放在盤片上的某個位置,當對數據進行讀寫,需要將磁頭移動到磁道上,盤片轉動到指定的位置。所以HDD是一個機械設備,只要加電,磁盤就處于高速旋轉工作狀態。磁介質本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數據量,而取決于磁盤的上電時間。不過,磁盤的壽命跟工作環境有很大的關系,比如震動對磁盤的壽命影響就非常大。
通過對比SSD和HDD的工作原理,你會發現二者的故障模式有非常大的差異。傳統的磁盤軟壽命限制,因此需要對SSD的壽命管理進行精細設計,以此實現全閃存儲介質的生命周期管理。
浪潮智能全閃:六招實現SSD介質全生命周期管理
下面讓我們來看看浪潮智能全閃G2-F都有哪些大招,來實現SSD全生命周期精細管理以應對SSD的壽命挑戰。
招數1:T10 DIF杜絕靜默數據損壞
出了問題,首先要檢測到,防止靜默數據損壞。未被檢測到的靜默數據損壞會導致業務系統的嚴重后果。
T10 DIF(Data Integrity Field,數據完整性域)是用戶數據的一種端到端的保護機制,寫入數據的時候在數據塊末尾加入PI(Protection Information,保護信息)字段,存放數據的校驗信息。當存儲端接收到帶有PI的數據之后,會將PI信息保存起來,這樣在讀取的時候會重新計算,使得掉電,硬重啟,卷重啟,鏈路丟失等都不會導致PI數據的丟失。浪潮智能全閃G2-F全系列通過支持T10 DIF檢測,杜絕了靜默數據損壞。
招數2:SSD壽命預測提供事先警告
既然SSD壽命有限,SSD什么時候臨近壽命終點、什么時候需要更換,就成為用戶和存儲系統管理員最關心的事情。全閃存儲系統需要在SSD臨近壽命極限時對用戶進行預警,給用戶預留更換乃至采購替代品的時間。同時,如果用戶的業務模型、業務流量和初始設計時發生了巨大變化,存儲系統也需要給出預警信息,讓用戶采取措施調整業務模型或者數據布局,將大流量的數據寫入業務遷移到其他存儲上。這些必要的功能在浪潮智能全閃G2-F系列產品上進行了全面配備,其中包括:
監測壽命衰減速度:浪潮智能全閃G2-F定時檢查SSD使用壽命百分比,壽命衰減速度過快時會上報并告警,提醒用戶SSD盤異常,建議更換或者改變業務模型。
實時監測使用壽命:當SSD盤使用壽命達到97%,系統會建議用戶更換SSD盤;達到99%,會警告用戶及時更換SSD盤
智能剩余生命周期預測:浪潮智能全閃G2-F會根據用戶業務歷史流量及模型,對SSD可使用時間進行預測,并根據用戶業務模型的變化,實時調整預測周期。當預測到SSD剩余壽命大概為6個月時,會產生告警,提醒用戶關注SSD壽命。
招數3:RAID壽命預測與自動化功能凸顯神通
當RAID成員盤的壽命臨近極限時,系統會發出告警,使用CLI命令或GUI界面,檢查每個成員盤的“更換日期”字段,來確定需要更換的成員盤。如果RAID個別成員盤臨近壽命極限,只需更換個別成員盤,利用RAID冗余數據重建,更換盤后,RAID自動重建該成員盤。
當RAID多個成員盤臨近壽命時,系統自動更換RAID Group。浪潮智能全閃G2-F可以利用數據遷移功能自動將該RAID中的數據在線遷移出來,方法是直接刪除該RAID——數據遷移功能會先將該RAID上的數據遷移到存儲池的其他RAID上,然后再刪除。如果存儲池其他RAID上沒有足夠的空間,刪除會失敗,需要先向存儲池添加新RAID后再刪除。
-
閃存
+關注
關注
16文章
1782瀏覽量
114895 -
SSD
+關注
關注
21文章
2857瀏覽量
117370 -
HDD
+關注
關注
0文章
143瀏覽量
27420
原文標題:破解全閃存存儲介質壽命難題的六大招數
文章出處:【微信號:Anxin-360ic,微信公眾號:芯師爺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論