服務器數據恢復環境:
ProLiant某型號服務器;
6塊SAS硬盤組成RAID5;
WINDOWS SERVER操作系統;
存儲企業部門內部文件。
服務器故障&分析:
出現幾次意外斷電后,故障服務器再次重啟后RAID報錯,提示無法找到存儲設備,進入RAID管理模塊界面后死機,管理員重啟故障服務器后問題依舊。用戶聯系到我們數據恢復中心尋求幫助。
本案例的服務器故障屬于服務器意外斷電導致RAID模塊損壞(RAID模塊損壞故障包括RAID管理信息丟失和RAID模塊硬件損壞),這類服務器故障情況我們數據恢復中心碰到過很多。正常情況下,RAID創建完成后管理模塊的信息就不會輕易改變。但管理模塊的信息畢竟是可修改的,意外斷電這種突發情況就很容易導致管理模塊的信息被篡改甚至丟失,多次斷電甚至會對RAID模塊硬件造成物理傷害,讓服務器失去對硬盤進行RAID管理的中間層模塊。本案例中對RAID模塊的操作導致死機的故障就很可能是RAID模塊硬件損壞造成的,這種情況下無法通過常規方法讀取到故障服務器中6塊硬盤的數據,只能通過專門的數據恢復技術來恢復其中的數據。
服務器數據恢復過程:
1、硬件工程師對故障服務器中的6塊SAS硬盤進行物理故障檢測,所有硬盤均可正常讀取,沒有發現物理故障。
2、對故障服務器中的6塊硬盤做鏡像備份,后續的數據恢復操作都在鏡像文件上進行,避免對原始數據造成二次損壞。
3、基于鏡像備份文件分析故障RAID5的結構,北亞服務器數據恢復工程師結合故障服務器文件系統存儲規則獲取到故障RAID5的盤序、數據塊大小及校驗方式,通過這些raid相關信息虛擬重組原始RAID5。
4、邏輯校驗新構建RAID5中的數據,確認新構建RAID5所有參數準確無誤后,北亞數據恢復工程師對最重要的數據進行完全驗證。
5、讓用戶對恢復出來的數據進行驗證,確認數據完整可用。
6、將所有數據遷移至用戶準備好的存儲。
服務器數據安全Tips:
1、保證機房供電穩定,以減少斷電,電壓不穩等電源問題對服務器和存儲的傷害。
2、為關鍵服務器及存儲配備UPS,這樣在機房意外斷電的情況下至少能保證核心業務能繼續正常工作,為找到應急解決方案贏得寶貴的時間。
3、對服務器和存儲設備定期進行檢查,對運行狀態進行評估以決定是否需要升級硬件或者系統。提前制定好突發數據災難的應急處理方案,以降低數據災難帶來的損失。
審核編輯 黃昊宇
-
RAID
+關注
關注
0文章
277瀏覽量
35084 -
數據恢復
+關注
關注
10文章
568瀏覽量
17432 -
ProLiant
+關注
關注
0文章
2瀏覽量
5514
發布評論請先 登錄
相關推薦
評論