服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌ProLiant DL系列服務(wù)器,
6塊SAS硬盤組成RAID5磁盤陣列,
WINDOWS SERVER操作系統(tǒng),
存儲了企業(yè)的內(nèi)部文件。
服務(wù)器故障&分析:
服務(wù)器在發(fā)生故障前有過幾次意外斷電,每次斷電重啟后沒有出現(xiàn)異常。直到最后一次斷電重啟沒有成功,RAID報(bào)錯,提示無法找到存儲設(shè)備。進(jìn)入RAID管理模塊,執(zhí)行任何操作就死機(jī)。管理員多次重啟服務(wù)器后還是無法成功進(jìn)入操作系統(tǒng)。
通常服務(wù)器出現(xiàn)這類故障,有很大的可能性是因?yàn)橐馔鈹嚯妼?dǎo)致RAID模塊損壞(RAID管理信息丟失或RAID模塊硬件損壞)。RAID陣列創(chuàng)建完成后,管理模塊信息就會固定下來不會再發(fā)生變化。但是raid陣列的模塊信息畢竟不是只讀的,也是可以修改的,而意外斷電就可能導(dǎo)致模塊信息被篡改或者丟失,多次斷電甚至可能導(dǎo)致RAID卡元器件損壞,服務(wù)器失去對多塊物理硬盤進(jìn)行RAID管理的中間層模塊。根據(jù)本案例服務(wù)器的故障表現(xiàn),北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷故障原因就是RAID卡硬件損壞,如果是這種情況,通過常規(guī)方法無法獲取6塊磁盤中的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、經(jīng)過物理故障檢測發(fā)現(xiàn)故障服務(wù)器內(nèi)的所有硬盤均可以正常讀取,無物理故障。
2、編號后將故障服務(wù)器內(nèi)的所有硬盤以只讀方式進(jìn)行鏡像備份,鏡像完成后將所有硬盤按照編號還原到故障服務(wù)器中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對原始數(shù)據(jù)造成二次破壞。
3、基于鏡像文件,北亞企安數(shù)據(jù)恢復(fù)工程師分析故障服務(wù)器中raid5磁盤陣列結(jié)構(gòu),確定raid陣列的硬盤順序、數(shù)據(jù)塊大小、陣列校驗(yàn)方式等raid相關(guān)信息。
4、利用獲取到的raid陣列信息虛擬重構(gòu)raid陣列并進(jìn)行邏輯校驗(yàn),確保重構(gòu)RAID各項(xiàng)參數(shù)正確無誤后驗(yàn)證重要數(shù)據(jù)。
5、經(jīng)過數(shù)據(jù)恢復(fù)工程師驗(yàn)證后沒有發(fā)現(xiàn)異常,讓管理員親自驗(yàn)證無問題后將數(shù)據(jù)遷移到提前準(zhǔn)備好的環(huán)境中,本次數(shù)據(jù)恢復(fù)工作完成。
服務(wù)器數(shù)據(jù)安全Tips:
1、盡量保證機(jī)房供電穩(wěn)定,重要設(shè)備配備UPS,以減少供電異常影響服務(wù)器及存儲的正常工作。
2、應(yīng)定期對老舊設(shè)備進(jìn)行安全檢查,評估老舊設(shè)備的運(yùn)行狀態(tài),評估是否需要對老舊設(shè)備進(jìn)行硬件升級或者系統(tǒng)升級。
3、提前制定突發(fā)事件應(yīng)急處理方案,以降低異常斷電帶來的損失。
審核編輯黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9123瀏覽量
85328 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
568瀏覽量
17432
發(fā)布評論請先 登錄
相關(guān)推薦
評論