服務器數(shù)據(jù)恢復環(huán)境:
某品牌ProLiant DL380系列服務器,服務器中有一組由6塊SAS硬盤組建的RAID5陣列,WINDOWS SERVER操作系統(tǒng),作為企業(yè)內(nèi)部文件服務器使用。
服務器故障:
機房供電幾次意外中斷,服務器出現(xiàn)故障前最后一次異常斷電重啟后RAID報錯,提示無法找到存儲設備,進入RAID管理模塊做任何操作都死機,重啟服務器后問題依舊,用戶聯(lián)系北亞企安數(shù)據(jù)恢復中心尋求幫助。
服務器意外斷電導致RAID故障(包括RAID管理信息丟失和RAID硬件損壞)的情況并不少見。RAID創(chuàng)建完成后,RAID管理模塊信息一般不會再發(fā)生改變,但RAID管理模塊信息是可修改的信息,磁盤陣列意外斷電也經(jīng)常會導致RAID管理信息被篡改或者丟失。多次斷電甚至有可能導致RAID卡元器件損壞,從而導致服務器失去對多塊物理硬盤進行RAID管理的中間層模塊。本案例中的故障表現(xiàn)如在RAID模塊的任何操作都導致死機的現(xiàn)象就極有可能是RAID卡硬件損壞引起的(后經(jīng)服務器廠家售后人員驗證確實如此),如果是這種情況,通過常規(guī)方法已無法獲取RAID5陣列中6塊硬盤的數(shù)據(jù),只能通過專業(yè)的數(shù)據(jù)恢復技術手段來恢復服務器的數(shù)據(jù)。
服務器數(shù)據(jù)恢復過程:
1、將故障服務器中所有磁盤編號后取出,由硬件工程師對6塊SAS硬盤進行物理故障檢測,檢測結果是這6塊硬盤讀取狀態(tài)良好,無明顯的物理故障。
2、以只讀方式將所有磁盤進行扇區(qū)級全盤鏡像,鏡像完成后按照編號將所有磁盤還原到故障服務器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
3、基于鏡像文件對原RAID5陣列的結構進行分析,獲取盤序、數(shù)據(jù)塊大小、校驗方式等重組raid5陣列所需要的信息,根據(jù)獲取到的信息重組RAID5陣列。
4、重組完成后對所RAID5陣列中的數(shù)據(jù)進行邏輯校驗,在確保重組RAID所使用的參數(shù)正確無誤后,針對用戶所需要恢復的重要數(shù)據(jù)進行驗證。
5、經(jīng)過驗證,用戶確認恢復出來的數(shù)據(jù)完整有效,認可數(shù)據(jù)恢復結果。協(xié)助用戶方將所有數(shù)據(jù)遷移至用戶準備好的生產(chǎn)環(huán)境中。本次數(shù)據(jù)恢復工作完成。
服務器數(shù)據(jù)安全Tips:
1、盡最大可能保證機房供電穩(wěn)定,減少供電異常對服務器及存儲造成的破壞。
2、為重要的服務器及存儲配備UPS,在意外斷電的情況下能保證核心業(yè)務能繼續(xù)維持一段時間的運行,為應急方案實施贏得時間。
3、定期對服務時間長的服務器進行安全狀況檢查,并對整體運行狀態(tài)進行評估以決定是否進行硬件及系統(tǒng)的升級。
4、提前制定突發(fā)數(shù)據(jù)災難的應急處理方案,降低數(shù)據(jù)災難造成的損失。
審核編輯 黃宇
-
硬盤
+關注
關注
3文章
1308瀏覽量
57283 -
服務器
+關注
關注
12文章
9123瀏覽量
85329 -
RAID
+關注
關注
0文章
277瀏覽量
35085 -
數(shù)據(jù)恢復
+關注
關注
10文章
568瀏覽量
17432
發(fā)布評論請先 登錄
相關推薦
評論