服務器數據恢復環境:
HP EVA存儲,6塊SAS硬盤組建的raid5磁盤陣列。上層操作系統是WINDOWS SERVER。該存儲為公司內部文件服務器使用。
服務器故障&分析:
在遭遇兩次意外斷電后,設備重啟時raid提示“無法找到存儲設備”。管理員嘗試進入raid管理模塊時死機,多次重啟嘗試后故障依舊。
這是一個典型的由于意外斷電導致raid硬件模塊損壞或者riad管理信息丟失等raid故障的情況。正常情況下,raid一旦創建完成,raid管理模塊中的信息不會輕易更改,但是raid管理模塊的信息是可修改的信息。一次或多次的意外斷電是有可能導致raid管理模塊中的信息被篡改或丟失,斷電次數過多時甚至可能直接導致raid卡上的元器件損壞。該案例中的故障就是屬于這種情況。
服務器數據恢復過程:
1、首先由硬件工程師檢測故障存儲中的所有硬盤的物理故障,所有硬盤讀取正常,沒有發現存在明顯的物理故障。
2、將故障存儲中所有磁盤以只讀方式進行全盤鏡像備份,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
3、北亞企安數據恢復工程師基于鏡像文件分析底層數據,確定故障存儲中6塊磁盤的數據塊大小、條帶信息、盤序、校驗方式等RAID信息,根據這些信息虛擬重建raid陣列。
4、邏輯校驗重構RAID中的數據,在確認重構RAID各參數正確無誤后,對所需要恢復的數據進行完全驗證。
5、在數據恢復工程師驗證沒有發現問題后,交由用戶方親自驗證。經過反復驗證,用戶方工程師確認恢復的數據完整可用,達到預期。
6、將數據遷移至用戶方準備好的存儲環境中,再次驗證沒有發現問題。
服務器數據安全Tips:
1、盡量保證機房供電穩定,減少供電異常對服務器和存儲的影響。
2、為重要的服務器及存儲配備UPS,在意外斷電的情況下能讓核心業務繼續運行一段時間,為應急方案的實施贏得時間。
3、定期對服務時間長的服務器和存儲進行安全狀況檢查,對這些老舊設備的整體運行狀態進行評估,及時更換硬件和升級軟件,將可能的隱患提前排除。
4、制定突發數據災難的緊急處理方案,降低業務損失。
審核編輯黃宇
-
服務器
+關注
關注
12文章
9123瀏覽量
85329 -
RAID
+關注
關注
0文章
277瀏覽量
35085 -
數據恢復
+關注
關注
10文章
568瀏覽量
17432
發布評論請先 登錄
相關推薦
評論