服務器數據恢復環境:
一臺EMC存儲中數塊磁盤組建了一組raid5磁盤陣列,陣列中有2塊熱備盤;上層采用ZFS文件系統,劃分了一個lun,供sun小機使用。
服務器故障&檢測:
存儲在正常運行中突然崩潰無法使用,管理員檢查后發現raid5陣列中有兩塊磁盤離線,陣列中有兩塊熱備盤,其中的一塊熱備盤激活失敗,raid5陣列癱瘓,存儲不可用。
硬件工程師對raid5陣列中的兩塊離線的磁盤進行物理故障檢測,發現這2塊離線硬盤不存在物理故障和壞道。
服務器數據恢復過程:
1、將故障存儲中所有磁盤編號取出以只讀方式做全盤鏡像。鏡像完成后將所有磁盤按照編號還原到原存儲設備中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、鏡像完成后將鏡像數據的520字節扇區轉換為512字節扇區,方便后續的數據恢復操作。
3、根據RAID5磁盤陣列的工作模式,LUN都是基于RAID的?;謴蛿祿托枰确治鯮AID的底層信息,根據這些信息重構原始RAID陣列。數據恢復工程師基于鏡像對所有磁盤底層數據進行分析,發現陣列中2塊磁盤離線,1塊熱備盤成功激活,另1塊熱備盤卻沒有成功激活,數據未同步。
繼續分析數據在硬盤中分布的規律、RAID條帶的大小、每塊磁盤的順序等RAID相關信息。
4、繼續分析RAID信息,發現有一塊硬盤在同一個條帶上的數據和其他硬盤明顯不一樣,初步判斷此硬盤最先掉線。數據恢復工程師使用北亞自研RAID校驗程序對這個條帶進行校驗后,確定最先掉線的硬盤。
5、通過分析出來的RAID信息虛擬重構RAID。通過重構出來的RAID分析lun的分配情況和數據塊&導出lun所有數據。
6、對導出的lun做ZFS文件系統解析,但解析時報錯。數據恢復工程師手動檢查文件,發現部分元文件損壞。
7、北亞企安數據恢復工程師將這些損壞的文件系統元文件進行修復。通過對損壞的元文件進行分析發現ZFS正在進行IO操作時存儲癱瘓,部分文件系統元文件沒有更新或者損壞。對這些損壞的元文件進行人工修復后,ZFS文件系統就能夠正常解析。
8、對修復好的ZFS文件系統做解析,解析所有文件節點及目錄結構&導出,本次數據恢復工作完成。
審核編輯黃宇
-
服務器
+關注
關注
12文章
9123瀏覽量
85328 -
RAID
+關注
關注
0文章
277瀏覽量
35084 -
數據恢復
+關注
關注
10文章
568瀏覽量
17432 -
磁盤
+關注
關注
1文章
375瀏覽量
25201 -
emc
+關注
關注
170文章
3914瀏覽量
183123
發布評論請先 登錄
相關推薦
評論