服務器數(shù)據(jù)恢復環(huán)境:
EMC存儲,多塊stat硬盤組建raid5磁盤陣列,兩塊熱備盤,上層采用zfs文件系統(tǒng)。
服務器故障&檢測&分析:
EMC存儲中的raid5磁盤陣列有2塊硬盤出現(xiàn)故障,但是只有一塊熱備盤被激活,raid5磁盤陣列崩潰,存儲不可用。
服務器數(shù)據(jù)恢復工程師前往現(xiàn)場對故障存儲設備進行檢測。經(jīng)過簡單排查后確認raid5陣列癱瘓,上層lun無法使用,2塊熱備盤只有一塊啟動。
硬件工程師對掉線硬盤進行物理故障檢測,均未檢測到壞道,磁頭也不存在物理故障。在進行數(shù)據(jù)恢復之前不需要進行物理修復。
服務器數(shù)據(jù)恢復過程:
1、在恢復數(shù)據(jù)之前將故障存儲設備上的所有數(shù)據(jù)以只讀方式鏡像備份。
2、服務器數(shù)據(jù)恢復工程師基于鏡像備份文件分析故障raid5中的每塊硬盤底層數(shù)據(jù),發(fā)現(xiàn)兩塊熱備盤內沒有任何數(shù)據(jù),也就是說被激活的那塊熱備盤也沒有同步到任何數(shù)據(jù),故障raid5磁盤陣列中的兩塊熱備盤在磁盤離線后沒有起到任何作用。想要恢復數(shù)據(jù)需要通過分析獲取到該raid5磁盤陣列的相關信息來重組raid5。
3、服務器數(shù)據(jù)恢復工程師使用北亞企安自主研發(fā)的服務器數(shù)據(jù)恢復工具解析出該組raid5磁盤陣列的基礎信息,根據(jù)這些信息虛擬重組raid5磁盤陣列。
*將有多塊硬盤掉線的磁盤陣列中最早掉線的那塊硬盤從陣列中剔除,比對每塊硬盤在同一個條帶上的數(shù)據(jù)是否一致,將同一個條帶上數(shù)據(jù)明顯不同的硬盤剔除后進行條帶校驗,直至找到數(shù)據(jù)恢復的最佳狀態(tài)為止。
4、重組raid5陣列后,服務器數(shù)據(jù)恢復工程師分析lun信息,然后使用自主開發(fā)的程序解析和導出lun數(shù)據(jù)的map。
5、使用北亞企安自主開發(fā)的程序解析和恢復上層的文件系統(tǒng)。該故障存儲設備上層采用的是zfs文件系統(tǒng),服務器數(shù)據(jù)恢復工程師解析文件系統(tǒng)時發(fā)現(xiàn)部分文件系統(tǒng)元文件報錯,數(shù)據(jù)恢復工程師對自主開發(fā)的程序進行debug調試,讓程序適應本案例數(shù)據(jù)恢復的需求。
6、經(jīng)過調試發(fā)現(xiàn),導致zfs文件系統(tǒng)解析報錯的原因是由于存儲設備的突然癱瘓導致zfs文件系統(tǒng)中某些元文件被破壞,導致無法正常解析。服務器數(shù)據(jù)恢復工程師對損壞的元文件進行手工修復,保障zfs文件系統(tǒng)可以正常解析。
7、zfs文件系統(tǒng)解析完成后,服務器數(shù)據(jù)恢復工程師將故障raid5陣列內的數(shù)據(jù)完整導出,由用戶方工程師搭建數(shù)據(jù)驗證環(huán)境,對恢復出來的數(shù)據(jù)進行驗證。經(jīng)過反復驗證,用戶原服務器內的所有數(shù)據(jù)均完全恢復。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9142瀏覽量
85383 -
數(shù)據(jù)恢復
+關注
關注
10文章
570瀏覽量
17443 -
RAID5
+關注
關注
0文章
113瀏覽量
12722
發(fā)布評論請先 登錄
相關推薦
評論