VSAN數(shù)據(jù)恢復環(huán)境:
4個節(jié)點服務器組建vsan集群。每個節(jié)點服務器上有2組分別由6塊硬盤組建的raid陣列,上層是虛擬機文件。
VSAN故障情況:
vsan集群某一個節(jié)點服務器上的一組raid陣列中的一塊硬盤離線,安全機制啟動,開始進行數(shù)據(jù)的重構及遷移。在數(shù)據(jù)遷移過程中機房斷電導致數(shù)據(jù)遷移重構失敗。服務器重啟之后另一組磁盤陣列中有2塊硬盤出現(xiàn)故障離線,導致整個vsan分布式存儲不可用,上層所有虛擬機無法訪問。
VSAN數(shù)據(jù)恢復過程:
1、將VSAN集群上所有節(jié)點上的硬盤編號后取出,經過硬件工程師檢測沒有發(fā)現(xiàn)有硬盤存在硬件故障。以只讀方式將所有硬盤進行扇區(qū)級的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原服務器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析底層數(shù)據(jù),分析服務器上層虛擬機所在磁盤位置的分布情況。使用北亞企安自主研發(fā)的針對vsan架構下虛擬化數(shù)據(jù)恢復工具對分析獲取到的數(shù)據(jù)分布信息進行準確性驗證。
單獨對每個節(jié)點服務器上的兩個raid陣列進行分析,搞清楚每個raid陣列中硬盤的對應關系。每塊硬盤都有一個標識進行磁盤間的對應,根據(jù)硬盤的ID信息判讀raid陣列中的硬盤ID信息。
3、在每塊硬盤上獲取磁盤的UUID和raid陣列的UUID。
4、根據(jù)每個raid陣列中的容量盤的組件信息獲取此容量盤的組件信息。
5、根據(jù)組件信息中記錄的組件的MAP位置提取組件位圖。
6、根據(jù)組件的位圖提取組件數(shù)據(jù)和緩存數(shù)據(jù)。
7、根據(jù)組件的描述信息獲取組件所屬對象及組件順序,并把組件合并成對象。
8、根據(jù)對象,提取數(shù)據(jù)。
9、服務器數(shù)據(jù)恢復工程師對恢復出來的數(shù)據(jù)進行驗證,沒有發(fā)現(xiàn)異常。由用戶方親自驗證所有恢復出來的數(shù)據(jù),經過仔細驗證,確認恢復數(shù)據(jù)完整有效。本次數(shù)據(jù)恢復工作完成。
審核編輯:湯梓紅
-
硬盤
+關注
關注
3文章
1308瀏覽量
57282 -
服務器
+關注
關注
12文章
9123瀏覽量
85328 -
數(shù)據(jù)恢復
+關注
關注
10文章
568瀏覽量
17432
發(fā)布評論請先 登錄
相關推薦
評論