服務器數據恢復環境&故障:
5臺節點服務器,每臺節點服務器上有一組RAID5陣列。每組RAID5陣列上有6塊硬盤(其中1塊硬盤設置為熱備盤,其他5塊硬盤為數據盤)。上層系統環境為Lustre分布式文件系統。
機房天花板漏水導致這5臺節點服務器進水,每臺服務器都有至少2塊硬盤出現故障。每臺服務器中的RAID5陣列短時間內同時掉線2塊或以上數量的硬盤,導致RAID崩潰,服務器中數據無法正常讀取。
服務器數據恢復過程:
1、將所有服務器中的硬盤做好標記后取出,硬件工程師對所有硬盤進行硬件故障檢測。通過更換磁頭、修復固件等方式,對存在故障且無法讀取的硬盤進行修復。修復完成后以只讀方式鏡像故障硬盤。沒有出現故障的硬盤也以只讀方式進行全盤鏡像。所有硬盤鏡像完成后,按照原樣將所有硬盤還原到服務器中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析所有磁盤底層數據,獲取RAID校驗形式、條帶大小、盤序等重組RAID的相關信息,利用這些RAID信息虛擬重組所有RAID。
3、解析Lustre分布式文件系統。
Lustre分布式系統由元數據卷(MDS)和數據卷(OST)組成,重組RAID后就可以得到MDS分區和OST分區。Lustre文件系統中所有文件的文件名、文件路徑等屬性信息存放在MDS分區;文件對應的數據內容全部存放在OST分區。
MDS分區是一個EXT3文件系統,除了節點類型為文件的解析方式不同之外,其余所有解析方式和Ext3一樣。
從MDS分區中獲取到整個Lustre中所有文件的目錄結構,文件名稱,文件編號,所屬OST號等屬性信息。
北亞企安數據恢復—Lustre數據恢復
4、根據從MDS分區中獲取到的目錄結構、文件名稱、文件編號、所屬OST號等屬性信息,北亞企安數據恢復工程師整理重構出文件的原始路徑,并定位到索引的OST卷及相關數據區域,獲取相關數據文件。直至恢復出所有數據。
5、隨機抽取部分文件校驗,所有抽檢的文件正確無誤。對恢復數據的數據量進行校驗也沒有發現問題。用戶方確認數據完整恢復,目錄結構完好。北亞數據恢復工程師協助用戶方工程師將恢復出來的數據遷移到用戶方準備好的設備環境中。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9143瀏覽量
85387 -
數據恢復
+關注
關注
10文章
570瀏覽量
17444
發布評論請先 登錄
相關推薦
評論