服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
5臺(tái)服務(wù)器節(jié)點(diǎn),每臺(tái)服務(wù)器節(jié)點(diǎn)配置一組RAID5,每組6塊硬盤,其中1塊設(shè)置為熱備盤。
系統(tǒng)環(huán)境為Lustre分布式文件系統(tǒng),5臺(tái)服務(wù)器共同存儲(chǔ)全部的數(shù)據(jù)文件。
服務(wù)器故障&檢測:
機(jī)房漏水導(dǎo)致服務(wù)器進(jìn)水,服務(wù)器中的部分硬盤損壞。每組服務(wù)器有2塊及以上的盤掉線。由于短時(shí)間同時(shí)掉線2塊及以上硬盤導(dǎo)致RAID5崩潰,服務(wù)器,數(shù)據(jù)無法正常讀取。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、為避免對原盤數(shù)據(jù)造成二次破壞,使用工具對故障服務(wù)器中所有正常硬盤進(jìn)行鏡像備份。后續(xù)操作全部基于鏡像完成。
2、通過更換磁頭、修復(fù)固件等方式修復(fù)無法讀取的故障硬盤,并鏡像故障硬盤中的數(shù)據(jù)。
3、北亞數(shù)據(jù)恢復(fù)工程師通過分析磁盤中數(shù)據(jù)規(guī)律獲取到RAID校驗(yàn)形式、條帶大小、盤序等RAID相關(guān)信息,并根據(jù)這些RAID信息虛擬重組出所有RAID整列。
4、解析Lustre分布式文件系統(tǒng)。
Lustre分布式系統(tǒng)由元數(shù)據(jù)卷(MDS)和數(shù)據(jù)卷(OST)組成,重組RAID后就可以看到MDS分區(qū)和OST分區(qū)。Lustre文件系統(tǒng)中所有文件的文件名、文件路徑等屬性信息存放在MDS分區(qū),而文件對應(yīng)的數(shù)據(jù)內(nèi)容全部存放在OST分區(qū)中。
MDS分區(qū)是一個(gè)EXT3文件系統(tǒng),除了節(jié)點(diǎn)類型為文件的解析方式有所變化外,其余所有解析方式和Ext3一樣。
從MDS中獲取到整個(gè)Lustre中所有文件的目錄結(jié)構(gòu),文件名稱,文件編號(hào),所屬OST號(hào)等屬性信息。
根據(jù)從MDS中獲取到的目錄結(jié)構(gòu),文件名稱,文件編號(hào),所屬OST號(hào)等屬性信息,北亞數(shù)據(jù)恢復(fù)工程師整理重構(gòu)出文件的原始路徑,并定位到索引的OST卷及相關(guān)數(shù)據(jù)區(qū)域,獲取相關(guān)數(shù)據(jù)文件。
5、通過萬兆網(wǎng)絡(luò)將恢復(fù)出的所有數(shù)據(jù)拷貝到用戶準(zhǔn)備好的設(shè)備環(huán)境中。
服務(wù)器數(shù)據(jù)恢復(fù)結(jié)果:
用戶親自檢查恢復(fù)出來的數(shù)據(jù),確認(rèn)數(shù)據(jù)文件基本全部恢復(fù)出來,隨機(jī)抽取部分文件進(jìn)行校驗(yàn),文件正確無誤,目錄結(jié)構(gòu)完好。本次數(shù)據(jù)恢復(fù)完成。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9142瀏覽量
85384 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
570瀏覽量
17443
發(fā)布評論請先 登錄
相關(guān)推薦
評論