服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)服務(wù)器中有一組由24塊FC硬盤組建的raid5磁盤陣列,linux操作系統(tǒng)+ext3文件系統(tǒng),服務(wù)器上層部署有oracle數(shù)據(jù)庫(kù)。
服務(wù)器故障&檢測(cè):
raid5陣列中有兩塊硬盤出現(xiàn)故障掉線,導(dǎo)致服務(wù)器上層卷無(wú)法掛載,oracle數(shù)據(jù)庫(kù)無(wú)法正常使用。
通過(guò)管理后臺(tái)查看服務(wù)器中硬盤的狀態(tài),顯示有兩塊硬盤處于離線狀態(tài)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障服務(wù)器中所有硬盤編號(hào)后取出,硬件工程師檢測(cè)后發(fā)現(xiàn)2塊離線硬盤存在物理故障,硬件工程師對(duì)存在物理故障的2塊磁盤進(jìn)行處理后進(jìn)行扇區(qū)級(jí)的全盤鏡像。針對(duì)沒(méi)有物理故障的磁盤以只讀方式進(jìn)行扇區(qū)級(jí)的全盤鏡像。鏡像完成后將所有磁盤按照編號(hào)還原到故障服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、鏡像過(guò)程中,在服務(wù)器管理后臺(tái)以及硬盤SMART狀態(tài)檢測(cè)中均沒(méi)有發(fā)現(xiàn)問(wèn)題的另外3塊盤也存在大量不規(guī)律的壞道分布。通過(guò)壞道列表定位到目標(biāo)鏡像文件,發(fā)現(xiàn)ext3文件系統(tǒng)的部分關(guān)鍵源數(shù)據(jù)信息被壞道破壞,只能通過(guò)同一條帶進(jìn)行xor以及根據(jù)文件系統(tǒng)上下文關(guān)系手動(dòng)修復(fù)損壞的文件系統(tǒng)。
3、北亞企安數(shù)據(jù)恢復(fù)工程師對(duì)服務(wù)器的文件系統(tǒng)和日志進(jìn)行逆向分析,獲取到服務(wù)器raid5陣列的盤序信息、raid塊大小、校驗(yàn)方式等重組raid的必要信息。利用上述信息虛擬重組raid后,進(jìn)一步分析服務(wù)器文件系統(tǒng)信息&提取oracle數(shù)據(jù)庫(kù)dmp文件。
4、在恢復(fù)數(shù)據(jù)庫(kù)時(shí)出現(xiàn)imp-008報(bào)錯(cuò)。對(duì)oracle數(shù)據(jù)庫(kù)進(jìn)行排查后,發(fā)現(xiàn)從虛擬raid陣列中提取出的dmp文件存在異常,從而導(dǎo)致導(dǎo)入dmp文件時(shí)報(bào)錯(cuò)。
5、重新分析raid陣列結(jié)構(gòu)和文件系統(tǒng)結(jié)構(gòu)并提取數(shù)據(jù),提取出dmp文件及dbf原始庫(kù)文件,導(dǎo)入dmp文件進(jìn)行檢驗(yàn),重復(fù)上面步驟直到檢驗(yàn)正常。
6、將dmp文件移交給用戶方驗(yàn)證,經(jīng)過(guò)驗(yàn)證,用戶方確認(rèn)dmp文件沒(méi)有問(wèn)題。
7、將恢復(fù)出來(lái)的數(shù)據(jù)導(dǎo)入搭建好的環(huán)境中由用戶方進(jìn)行驗(yàn)證,經(jīng)過(guò)驗(yàn)證,用戶方確認(rèn)恢復(fù)數(shù)據(jù)完整有效。本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9123瀏覽量
85328 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
568瀏覽量
17432 -
RAID5
+關(guān)注
關(guān)注
0文章
113瀏覽量
12720
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論