服務器數據恢復環境:
一臺infortrend存儲,有一組由12塊硬盤組建的RAID6,RAID6的所有空間劃分給一個LUN并映射到WINDOWS系統上,WINDOWS系統上劃分了一個GPT分區。
服務器故障&分析:
存儲無法訪問,經過檢查發現存儲中有3個磁盤離線。工作人員通過一系列操作讓存儲掉線磁盤上線并開始rebuild,但是這個時候發現分區打不開,所有數據無法訪問。為避免情況進一步惡化,工作人員中止了rebuild并關機。
經過當地的數據恢復機構進行恢復后,還是有大量數據丟失和無法打開。
RAID6可以支持兩塊硬盤同時掉線,但如果有第三塊磁盤離線,RAID6便無法正常工作了。最常見的一種情況是RAID6離線硬盤不是同時離線,而是每間隔一段時間就有一塊磁盤離線。在這種情況下,如果將早掉線的盤上線,便會與還在線的盤進行RAID6算法同步,導致數據出現問題,無法正常讀取數據。
本案例應該就是屬于這種情況。因為rebuild時間較短,本案例存儲中的文件數量非常多,文件系統前部分存放老舊數據的可能性比較大大,一些較新的文件的目錄及節點索引很大可能性存放于文件系統后部分,所以推測同步操作對存儲中的數據影響不大,破壞程度有限。
服務器數據恢復過程:
1、將故障存儲中所有磁盤編號后取出(應在關機狀態下插拔硬盤,對硬盤原位置進行標注。在硬盤離開存儲后,不要再對存儲加電。確保所有操作盡可能可回溯。),以只讀方式做扇區級別的鏡像備份。對于部分存在物理故障的硬盤,交由硬件工程師處理后利用專業工具進行鏡像。備份完成后將所有硬盤按照編號還原到原存儲中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析該infortrend存儲所使用的的RAID6算法,按算法對12塊硬盤做C(12,2)共66種可能的缺2盤的情況組合,找出可能性最大的缺盤組合。
3、通過北亞R企安自研的RAID數據恢復程序重構虛擬RAID,按分析出的缺盤狀態、盤序、塊大小、校驗方向、RAID6算法構建進行附加。
4、對虛擬RAID進行GPT分區結構解釋,然后對文件系統進行解釋,確定算法是否正確。如不正確,調整算法,直到得到最佳結構。
5、按文件或扇區方式遷移數據到準備好的存儲中,由用戶方對恢復出來的數據進行檢測。經過反復檢測,用戶方工程師確認恢復出來的數據完整有效。本次服務器數據恢復工作完成。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9123瀏覽量
85328 -
WINDOWS
+關注
關注
3文章
3541瀏覽量
88626 -
數據恢復
+關注
關注
10文章
568瀏覽量
17432
發布評論請先 登錄
相關推薦
評論