RAID技術,RAID技術原理詳細解說
RAID技術,RAID技術原理詳細解說
RAID入門基礎及RAID0技術詳解
隨著計算機應用的日益普及,人們對計算速度和性能的要求也逐漸提高。在一個完整的計算機系統中,CPU和內存的作用固然重要,但是數據存儲設備性能的好壞和速度的快慢也直接影響到整個系統的表現。本文所要講解的RAID技術起初主要應用于服務器高端市場,但是隨著個人用戶市場的成熟和發展,正不斷向低端市場靠攏,從而為用戶提供了一種既可以提升硬盤速度,又能夠確保數據安全性的良好的解決方案。本文將對RAID技術進行較為詳細的介紹,希望能夠對廣大讀者有所幫助。
入門基礎
RAID是英文Redundant Array of Inexpensive Disks的縮寫,中文簡稱為磁盤陣列。其實,從RAID的英文原意中,我們已經能夠多少知道RAID就是一種由多塊廉價磁盤構成的冗余陣列。雖然RAID包含多塊磁盤,但是在操作系統下是作為一個獨立的大型媧⑸璞賦現。RAID技術分為幾種不同的等級,分別可以提供不同的速度,安全性和性價比。
人們在開發RAID時主要是基于以下設想,即幾塊小容量硬盤的價格總和要低于一塊大容量的硬盤。雖然目前這一設想還沒有成為現實,RAID在節省成本方面的作用還不是很明顯,但是RAID可以充分發揮出多塊硬盤的優勢,實現遠遠超出任何一塊單獨硬盤的速度和吞吐量。除了性能上的提高之外,RAID還可以提供良好的容錯能力,在任何一塊硬盤出現問題的情況下都可以繼續工作,不會受到損壞硬盤的影響。
RAID 0
我們在前文中已經提到RAID分為幾種不同的等級,其中,RAID 0是最簡單的一種形式。RAID 0可以把多塊硬盤連接在一起形成一個容量更大的存儲設備。最簡單的RAID 0技術只是提供更多的磁盤空間,不過我們也可以通過設置,使用RAID 0來提高磁盤的性能和吞吐量。RAID 0沒有冗余或錯誤修復能力,但是實現成本是最低的。
RAID 0最簡單的實現方式就是把幾塊硬盤串聯在一起創建一個大的卷集。磁盤之間的連接既可以使用硬件的形式通過智能磁盤控制器實現,也可以使用操作系統中的磁盤驅動程序以軟件的方式實現。圖示如下:
在上述配置中,我們把4塊磁盤組合在一起形成一個獨立的邏輯驅動器,容量相當于任何任何一塊單獨硬盤的4倍。如圖中彩色區域所示,數據被依次寫入到各磁盤中。當一塊磁盤的空間用盡時,數據就會被自動寫入到下一塊磁盤中。
這種設置方式只有一個好處,那就是可以增加磁盤的容量。至于速度,則與其中任何一塊磁盤的速度相同,這是因為同一時間內只能對一塊磁盤進行I/O操作。如果其中的任何一塊磁盤出現故障,整個系統將會受到破壞,無法繼續使用。從這種意義上說,使用純RAID 0方式的可靠性僅相當于單獨使用一塊硬盤的1/4(因為本例中RAID 0使用了4塊硬盤)。
雖然我們無法改變RAID 0的可靠性問題,但是我們可以通過改變配置方式,提供系統的性能。與前文所述的順序寫入數據不同,我們可以通過創建帶區集,在同一時間內向多塊磁盤寫入數據。具體如圖所示:
上圖中,系統向邏輯設備發出的I/O指令被轉化為4項操作,其中的每一項操作都對應于一塊硬盤。我們從圖中可以清楚的看到通過建立帶區集,原先順序寫入的數據被分散到所有的四塊硬盤中同時進行讀寫。四塊硬盤的并行操作使同一時間內磁盤讀寫的速度提升了4倍。
在創建帶區集時,合理的選擇帶區的大小非常重要。如果帶區過大,可能一塊磁盤上的帶區空間就可以滿足大部分的I/O操作,使數據的讀寫仍然只局限在少數的一、兩塊硬盤上,不能充分的發揮出并行操作的優勢。另一方面,如果帶區過小,任何I/O指令都可能引發大量的讀寫操作,占用過多的控制器總線帶寬。因此,在創建帶區集時,我們應當根據實際應用的需要,慎重的選擇帶區的大小。
我們已經知道,帶區集可以把數據均勻的分配到所有的磁盤上進行讀寫。如果我們把所有的硬盤都連接到一個控制器上的話,可能會帶來潛在的危害。這是因為當我們頻繁進行讀寫操作時,很容易使控制器或總線的負荷超載。為了避免出現上述問題,建議用戶可以使用多個磁盤控制器。示意圖如下:
這樣,我們就可以把原先控制器總線上的數據流量降低一半。當然,最好解決方法還是為每一塊硬盤都配備一個專門的磁盤控制器。
RAID 1技術詳解
雖然RAID 0可以提供更多的空間和更好的性能,但是整個系統是非常不可靠的,如果出現故障,無法進行任何補救。所以,RAID 0一般只是在那些對數據安全性要求不高的情況下才被人們使用。
RAID 1和RAID 0截然不同,其技術重點全部放在如何能夠在不影響性能的情況下最大限度的保證系統的可靠性和可修復性上。RAID 1是所有RAID等級中實現成本最高的一種,盡管如此,人們還是選擇RAID 1來保存那些關鍵性的重要數據。
RAID 1又被稱為磁盤鏡像,每一個磁盤都具有一個對應的鏡像盤。對任何一個磁盤的數據寫入都會被復制鏡像盤中;系統可以從一組鏡像盤中的任何一個磁盤讀取數據。顯然,磁盤鏡像肯定會提高系統成本。因為我們所能使用的空間只是所有磁盤容量總和的一半。下圖顯示的是由4塊硬盤組成的磁盤鏡像,其中可以作為存儲空間使用的僅為兩塊硬盤(畫斜線的為鏡像部分)。
RAID 1下,任何一塊硬盤的故障都不會影響到系統的正常運行,而且只要能夠保證任何一對鏡像盤中至少有一塊磁盤可以使用,RAID 1甚至可以在一半數量的硬盤出現問題時不間斷的工作。當一塊硬盤失效時,系統會忽略該硬盤,轉而使用剩余的鏡像盤讀寫數據。
通常,我們把出現硬盤故障的RAID系統稱為在降級模式下運行。雖然這時保存的數據仍然可以繼續使用,但是RAID系統將不再可靠。如果剩余的鏡像盤也出現問題,那么整個系統就會崩潰。因此,我們應當及時的更換損壞的硬盤,避免出現新的問題。 更換新盤之后,原有好盤中的數據必須被復制到新盤中。這一操作被稱為同步鏡像。同步鏡像一般都需要很長時間,尤其是當損害的硬盤的容量很大時更是如此。在同步鏡像的進行過程中,外界對數據的訪問不會受到影響,但是由于復制數據需要占用一部分的帶寬,所以可能會使整個系統的性能有所下降。
因為RAID 1主要是通過二次讀寫實現磁盤鏡像,所以磁盤控制器的負載也相當大,尤其是在需要頻繁寫入數據的環境中。為了避免出現性能瓶頸,使用多個磁盤控制器就顯得很有必要。下圖示意了使用兩個控制器的磁盤鏡像。
使用兩個磁盤控制器不僅可以改善性能,還可以進一步的提高數據的安全性和可用性。我們已經知道,RAID 1最多允許一半數量的硬盤出現故障,所以按照我們上圖中的設置方式(原盤和鏡像盤分別連接不同的磁盤控制),即使一個磁盤控制器出現問題,系統仍然可以使用另外一個磁盤控制器繼續工作。這樣,就可以把一些由于意外操作所帶來的損害降低到最低程度。
RAID 0+1
單獨使用RAID 1也會出現類似單獨使用RAID 0那樣的問題,即在同一時間內只能向一塊磁盤寫入數據,不能充分利用所有的資源。為了解決這一問題,我們可以在磁盤鏡像中建立帶區集。因為這種配置方式綜合了帶區集和鏡像的優勢,所以被稱為RAID 0+1。
RAID3和RAID5技術詳解
熱插拔
一些面向高端應用的磁盤鏡像系統都可以提供磁盤的熱插拔功能。所謂熱插拔功能,就是允許用戶在不關閉系統,不切斷電源的情況下取出和更換損害的硬盤。如果沒有熱插拔功能,即使磁盤損壞不會造成數據的丟失,用戶仍然需要暫時關閉系統,以便能夠對硬盤進行更換。現在,使用熱插拔技術只要簡單的打開連接開關或者轉動手柄就可以直接取出硬盤,而系統仍然可以不間斷的正常運行。
校驗
RAID 3和RAID 5都分別使用了校驗的概念提供容錯能力。簡單的說,我們可以把校驗想象為一種二進制的校驗和,一個可以告訴你其它所有字位是否正確的特殊位。 在數據通信領域,奇偶校驗被用來確定數據是否被正確傳送。例如,對于每一個字節,我們可以簡單計算數字位1的個數,并在字節內加入附加校驗位。在數據的接收方,如果數字位1的個數為奇數,而我們使用的又是奇數校驗的話,則說明該字節是正確的。同樣對偶數校驗也是如此。然而,如果數字位1的個數和校驗位的奇偶性不一致的話,則說明數據在傳送過程中出現了錯誤。
RAID系統也采用了相似的校驗方法,可以在磁盤系統中創建校驗塊,校驗塊中的每一位都用來對其它關聯塊中的所有對應位進行校驗。
在數據通訊領域,雖然校驗位可以告訴我們某個字節是否正確,但是無法告訴我們到底是哪一位出現了問題。這就是說我們可以檢測錯誤,但是不能改正錯誤。對于RAID,這是遠遠不夠的。固然錯誤的檢測非常重要,但是如果不能對錯誤進行修復,我們就無法提高整個系統的可靠性。
舉個例子來說,假設我們發現校驗塊中第10個字節的第5位不正確。如果這個校驗塊包含的是另外8個數據塊的校驗信息,那么哪一個數據塊才是問題的罪魁禍首呢?也許你可能會想為每一個數據塊都建立一個校驗塊就可以解決問題。但是這種方法很難實現。事實上,RAID主要是借助磁盤控制器的錯誤報告檢測錯誤位置,并進行修復。如果磁盤控制器在讀取數據時沒有發出任何“抱怨”,那么系統將會視該數據為正確數據,繼續使用。
RAID 3
RAID 3采用的是一種較為簡單的校驗實現方式,使用一個專門的磁盤存放所有的校驗數據,而在剩余的磁盤中創建帶區集分散數據的讀寫操作。例如,在一個由4塊硬盤構成的RAID 3系統中,3塊硬盤將被用來保存數據,第四塊硬盤則專門用于校驗。這種配置方式可以用3+1的形式表示,具體如圖:
在上圖中,我們用相同的顏色表示使用同一個校驗塊的所有數據塊,斜線標出的部分為校驗塊。校驗塊和所有對應的數據塊一起構成一個帶區。
第四塊硬盤中的每一個校驗塊所包含的都是其它3塊硬盤中對應數據塊的校驗信息。RAID 3的成功之處就在于不僅可以象RAID 1那樣提供容錯功能,而且整體開銷從RAID 1的50%下降為25%(RAID 3+1)。隨著所使用磁盤數量的增多,成本開銷會越來越小。舉例來說,如果我們使用7塊硬盤,那么總開銷就會將到12.5%(1/7)。
在不同情況下,RAID 3讀寫操作的復雜程度不同。最簡單的情況就是從一個完好的RAID 3系統中讀取數據。這時,只需要在數據存儲盤中找到相應的數據塊進行讀取操作即可,不會增加任何額外的系統開銷。
當向RAID 3寫入數據時,情況會變得復雜一些。即使我們只是向一個磁盤寫入一個數據塊,也必須計算與該數據塊同處一個帶區的所有數據塊的校驗值,并將新值重新寫入到校驗塊中。例如,當我們向上圖中的綠色數據塊寫入數據時,必須重新計算所有3個綠色數據塊的校驗值,然后重寫位于第四塊硬盤的綠色校驗塊。由此我們可以看出,一個寫入操作事實上包含了數據讀?。ㄗx取帶區中的關聯數據塊),校驗值計算,數據塊寫入和校驗塊寫入四個過程。系統開銷大大增加。
我們可以通過適當設置帶區的大小使RAID系統得到簡化。如果某個寫入操作的長度恰好等于一個完整帶區的大?。ㄈ珟^寫入),那么我們就不必再讀取帶區中的關聯數據塊計算校驗值。我們只需要計算整個帶區的校驗值,然后直接把數據和校驗信息寫入數據盤和校驗盤即可。
到目前為止,我們所探討的都是正常運行狀況下的數據讀寫。下面,我們再來看一下當硬盤出現故障時,RAID系統在降級模式下的運行情況。
RAID 3雖然具有容錯能力,但是系統會受到影響。當一塊磁盤失效時,該磁盤上的所有數據塊必須使用校驗信息重新建立。如果我們是從好盤中讀取數據塊,不會有任何變化。但是如果我們所要讀取的數據塊正好位于已經損壞的磁盤,則必須同時讀取同一帶區中的所有其它數據塊,并根據校驗值重建丟失的數據。
當我們更換了損壞的磁盤之后,系統必須一個數據塊一個數據塊的重建壞盤中的數據。整個過程包括讀取帶區,計算丟失的數據塊和向新盤寫入新的數據塊,都是在后臺自動進行。重建活動最好是在RAID系統空閑的時候進行,否則整個系統的性能會受到嚴重的影響。
RAID 3的性能問題
除了我們在上文討論過的有關數據寫入和降級模式的問題之外,在使用RAID 3的過程中還有其他一些性能上的問題需要引起我們的注意。RAID 3所存在的最大一個不足同時也是導致RAID 3很少被人們采用的原因就是校驗盤很容易成為整個系統的瓶頸。 我們已經知道RAID 3會把數據的寫入操作分散到多個磁盤上進行,然而不管是向哪一個數據盤寫入數據,都需要同時重寫校驗盤中的相關信息。因此,對于那些經常需要執行大量寫入操作的應用來說,校驗盤的負載將會很大,無法滿足程序的運行速度,從而導致整個RAID系統性能的下降。鑒于這種原因,RAID 3更加適合應用于那些寫入操作較少,讀取操作較多的應用環境,例如數據庫和WEB服務器等。
RAID 5
RAID?3所存在的校驗盤的性能問題使幾乎所有的RAID系統都轉向了RAID 5。在運行機制上,RAID 5和RAID 3完全相同,也是由同一帶區內的幾個數據塊共享一個校驗塊。
RAID 5和RAID 3的最大區別在于RAID 5不是把所有的校驗塊集中保存在一個專門的校驗盤中,而是分散到所有的數據盤中。RAID 5使用了一種特殊的算法,可以計算出任何一個帶區校驗塊的存放位置。具體如圖所示:
注意圖中的校驗塊已經被分散保存在不同的磁盤中,這樣就可以確保任何對校驗塊進行的讀寫操作都會在所有的RAID磁盤中進行均衡,從而消除了產生瓶頸的可能。
非常好我支持^.^
(70) 67.3%
不好我反對
(34) 32.7%
相關閱讀:
- [電子說] raid卡的概念,raid技術有什么用 2023-09-28
- [電子說] Disruptor高性能隊列的原理 2023-07-26
- [電子說] R5300 G4服務器無法正常進入操作系統且日志顯示硬盤異常分析 2023-03-27
- [電子說] RAID是什么?RAID技術實現有幾種形式 2023-02-02
- [存儲技術] RAID技術的起源/優點/應用 2021-02-18
- [電子說] Windows Server實現RAID技術,保證數據的讀取速度和安全 2019-12-06
- [存儲技術] 如何用RAID技術保證磁盤的可靠性 2019-09-13
- [存儲技術] 論傳統RAID技術的存在的幾大問題 2019-02-01
( 發表人:admin )