分層存儲是一種存儲方法,它涉及將數據存儲在具有不同特性(例如性能、成本和容量)的一系列不同存儲介質上。
不同的存儲介質按層次結構進行組織,其中性能最高的存儲介質被認為是Tier 0或Tier 1,其次是Tier 2,Tier 3,依此類推。
Tier 0或Tier 1通常由閃存或基于3D XPoint的固態硬盤組成,而連續的分層存儲級別可能涉及高性能光纖通道或SAS驅動器(或包含它們的RAID陣列),性能較低的SATA驅動器、光盤、磁帶存儲系統以及基于云計算的近線或脫機存儲系統。
在SSD硬盤和云存儲變得司空見慣之前,使用磁盤和磁帶提供Tier 1層、Tier 2層和Tier 3層存儲的三層存儲模型可能是最受歡迎的層存儲模型。
但現在使用包含五個或更多分層存儲級別的分層存儲模型并不罕見。每一個都有微妙的差別,以產生三個關鍵存儲屬性的不同組合:成本、性能、容量。
分層存儲的目標
如果不考慮費用,企業將使用SSD硬盤滿足其所有存儲需求,因為它們提供了非常高的性能和可靠性。
但是在現實世界中,存儲成本非常重要,因為IT部門尋求在其預算內和組織中作為一個整體來尋求最小化成本和最大化效率。不幸的是,與機械硬盤相比,SSD硬盤存儲成本昂貴,并且比磁帶存儲昂貴得多。
這意味著需要謹慎使用SSD硬盤,并且僅用于存儲需要非常高性能的系統使用的數據。不太重要的數據可以存儲在成本較低、性能較低的系統(如機械硬盤)上,而很少訪問的數據或僅出于合規性目的保留的數據可以降級存儲到成本非常低的離線存儲系統。
因此,分層存儲不是由IT部門出于運營原因的需求驅動的,而是純粹出于財務原因。然后,分層存儲系統的目標是通過使用成本最低的存儲選項(提供所需的最低性能)將存儲成本降至最低。
分層存儲是如何工作的?
只有兩個存儲層的分層存儲系統為存儲管理人員提供了一個非常有限的選擇,而不是一個給定的數據應該存儲在哪里。如果該數據需要一定級別的存儲性能,則將在滿足要求的性能級別的情況下將其存儲在Tier 2層中,否則將存儲在更昂貴的Tier 1層中。
具有三個存儲層的分層存儲系統可能更高效,因為如果Tier 3層提供了所需的性能級別,則可以將同一數據存儲在Tier 3層中。如果沒有,則可以將其存儲在Tier 2層中(如果可以提供)達到所需的性能水平,并且只有在Tier 2層和Tier 3層都無法提供所需的性能水平時,才需要將其存儲在最昂貴的Tier 1層存儲中。
事實上,可用的存儲層越多,數據塊就可以越有效地存儲在滿足其性能需求的適當存儲層中,而不是以不必要的高成本提供不必要的高性能的存儲層中。使用創建RAID陣列或短行程硬盤等技術,可以從一組不同的存儲介質類型中創建新的層。例如,這兩種技術都以較低的存儲效率為代價(從而最終導致較高的財務成本)創建了更高的性能存儲。
分層存儲系統面臨的最大挑戰是將數據分類為多個類別,確定最適合給定數據類別的存儲層,并隨著數據的老化定期對數據進行重新分類。
這里的關鍵點是,任何給定數據的存儲需求都可能隨著時間的推移而變化,因此,只要數據不再需要它當前發現的存儲層的性能,就必須對其進行監視并將其移動到較低(且成本更低)的存儲層,而不是將數據存儲在分層存儲系統中而忘記它。
分層存儲的典型數據類包括:
?關鍵任務數據。此類數據始終需要存儲在最高級別的分層存儲中,因為它需要支持高速應用程序,可能支持客戶交易。訪問數據的延遲將導致組織失去業務或對收益率產生負面影響。性能至關重要。
?熱門數據。此類數據需要較高級別的分層存儲,因為它在諸如客戶關系管理(CRM)、企業資源計劃(ERP)甚至電子郵件之類的應用程序中不斷使用,并且在企業的日常運營中是必需的。在這一層的分層存儲中,性能很重要,但成本也是一個考慮因素。
?暖數據。這個類包括一些較舊的數據,如超過幾天的電子郵件,或已完成交易的數據。這類數據的訪問頻率相對較低,但在需要時仍需要易于訪問。在分層存儲的這一層,最重要的考慮因素是成本,但必須遵循最低性能閾值。
?冷數據。此類數據可能永遠不會再次訪問,但需要進行歸檔和保留以符合法規或其他法律要求,或者僅僅是因為它在將來的某個未確定時間可能具有某些價值,也許用于大數據分析。冷數據非常適合分層存儲的最低層,在該層中可以接受幾分鐘或幾小時的訪問時間,而低成本是首要考慮因素。
除了規模最小的業務外,很明顯,人工進行存儲分層的方法可能會非常耗時且麻煩,無法成功。因此,大多數分層存儲系統都依賴于使用分層管理系統的自動存儲分層,該分層管理系統會在整個生命周期內監視數據,并在數據冷卻時自動將其移動到存儲層中。
該軟件可以隨同一個存儲系統一起提供并在其上運行,也可以是一個獨立的解決方案,它可以在整個組織的存儲基礎設施中正常工作,在某些情況下還可以通過云存儲網關進入云中。
分層存儲類型
Tier 1層是什么意思?
在一些使用存儲分層的組織中,已經出現了比其現有Tier 1層中使用的更快的新存儲技術。因此,該技術被用作“Tier 0層”存儲。但出于本文的目的,將假定Tier 1層表示最高性能的存儲層。
Tier 1層
此存儲層旨在存儲高度易變且對時間敏感的數據,并且需要在盡可能短的時間內可用。通常用在金融交易環境或其他業務領域中,這些業務在短短幾分之一秒之內就可以產生重大損失,而只有最快的存儲就足夠了。因此,Tier 1層存儲通常需要非??斓墓虘B存儲硬盤介質,無論其整體存儲效率如何,都應配置為具有盡可能高的性能。
Tier 2層
該存儲層用于存儲事務數據,以支持高性能應用程序,面向客戶的系統(例如零售應用程序)以及其他無法接受非常短的延遲的系統。由于所需的性能水平不如Tier 1層那么高,因此通常使用較低成本和更高存儲效率的固態硬盤存儲系統來提供Tier 2存儲解決方案。
Tier 3層
第三個存儲層用于存儲“熱”數據,例如客戶關系管理(CRM)和企業資源計劃(ERP)數據,甚至是最近的電子郵件,這些數據需要經常訪問而不會造成不必要的延遲。這意味著它需要存儲在介質(如中等到高性能硬盤驅動器)上,與固態硬盤存儲介質相比,它們的成本相對較低。在許多組織中,與Tier 2層或Tier 1層相比,Tier 3層數據要多得多,因此,每千兆字節存儲成本較低的大容量機械硬盤提供了理想的解決方案。
Tier 4層
該存儲層用于“熱”數據,例如來自最近完成的事務的數據,已使用了幾天的電子郵件以及不經常訪問的其他數據。它還可以用于存儲可用于業務信息和數據可視化系統的數據,或用于創建月度、季度或年度報告所需的財務數據。但無論何時需要,都需要相對快速地訪問。Tier 4層存儲需求可能非常大,并且由于成本是主要考慮因素,因此Tier 4層存儲的典型解決方案是大容量機構硬盤存儲。Tier 4層存儲更可能使用低成本、性能相對較低的SATA硬盤驅動器,而不是配置高性能SAS硬盤或RAID陣列。
Tier 5層
最低的存儲層通常用于存檔“冷”數據,這些數據可能永遠不會再次訪問,但仍保留一些價值(也許將來用于數據挖掘),因此值得保留。它也用于存儲必須保留用于合規性目的的數據,這些數據僅需要在幾天或幾周內即可訪問,而不是幾分鐘或幾秒鐘。
通常以該存儲層為單位使用光介質或磁帶存儲系統,該系統以非常低的每千兆字節成本提供存儲,但是性能卻非常低。在過去的幾年中,基于云計算的存儲(例如Amazon的Glacier存儲服務)已變得越來越受歡迎,這些公司希望將大量數據分流用于低成本存儲,并且有可能或在幾個小時內相對容易地對其進行檢索(如果需要的話)。
分層存儲的主要優勢
分層存儲帶來許多好處,其中最重要的是:
?降低的存儲成本:通過將每個數據類存儲在成本最低的存儲中,至少提供所需的最低性能,企業可以避免為不需要的高性能付費。存儲成本的降低是采用分層存儲系統的主要驅動因素。
?更高的存儲效率:依賴RAID或短行程的高性能硬盤存儲系統的存儲效率很低,因為可以在這些系統上存儲的數據量比所提供的總存儲容量要少(在某些情況下要少得多)。由于分層存儲系統可以減輕對RAID和短存儲的需求(通過將不需要這種高性能的數據移至較低的存儲層),因此可以提高存儲效率。
?具有重用舊存儲設備的能力:存儲分層可以為存儲系統提供新的生命力,否則將需要更換存儲系統,因為它們不再為上層數據使用提供足夠的性能。相反,它們可用于提供較低層的存儲。
責任編輯:ct
評論
查看更多