全球的數據量正持續以每年約23%的速度增長——各行各業產生的數據量越來越多,因此長期保存這些數據變得愈發困難。另一方面,在中國“3060 ”雙碳目標的指導下,企業級數據中心的數據存儲不僅需要高性能、大容量和更低的總體擁有成本,還要向著綠色、低能耗的可持續方向不斷發展。
一個有效的解決方案就是冷存儲。通過更深入地了解組織的數據需求,我們發現企業采用冷存儲可以確保隨時訪問有價值的數據,同時減少數據存儲的總體擁有成本和能耗。
冷存儲的興起
冷存儲,可以理解為針對不常訪問數據的存儲。在該類場景中,數據被歸檔或保存在“冷存儲”中,將很少被使用,但在需要時又得做到可以隨時訪問,因此不必優先考慮IO性能。這與需要進行數據處理的高性能 “熱存儲”相反,而且也不同于可能永不訪問,或允許花費數小時或數天訪問的“凍存儲”。
隨著技術創新和數字化轉型的加速推進,越來越多的此類數據將持續產生,即使當下不用,也具備一定價值,不應被即刻丟棄。譬如在智慧視頻和安全相關行業,同一段視頻不能記錄第二次,一旦意外丟失,決不會以完全相同的方式再次呈現,而且你永遠不知道什么時候需要回看視頻,因此數據永久保留很有必要。在汽車行業,自動駕駛測試將產生大量數據,且不會重復同樣的測試,因此,企業可保留數據以便在自動駕駛算法革新的過程中持續加以利用。對于播放職業球賽的電視臺來說,永遠有可能要重播球員的比賽視頻,所以視頻內容也要全部保留下來。
其實,在各行業的各種具體場景下,用戶都有隨時訪問舊數據的可能。一些企業盡管當下不需要訪問數據,但也可能已經預知何時會需要。比如機器學習的場景下,創建龐大的訓練數據極為耗時,一旦積累了數據集,盡管可能很少被訪問,卻擁有一定價值。因此,企業需要保留這些數據用于機器訓練,以節省再次創建龐大數據集的時間,也可將其出售用于其他訓練項目。
可見,越來越多的企業需要探索冷存儲方法。而需要長期保留這些數據的企業面臨著一個關鍵問題,到底是將數據存放在昂貴、更快速的存儲基礎架構中實時取用,還是存放在性價比更高的冷存儲層中,在以后需要時再重新訪問?
冷存儲便是針對該場景的解決方案,它允許以更低的成本存儲數據,與需要實時多次訪問的“熱數據”(如金融交易)相比,這些數據被訪問頻率更低?;谶@一優點,企業可以更輕松地選擇理想的數據存儲解決方案,而不是陷入以更高成本擴展存儲資源還是刪除一些潛在重要數據的兩難境地。
正因如此,冷存儲方興未艾,并將持續加速發展。行業分析師認為,當前至少60%的數據可以歸入存檔類數據,到2025年,這一比例可能達到80%或更多。因此,冷存儲正成為存儲行業增長最快的細分領域之一。云服務提供商也紛紛迎合這一發展趨勢,采用可訪問的存檔重新設計其存儲架構,并確保對冷存儲中的數據進行高效管理,降低總體擁有成本和能耗。
企業該如何進行冷存儲?
廣義程度上,冷存儲屬于一種用例,企業需要探索特定的技術和解決方案來將這個用例變為現實,其中需要注意的重點包括:
首先,將冷數據視為主數據對待。冷數據必須在線存儲,并且易于搜索和訪問。企業不僅要能夠存儲數據,還需要在這些數據集持續增長的情況下解決實時、高效訪問數據的挑戰。例如,電視臺如果需要重播幾年前舉行的一場體育賽事,它得具備一套基礎設施保證可以精確找到這些數據。因此,舊數據仍然需要被當成主數據來對待,尤其是在可訪問性方面。
不將存檔數據視為主數據是一種失策,而這也涉及到另一個重要考量——數據保護。
即使這些數據被存放在二級存儲上,仍然需要像主數據一樣受到保護。無論是確保數據在站點發生災害時不會丟失,還是免受人為威脅等,只有像主數據一樣進行數據保護,冷存儲中的數據才能安全無虞。
另一個重要注意點就是成本。盡管冷存儲為長期保存數據提供了一種更具成本效益的解決方案,但要實現其最佳功效還需考慮多種因素。
業內人士可能經常認為云存儲將是最具成本效益的冷存儲庫。然而,對于某些企業的特定場景下,事實可能并非如此,而且如果持續向云端增加更多數據,成本也會隨之提升。雖然云技術在彈性和保護方面具有獨到的優勢,但它并非所有場景下企業的最優選擇。
另一方面,有些企業認為磁帶技術是成本更低的存儲技術,所以必須部署磁帶來滿足所有冷存儲需求,然而許多情況下這其實時難以實現的。企業必須分析整體擁有成本,深入研究采用技術的服務等級協議,因為對某些公司來說,簡單地投資構建多個存儲層可能并無法節省那么多成本,而且會增加不必要的復雜性。簡言之,并沒有“放之四海而皆準”的解決方案。
立足HDD創新,應對綠色數字未來
隨著人工智能、機器學習、自動駕駛、智慧視頻、物聯網以及智慧城市等新興應用的不斷演變,數據生成來源比以往任何時候都更多,冷存儲領域也正不斷發展,并凸顯出其重要性。市場正大量投資云存儲、基于HDD的解決方案和磁帶技術創新,以滿足未來企業數字化轉型和冷存儲的需求。
如今,大多數二級冷數據都保存在磁帶或HDD上,而熱數據則存儲在SSD中。HDD正在向下一代磁盤技術和平臺演進,旨在降低擁有成本和能耗,并提高主動存檔解決方案的可訪問性。HDD技術的最新進展包括新的分區存儲技術、更高的面密度、機械創新、智能數據存儲以及材料創新等等。
西部數據一直處于HDD技術創新的前沿,不斷提高存儲容量和性能并降低客戶的總體擁有成本和能耗,幫助客戶應對龐大和多樣化的數據存儲需求。2021年,西部數據突破傳統存儲界限,推出了整合HDD與閃存優勢的OptiNAND ?技術,帶來了全新的閃存增強型磁盤架構設計。2022年,西部數據推出了基于OptiNAND技術的22TB Ultrastar ? DC HC570 CMR HDD,在成熟的單碟2.2TB的氦氣封裝技術上實現了10碟更高的面密度;開發出了創新的UltraSMR技術并發布26TB Ultrastar DC HC670 UltraSMR HDD,通過引入數據塊編碼和先進的糾錯算法,增加了每英寸磁道數(TPI),與22TB的CMR HDD相比帶來了約18%的容量提升。西部數據通過HDD產品和技術的迭代更新,為云服務提供商、企業級客戶和下一代數據中心帶來了更低的TCO與能耗。
<西部數據22TB Ultrastar DC HC570 HDD (左) 和
西部數據26TB Ultrastar DC HC670 UltraSMR HDD (右) >
除了不斷進行產品創新,西部數據還評估并強化了應對氣候變化影響的措施,致力于實現更可持續的未來。這一點在第四次工業革命不斷演進,自動化替代傳統人工操作的進程中尤為重要。去年11月,西部數據的上海工廠成功入選世界經濟論壇全球燈塔工廠網絡,并憑借在可持續發展領域的突破性成果,被授予中國首家“可持續發展燈塔工廠”榮譽稱號。
作為全球數據基礎架構提供者,西部數據擁有全面且豐富的HDD和閃存解決方案,助力企業和數據中心實現高效和可持續的數據存儲。
審核編輯:湯梓紅
-
機器學習
+關注
關注
66文章
8406瀏覽量
132567 -
西部數據
+關注
關注
5文章
528瀏覽量
46143 -
冷存儲
+關注
關注
0文章
3瀏覽量
6717
發布評論請先 登錄
相關推薦
評論