同樣用來“存數據”為什么數據縮減率差別這么大?
這個問題,相信很多企業級的小伙伴和我有一樣的疑問。
相對于備份存儲動輒達到50:1、65:1的數據縮減比例,而主存儲往往只有“可憐”的3:1,4:1。難道是備份存儲所使用的數據重刪、壓縮算法更先進,更高效?
如果是算法導致,為什么不用在主存儲上?這對于寸金寸“容量”的存儲設備來說,所帶來的經濟效益實在太誘人了。
而要回答這個問題,我們得先知道什么是重復數據刪除技術和數據壓縮技術(IT老司機可略過這部分)。
重復數據刪除技術是指僅在存儲介質上保留數據的一個唯一實例,冗余數據被替換為指向唯一數據副本的一個指針。當兩個或多個文件具有相同的內容時,重復數據刪除會將文件分成多個段,僅存儲每個唯一文件段的一個副本。
而數據壓縮技術是指在不丟失有用信息的前提下,縮減數據量以減少存儲空間,從而提高其傳輸、存儲和處理效率,或按照一定的算法對數據進行重新組織,減少數據的冗余和存儲的空間的一種技術方法。
▼一圖看懂數據重刪和壓縮▼
影響數據縮減率的因素有哪些?
答案是雖然主存儲和備份存儲都以存儲數據為目的,但兩者對于數據縮減技術有著完全不同的考量。
首先,數據縮減是備份設備的核心功能,提供更高的數據縮減率,是這類產品的主要訴求。
而對主存儲來說,數據縮減只是附加功能之一,而為了避免數據縮減產生大量的計算資源占用,影響到業務應用的讀寫,因此在數據縮減的使用上,往往有許多顧慮與限制。
另一方面,備份設備也因為自身的高比率數據縮減功能,使其也被局限在備份、歸檔這類靜態的存儲應用,而不適合需要頻繁讀取與寫入的一般業務應用。原因有以下兩點:
第一,高比例的數據縮減會占用大量的計算資源,從而影響其他業務應用,因此很難在運行數據縮減的同時,還能正常提供一般的讀寫服務。
其次,經過重復數據刪除或數據壓縮技術處理過的數據,必須先還原成原始數據,才能供前端主機讀取與使用,而主存儲中的數據,往往是那些需要頻繁讀取的活躍數據。
因此,以占用系統資源的方式頻繁地縮減與還原數據,是無意義的,也是資源的浪費。
此外,影響數據縮減率的另一個因素是,它取決于你有多少相同或相似類型的數據:
●數據保存期設置:數據保存的時間越長,重復數據刪除引擎發現重復數據的可能性也越大。
●數據類型:一些數據天生比較容易出現重復。如果網絡里存在大量的Windows服務器,或者VMware虛擬機,就有希望得到更高的數據縮減率。
●變化速率:數據變化的速率越低,發現重復的機會也就越高。
●數據備份策略:全備份(相對于增量備份和差異備份)的頻率越高,數據縮減的潛力也就越大,因為每天的數據有大量的重復。
可以看到,由于歸檔和備份系統的數據,大部分都是冗余數據,因此天生就可以實現更高的數據縮減率。
最后,是技術問題
比如戴爾PowerProtect DD備份存儲擁有高達65:1的數據縮減率,放眼業界同類產品都是頂尖的存在,這就源于其獨有的數據縮減專利技術。
而戴爾PowerStore雖然“只有”4:1的數據縮減率,但其數據縮減功能是“始終可用”。意味著PowerStore在數據縮減時不會額外占用控制器的CPU資源,幾乎對性能不會產生影響。
這也讓企業用戶不再陷入性能下降與節省成本的兩難,而讓數據縮減在主存儲真正發揮了用武之地。
*戴爾PowerStore采用英特爾至強可擴展處理器,該處理器可以優化工作負載,可靠性強,還有高計算力、高穩定性和高效敏捷性,不僅幫助PowerStore輕松滿足既定工作負載,也可以為數字化變革做好準備。
最后,總結一下。為什么備份存儲與主存儲的數據縮減率差別巨大?
答案是兩種產品的設計思路不同,存儲數據的類型不同,因而不能直接進行數據縮減率的比較。
審核編輯 :李倩
-
數據
+關注
關注
8文章
7003瀏覽量
88944 -
存儲
+關注
關注
13文章
4297瀏覽量
85801
原文標題:你問我答|主存儲和備份存儲,數據縮減率為什么相差這么大
文章出處:【微信號:戴爾企業級解決方案,微信公眾號:戴爾企業級解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論