存儲技術發展日新月異。一方面傳統集中式SAN/NAS還在廣泛使用,另一方面各類分布式存儲產品已紛紛在新興的海量數據場景中占據市場。如何根據業務需求選擇合適的存儲架構?分布式存儲能否在所有場景都能取代傳統集中式存儲?請參考本文攻略。
傳統集中式存儲
傳統SAN/NAS存儲的硬件架構采用“控制器+硬盤柜”的方式。中高端存儲支持多個控制器,以保障高可用并提高性能。多控制器為緊耦合,通過PCIE總線或Infiniband網絡互連,共享磁盤陣列,共享緩存。
傳統存儲的系統架構具有I/O路徑短,訪問延遲小的優勢。傳統存儲通過內置BBU電池或外置的UPS來實現掉電保護,保障緩存中的數據在掉電后不丟失,結合雙活、容災、CDP等技術保障業務系統的連續性和數據安全性。
傳統集中式存儲起步早,技術成熟,架構簡單,表現出足夠的穩定性,對高IOPS、低延時、和數據強一致性有很好支持。另外,近年來全閃存陣列存儲發展迅速,IOPS性能提高到機械硬盤存儲的100倍以上,能夠有效解決IOPS性能痛點。
傳統集中式存儲的特性適合作為金融/醫療等核心業務系統的數據庫存儲。
傳統存儲的系統架構決定了其擴展能力有限,無法很好支撐高并發訪問性能。隨著我們進入大數據時代,集中式存儲增長空間越來越有限。
分布式存儲
企業不斷快速增長的海量數據,需要更有彈性可擴展的存儲架構。
分布式存儲是新興的存儲技術,采用“標準的x86服務器硬件+存儲軟件”的架構,將標準X86/ARM服務器通過高速以太網或Infiniband互連,通過分布式存儲軟件將服務器本地的HDD、SSD等存儲介質組織成統一的大規模存儲資源池。分布式存儲實現了存儲的硬件與軟件解耦,數據中心能夠以標準化硬件搭建存儲平臺,提升IT敏捷性,降低運維成本,符合軟件定義數據中心的發展趨勢。
分布式存儲也稱為軟件定義分布式存儲(SDS: Software Defined Storage)。
分布式存儲的存儲單元為x86/ARM服務器(也稱為節點),以標準2U 存儲服務器為例,前面板可插入12塊3.5寸硬盤。
圖 存儲服務器:2U高度,12盤位
硬盤的容量,有4TB\6TB\8TB\10TB\12TB\16TB等。
如果選擇10TB硬盤,則單個節點的物理容量為 12 * 10 = 120TB。
分布式存儲有效解決了傳統集中式存儲的可擴展性問題,規模可擴展至上千個節點,容量擴展到上百PB甚至EB級,性能隨容量線性提升。按需在線擴容后,自動實現數據再均衡。分布式存儲的多個存儲節點能夠同時提供讀寫服務,因此具有很高的吞吐率,可達到幾十GB/s。
分布式存儲支持3種存儲功能,能夠打造統一的數據存儲平臺:
NAS文件存儲,CIFS/NFS接口協議
對象存儲,S3接口協議
分布式存儲使用多副本和糾刪碼技術實現數據保護。多副本方式(業界常用的多副本方式一般為2副本或3副本),其優點是可靠性高,性能高;但缺點是存儲容量有效利用率低(2副本為50%,3副本為33%)。業界常用的糾刪碼配置方式一般為8+4(8個數據塊,4個校驗塊,容量利用率為66%)。糾刪碼的優點是可靠性高,容量利用率高,缺點是性能低。
一般選擇原則是:
在線存儲設備用多副本;備份歸檔用糾刪碼;
小文件用多副本;大文件用糾刪碼。
目前,國內有多種分布式存儲產品可以選擇,包括開源軟件、基于開源軟件優化的產品、國產研發的分布式存儲產品等。
上海霄云研發的碧海分布式存儲,性能優異,解決了海量小文件存儲的痛點,性能達到傳統集中式高端存儲和Ceph類產品的3倍,文件數可達到百億級以上,為醫療PACS影像、金融電子票據、自動駕駛、工業自動化等海量數據場景提供了革新的存儲解決方案。
結語
綜上所述,分布式存儲是一種未來主流的存儲技術,具備非常好的發展前景,但是分布式存儲并不能適應所有的業務場景,需要根據實際的業務需求進行合理選擇。
審核編輯:符乾江
-
存儲技術
+關注
關注
5文章
732瀏覽量
45796 -
存儲架構
+關注
關注
0文章
17瀏覽量
10103
發布評論請先 登錄
相關推薦
評論