人工智能、大數據、云等新技術興起對存儲發展帶來哪些新的沖擊,浪潮存儲如何制定未來的發展路線?在日前的浪潮IPF2018大會上,浪潮存儲研發總監李輝和Gartner VP Stanley,就智能時代的存儲演進共同接受了媒體采訪。
智能,拉近兩大平行世界
今天我們生活的世界,形成了兩個平行世界,一層是我們的物理世界,另一層則是由各種智能終端、傳感器、服務器、存儲設備所匯聚及衍生的數據及其交互行為,所形成的數字世界。這兩個世界并非割裂,而是通過數據載體來交互信息和進行融合。
Stanley在IPF2018演講
注:據Gartner數據顯示, 2020年互聯設備達到260億臺,移動設備74億臺
因為數據承載著人們的社交信息,我們才能與世界每一個角落交流;因為數據記載了每一條道路的信息,自動駕駛才能平穩地行駛于其上;也是因為數據匯聚了從訂單導入、工序制定到機床生產等各環節的信息,智能產線才能開工運轉。可以說,現在及未來任何一種商業模式、每個人的工作和生活,都將被數據及其內蘊信息的智能應用所改變。
從產業發展角度來看,只有站在兩個世界之上,跨越物理世界和數字世界的交點(即進行智能時代的業務轉型),才能獲得完整的產業機會。而IT廠商的使命,就是為各行各業的再一次轉型提供專業的數字化產品和方案。
AI改變IO的本質
“在智能時代,智能信息應用和數據智能技術兩者是互促式創新?!盙artner VP Stanley表示。 “在數據存儲的歷史上,存儲面對的應用是老三樣,即數據庫、文件和流媒體;今天,在智能時代驅動下,存儲要面對新三樣應用,即Cloud、Big Data和AI,這是智能應用的三層進階和實現路徑?!崩顺贝鎯ρ邪l總監李輝表示。
新三樣的數據挑戰:規模、性能、共享與管理
老三樣應用促使傳統存儲在性能、安全性、可靠性上有了比較好的解決方案,新三樣應用對存儲提出了更多的要求。
在智能時代,數據成為核心資產和基礎生產資料,企業期望能做到數據及其所蘊藏信息的最大化共享。因此,李輝認為:“新三樣應用不僅是把基礎設施的資源價值最大化地挖掘出來,更需要把整個數據資源——無論是關鍵數據,還是以前認為沒有價值的數據,價值都能夠最大化地挖掘出來、貢獻出來。其本質上是基礎設施和數據資源在超大規模應用下進行共享的問題。”
這首先對存儲規模提出了挑戰。從云計算來看,云計算的應用多達幾十種、上百種,客戶可能有幾百個、甚至上千個虛擬機,承載成千上萬個虛擬桌面。作為它的整個后臺,存儲集群會規模很大。從大數據或者AI來看,其數據量非常之龐大,可能擁有十億或者百億的文件,構成一個龐大的數據鏈。這就決定了,大數據或AI需要借助一個很大的集群,包括服務器集群、存儲集群或GPU集群來服務上層業務。
其次,新三樣應用對存儲性能提出了更大的挑戰。無論是面向文件和對象的OPS的性能,還是面向云虛擬機環境下IOPS的性能,新三樣應用都帶來了第二個非常大的挑戰,就是性能一定要足夠高。比如現在一些應用,已經到了百萬級的IOPS,已經到了TB級的帶寬。
第三,云、大數據、AI需要在設施資源和數據資源的共享基礎上進行再利用,這對數據的共享與管理帶來挑戰。現在及未來,客戶追求的是全局最大化共享,而不僅僅是局部或內部共享。Stanley表示,“大數據或AI應用實際上需要把一些之前扔掉的數據重新拿回來做分析,扔掉的數據反而會產生很大的價值。”李輝表示,“數據要實現共享、要流動的話,可能牽扯到幾百個乃至更多的數據存儲節點,涉及數萬個數據卷或者數百萬個文件。這些數據資源,需要通過統一架構來支撐、統一管理平臺來調度和組織,在共享和管理上有很多技術上的挑戰?!?/p>
標本兼治,以智變促質變
新三樣對存儲系統帶來了更高的技術要求,主要集中在六大方面:存儲架構與數據服務、存儲內外的高速互聯、空間資源的超大規模池化、資源池內數據的超高速流動(即匯聚和分發)、對上層應用(尤其是云計算、大數據、AI應用框架、平臺、生態)的超密對接、數據中心級的統一智能管理與調度。因為有上述需求,現在存儲的構建方法和使用技術也有所改變。
對于這六大方面的技術需求,在存儲系統上應標本兼治。
云計算、大數據和AI是智能應用的上層建筑,存儲與服務器、網絡和云平臺則構成基礎設施。首先,存儲作為基礎設施之一,其系統架構是本。架構的一致性和歸一性會給數據中心基礎實施帶來互聯互通、共享統管方面的保證,帶來全方位的CAPEX和OPEX節省。其次,生長于架構上的新技術、新特性、新功能,則是標,通過這些創新,存儲可以完美適配不同的應用場景。
存儲架構發展到現在,主流的存儲架構趨勢有兩個:
一個是傳統存儲(即磁盤存儲)的Scale-up縱向擴展架構。通過對Scale-up架構進行重構,增加一定的Scale-out橫向擴展能力,以及更多技術特性和功能,可以更好地滿足智能時代新三樣應用的架構需求。比如增加高端存儲特性,滿足新三樣應用的高端超高性能應用;又如存儲在同一套架構上支持磁盤、磁盤固態盤混合、全固態盤等多種介質,提供磁盤存儲、混合存儲、全閃存儲等應用模式,達到“統一存儲”的目的。
另一個主流架構則是Scale-out,即分布式架構。在數據量動輒PB級的時代,分布式存儲的應用越來越廣泛。面向新應用,分布式存儲最需要“All in One”架構,即一套架構支持文件、塊、對象和大數據等不同類型的數據服務。這種分布式存儲在架構上的一致性,能保證在基礎設施層面就地分發數據,減少數據復制和遷移,減少部署和運維的復雜度,在一套技術體系內實現數據的全生命周期管理。
對于存儲規模來說,從應用角度,PB級容量已經是常態。十PB級、百PB級需求也已出現,不久的未來,一些大型客戶會出現EB級容量需求。對此,Stanley表示,“現在存儲技術比較廣泛適用的是橫向擴展的存儲系統——分布式存儲。它可以同時增加容量、計算力和帶寬。也就是說,容量增長的同時,計算力跟帶寬均呈線性增長。這就解決了擴展性的問題。分布式存儲發展到現在,其容量的衡量單位已經是PB?!?/p>
Stanley在訪談現場
Stanley特別強調:“由于大數據的出現,如今數據增長的70%是非結構化數據,所以比起IOPS,大數據更多關注帶寬、容量和成本。而HDD,即傳統介質,在帶寬、容量方面相對于閃存更有競爭優勢,而且它就是原始數據存儲的成本也更加低。所以如果要把之前扔掉的數據,現在收回來,用于AI、大數據分析的話,混合存儲(磁盤和固態盤)架構反而具備更多競爭優勢。”
其次,對于數據訪問性能問題。關鍵應用和虛擬機集群要求高IOPS,全閃存儲會是更好的選擇。一方面,全閃存儲使用固態存儲介質技術,比如3D NAND閃存技術,還有一些新興介質技術,比如3D xpoint。通過全閃存儲系統內的介質全部固態硬盤化,可以大幅提高IOPS、時延和帶寬。另一方面過去20年里,主流的存儲介質協議改變了很多。當前主流的是SAS和SATA;NVMe和NVMe over Fabric也已經標準化,在此基礎之上,業界出現了NVMe固態硬盤。對比來看,NVMe SSD的高IOPS能力對比SAS SSD沒有更多改變,但是它的容量和擴展規模更大,更重要的是,時延能大幅降低。
Stanley表示,“基于固態存儲技術,我們還可以把一些存儲技術模塊打包,從快速存儲向內存存儲來改變,帶動內存計算技術的發展。這樣的話,內存計算的方式發展起來之后,業界在數據庫的設計、應用設計這些方面都要得到改變。所以說一個緯度的改變會帶動很多緯度的改變,包括這些應用本質的一些改變,應用及其支撐的改變是相互的?!?/p>
場景驅動開發,互聯網+存儲
Stanley表示,“云計算的出現其實也改變了客戶的購買模式。因為很多的基礎設施上云之后,它的上面的數據也就上云了,其實跟本地的存儲形成了一種競爭的關系?!?/p>
李輝表示,現在數據中心在快速演進,大部分的數據中心都會遵循某個模式來發展。像一些互聯網的數據中心,或者一些高性能計算的數據中心,會做得比較激進。這些數據中心主要是新建的,沒有一些固有的歷史包袱,它可以面向未來去更多的采用一些新架構和新技術。政府或者企業的一些傳統數據中心,問題可能就會比較大一些。因為它既要上一些新興的應用,同時還有一些過去建設了這么多年傳統的應用,面臨的優化、整合、數據上云、應用上云等問題會比較多一些。
對此,浪潮存儲研發堅持“場景驅動開發”模式,即“以客戶為中心、以應用為導向、以技術為基礎、以創新為橋梁”,把新技術和新應用結合在一起,針對典型場景進行快速定制型開發和優化,以最大限度地滿足用戶需求。浪潮存儲把新老應用重新定義為傳統企業級應用、視頻監控、高性能計算、廣電媒資、云計算、大數據和人工智能等七大一級場景,并將之分解為近百個二級場景。截止目前累計完成了近50個二級場景的定制和優化,尤其是在云計算、大數據和人工智能等方面,已經做了大量的定制和優化工作。
比如,針對私有云內基礎設施的新老兼顧、優化整合,浪潮增強了“異構虛擬化”功能,支持業內近90%、總計300多款存儲設備的異構融合,能幫助用戶有效完成老系統升級、老設備利舊。又如,針對分布式存儲海量小文件的高性能處理要求,浪潮端到端優化和增強了傳輸協議、數據聚合、服務集群、介質分層等全流程上幾乎全部的處理模塊,“基本上我們是重構了一遍”,李輝表示。當前浪潮已經把小文件處理能力從億級提升到了十億級,正在根據典型場景向百億級優化。
“互聯網應用是云計算、大數據和AI應用的集成者、領先者和普及者。浪潮存儲既跟互聯網客戶合作,又跟政府和企業等非互聯網客戶合作,可以了解他們雙方各自的要求。在此基礎之上,通過浪潮存儲內在的需求-開發-交付體系,創造互通有無、相互借鑒的創新橋梁?!崩钶x表示,“我們一方面可以針對包括互聯網在內的特定用戶的典型場景快速定制和優化,另一方面又把相關優化普及到其他用戶中去。借鑒互聯網思維,借力互聯網應用,結伴互聯網用戶,這就是浪潮存儲的互聯網+?!?/p>
李輝在訪談現場
雙線發軔,高速發展
浪潮存儲在技術研發與產品布局上運籌帷幄,以求滿足云計算、大數據和人工智能對企業存儲的需求。
在產品布局方面,十余年如一日,浪潮在Scale-up和Scale-out兩大架構基礎上不斷進行技術創新和產品迭代。當前浪潮存儲擁有兩大系列產品。一個是基于Scale-up架構重構而來的統一存儲系列,通過架構革新和特性增強,在同一架構下支持兩類存儲,智能存儲(磁盤存儲和混合存儲)G2、智能全閃G2-F;另一個是基于Scale-out架構的海量存儲系列,即分布式存儲,同樣在同一架構下支持兩類產品,即統一分布式存儲UDS、軟件定義存儲SDS,這一套架構可以實現文件、塊、對象和大數據四種數據服務。
兩大系列浪潮存儲產品雙線發軔,已廣泛應用于金融、公安、能源、通信、教育等行業,并得到了越來越多用戶的認可,并在金融、運營商、能源、政府、制造等眾多大型客戶中實現了規模應用。與此同時,浪潮存儲還與醫療、廣電、監控等多個行業的ISV緊密合作,推出面向行業的聯合解決方案,成功服務于越來越多的客戶。
Gartner認為,云、大數據和AI應用的高速增長,是數據存儲發展非常重要的推動力,會讓中國存儲市場保持比較健康的中高速發展速度。目前,中國存儲市場在全球存儲市場的占比只有8%,但中國經濟總量在全球的占比已達18%。推而論之,中國存儲市場未來在全球存儲市場的占比將會越來越高,擁有很大的增長空間。
Stanley表示,“中國存儲廠商只要能通過技術創新,去幫助用戶設計架構和建設基礎設施,促進用戶做出更好的業務決策或者創建更多的業務機會,從而幫助企業增加收入。(中國存儲廠商)在商業方面就比較容易能夠成功?!?/p>
機會往往留給有準備的人,浪潮存儲的技術和市場實力正在突飛猛進。2018年,浪潮存儲將聯合上千家合作伙伴,向中國存儲市場前二的目標進發。
-
存儲
+關注
關注
13文章
4298瀏覽量
85811 -
人工智能
+關注
關注
1791文章
47208瀏覽量
238295
原文標題:浪潮李輝:智能重塑未來,存儲如何變革?
文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論