12月11日, 在北京國際飯店舉行的2018中國存儲與數據峰會(DATA & STORAGE SUMMIT 2018)上,新華三集團存儲產品部總經理徐潤安以“閃存新紀元-- Memory-Driven的存儲新常態”為題發表主題演講。以下內容根據速記整理,未經本人審定。
新華三存儲產品部總經理徐潤安
徐潤安:各位嘉賓大家下午好,感謝鄭總和大會給新華三一個機會來分享給大家我們對于下一個存儲紀元的理解。
大家記得這個圖嗎?一年前,也是在這個峰會上,我們就談到了關于這一副清明上河圖,一千多年前的生活常態在現在已經發生了更多的改變,有好事者在網上P了一個新的清明上河圖。
歲歲年年花相似,年年歲歲人不同,存儲市場也是這個樣子,可能有客戶的需求從來就沒有變過,我們要的就是更快、更大、更可靠的存儲,而實際上真正承載這樣的一個技術的底層的技術,都在不斷的發生變革和革新。
金光飛航是往返于港珠澳之間基本的交通工具,在之前我們往返于香港、澳門、珠海都要靠船,這個船很小,如果遇到大風浪,我們都經常會停航,船有時候也非常的顛簸,坐的非常不舒服,但是大家知道在今年,我們在港珠澳之間通行了港珠澳大橋,林總工程師設計了這樣一個港珠澳大橋,把整個港珠澳之間的通行變得非常的便利,兩岸的同胞們通行起來更加的便利,這成為了港珠澳三地群眾的新的生活常態,一個大橋改變了所有的東西。當然這個大橋也用到了非常多先進的技術。
傳統的機械盤到NANASSD、SCM,一直有一個像港珠澳的延時,非常大,用什么樣的技術可以抵消這部分的延時?那就是英特爾和我們給大家帶來的3DXpoint,我很自豪的和大家宣布,12月4日這款產品正式的商用,也就是大家可以在新華三的平臺上享受到SCM(Storage Class Memory)帶來的便利,這樣的技術真的彌補了延遲之間的差距。
首先SCM的技術基于兩點,一個是介質的技術,另一個是NVMe。
可以看到NVMe的v1.3最新的版本是17年發布的,未來所有基于SAS.SATA的協議都會被NVMe取代,這個趨勢是不可逆的,所以很多的平臺都是NVMe平臺實現,另外NVMe的生態系統逐漸的完善,從操作系統、虛機等等。
我今天想強調的是NVMe的技術對SCM提供的更好的舞臺,正是因為有了NVMe,才可以讓其他的東西真正的發揮作用。它可以將SAS和SATA之間的瓶頸消除掉,帶來更強的并行處理和輸出的能力,從而改變現在的存儲市場和產品。
新華三是第一個采用SCM技術、利用NVMe來實現的一個廠商。
來看看NVMe的SCM給大家帶來了什么好處?圖的最左側,是傳統的介質,磁盤,延遲是10毫秒,所有的控制器和軟件延遲都比較高,第一步的變革,就是全閃存時代的到來,換成了SSD NAND的技術,延遲一下子降到了0.1毫秒,我們可以看到在附加SAS控制器的延遲成本,可以看到NVMe的SSD也會帶來更進一步的延時的減少,一部分體現在介質上,另外一部分體現在控制器和軟件上。SCM,將延時再下降了十倍,這個技術是革命性的,真正的橋接了CPU、MAND和SSD之間的延遲,所以新華三也是HPE在全球第一個推出了SCM解決的方案。
當然,全閃接下來在市場的發展和系統健壯性方面還有很多的疑問,需要各個廠家和所有工作者共同努力,就是比如NVMe對于現有的架構會有多大的影響,也是需要我們考慮的。
操作系統的支持,我們需要去考慮,以及社會的多路徑管理等等,所有的這些技術我相信在今后的一兩年之內會逐漸的完善起來,然后去滿足客戶的需要。
客戶在選擇所有全閃存的時候,也可以對這些問題做適當的關注,當然也歡迎給到我們更多的輸入,告訴我們你們更喜歡什么樣的NVMe技術,你們更喜歡什么樣的全閃。
簡單來看,大家最熟悉的NVMe和NANDSSD是很普遍的技術,我們帶來的是NVMeon storageClassMemory,會有一個很大的性能改變。
這是我們自己的系統上做的延時的測試,可以看到整個的系統的平均延時下降了50%甚至更低,大家可以看到幾乎所有的I/O都會在0.3毫秒以內,95%,這是SCM帶來的真正的價值,不僅僅是峰值,而是所有的。
SCM下一步的發展會是什么樣的?我們的觀點是,在現有這個階段,SCM將會被用于數據閃存,存儲系統里面的閃存.
隨著SCM的技術逐漸的進一步的完善以及體系架構的改變,原數據可以更多的存放在SCM上,當SCM的成本降到足夠低的時候,SCM甚至可以將整個陣列的所有數據存放上去,屆時這就是下一個閃存紀元。
總結我們的方向,首先是SCM,讓Memory-Driven可以給大家帶來更多的更快的延時,并行處理的協議包括NVMe,包括由此帶來的革新性的全閃存的系統。
談到Memory-Driven,大家也可以看一個例子, DZNE公司采用了我們Memory-Driven的技術以后整個的研究成本降低了60%,研究速度提升了一百倍,當所有的運算不再依靠磁盤介質,而變成NAND介質甚至是SCM介質的時候,帶來的計算的速度會成倍的增加,從而帶來成本的進一步下降,這是給大家帶來的業務價值.
所以我們說,新的閃存紀元不僅僅是要求更多更大的IOPS,可能更快速的響應,更低的延時。
今天這個大會的主旨“DataIntelligence”,我們的存儲能不能“Intelligence”?給大家分享一個小例子。
前一段時間去美國的時候,我用了導航軟件,因為谷歌不可用,所以當地的朋友推薦了我用waze,這個工具非常好的一點,除了有我們現在百度高德所有的功能外,它提供的非常豐富的反饋功能,也就是作為用戶可以實時反饋你在路上看到的情況,大家知道當一條道路顯示紅色的時候,往往是因為這里的平均車速比較低,但在美國很多的情況是因為有Parkingload有車停在路邊,也會導致平均速度降低,駕駛者可把信息提供到軟件上,我這里碰到了事故,整個系統學習了這些數據以后,會反饋給路過這條路上的所有駕駛員,這是一個擁有反饋機制的人工智能。
waze還有一個非常大的好處,因為到美國一個新的城市可能路不是很熟悉,waze就會做出推薦,他會問你出行的時間是什么,如果是中午,他會給你推薦最適合中午出行的路線,晚上會推薦你晚上出行的路線,告訴你這條路大概要花多長時間,它不僅僅是基于現在的數據,它基于歷史的數據驅分析出來一個結果,反饋給有相同使用需求的人。
存儲可不可以?我的答案一定是可以的,我們帶來的系統就是這樣的,首先根據我們所有的歷史狀況,發現真正跟存儲相關的報錯錯誤,其實只有46%和本身存儲有關,更多的是非存儲的原因,比如最佳實踐和資源沖突以及兼容性的問題,過去往往沒有人關注這一點。通過人工智能可以把這些問題全都分析出來。
我們InfoSight人工智能系統上線以后一定是一個閉環,從洞察這些問題,到機器學習,然后到預報,同時還可以做推薦,還有執行,所有的整個一套系統我們是閉環進行的。這套系統上線以后,85%的問題被自動診斷并且解決,5000多個案子被成功避免,所以新華三的服務部門非常開心,工作量一下子減少了,當然對于客戶而言,79%的日常IT維護的工作沒有了,可以投入更多精力在IT的創新,而不是復雜的運維。
現在我們已經將InfoSight智能系統運行到了我們的平臺上運行到了所有HPE服務器上,也就是說整個的InfoSight系統已經被IT基礎架構平臺上使用,這是簡單使用以后的數據。
11倍的高效非常有趣,有一個客戶有多臺陣列,但是多臺陣列之間的負載是不均衡的,有些陣列用滿了,有些沒有,單用戶本身是不知道的,他也沒有明確的感知,也不知道是哪個應用把哪臺陣列用滿了。上線InfoSight以后就給了他建議,某幾個應用已經遇到了瓶頸,某臺設備也遇到了瓶頸,應該把一些應用和虛機遷移到另一臺陣列上,所有的這些工作就可以幫助用戶正確的診斷出系統里真正的問題到底在哪里。
另外我們也是全球首創一個飽和度的分析結果,這種分析以前可能是不可想象得,可能我們要咨詢團隊入住用戶的現場待上幾個月觀察你所有的數據,現在就是一份報告,通過我們的InfoSight系統,綠線是OK,紅線就是有問題。
不僅僅是讓用戶發現問題,而且知道故障是什么原因導致的,以及如何解決。
另外,InfoSight還可以推薦結果,當有客戶在一個環境里碰到了問題,并且最終找到了解決方案解決以后,整個解決方案會通過這一套智能系統推送到所有有類似環境的客戶里,告訴他們說有類似的潛在風險,需要做一定的升級或采取一定的措施。
當然也有這樣的情況,我最近也碰到一些客戶經常會問我,現在陣列的分布的版本經常有更新,那作為一個客戶我怎么知道現在是不是需要升級系統?InfoSight可以告訴你,這次版本的升級,升級了哪幾個補丁,主要為了修復哪些環境上的問題,再檢測環境里是不是有類似的潛在風險,如果有就跟你說你需要升級,如果沒有就說不用。
所以你可以看到整個有一個反饋的積極正向的反饋機制給到用戶,告訴用戶你的系統應該怎樣的調整。
大家看一下我們的性能分析和處理的大概的流程,包括異常的檢測,熱點發現,壓力評估,社區學習,存儲的負載的性能評估,壓力的預報,未來的性能走向都會通過InfoSight給到大家一個分析,這樣讓用戶的存儲更加的智能,不需要花太多的時間關心運維存儲本身,而可以去關注業務。
這個是InfoSight上線以后的情況,我們可以直接升級到L3,小于一分鐘的響應時間,93%的案子會被自動處理,客戶滿意度大大的提升,所有的這些東西智能存儲,給我們和客戶帶來了更多的價值。
所以就像大會說的一樣,DataIntelligence,包括所有的功能帶給客戶,我相信我們準備好了,我們一樣把這個會帶給大家。
這里是我們整個新華三的存儲家族,都會被InfoSight覆蓋,變成一個智能的IT設備,我們一直在前行。
評論
查看更多