首先說明一點,我從來都不是OCP的歌頌者,對我來看,他們就是在做一些奇奇怪怪的東西(hack精神),和富士康的黑燈工廠一樣,除了給iphone打工以外,沒有其他的推廣價值。
這個觀點的來源是本人職業生涯中的一個關鍵點,在2011年的第一屆OCP大會。當時Dell的DCS group經過艱苦的斗爭打敗了AWS和Facebook的大server供應商Rackable System[1], 正準備大展宏圖,成為數據中心的硬件之王。但是OCP來了,其中的一張照片最說明問題[2]:
Forrest肯定是笑不起來的,他剛剛從一個D火箭升到了SVP,正要“乘風破浪”,結果有人告訴他,現在是“吐槽大會”了。后面的故事,業內的人都知道了。Rackable system變成SGI后被HPE收購,美國的數據中心被臺灣同胞占領了。自己這個深有體會,在2009年左右的時候去找昆山產線上的高手修板子,他們的工廠在下午三點就關了空調,說主要是因為6點準時下班,到了下班時大家就內外一個溫度了。當然,這個就是現在最流行的“內卷”思想了。臺灣公司的上位其實是技術的悲哀。
因為這個原因,自己雖然一直在數據中心討生活,但是一直有意無意地遠離OCP。當然,OCP也在茁壯成長,facebook因為不做云計算,和其他公司沒有明顯競爭,微軟,Google也都把自己的內部項目貢獻了出來。在2017年的時候。Microsoft貢獻了Project olympus [3], 基本上讓高通差點丟了老命。教育一下不知道內情的小伙伴,Microsoft的人認為ARM64在服務器市場有前景,鼓勵富裕的小伙伴高通來擴大業務,結果一直很冷靜,不參與任何OCP項目的Hock Tan同學一看,機會來了,想一舉拿下不務正業的高通。結果嚇得高通直接退出數據中心[4],同時對于國內的ARM服務器生態一通重擊。
因此,對于OCP的項目,我都是“謹慎樂觀”。但是往往出于撿垃圾的習慣,就很關注那些不是標準服務器的項目。比如,2018年的Microsoft的另一個Project Denali[5]我就一直持了懷疑的態度。
原因是之前已經看到了另一個Project Denali的競爭者的尸體。[6]. 整個項目都開源在github,上次去印度研發中心的時候遇到一個做這個項目的印度小伙,笑稱可以拿這些資料開一家公司。但是IT這個行業就是這么殘酷,淘汰的技術,只會被遺忘。我只能祝福那些拿這個“洋垃圾”辦公司的朋友了。
OCP 2019的時候,另一個項目也被我關注了,原因是我客戶中的很多很牛逼的軟件工程師嘴里都有一個名詞“chiplets”,而且是和“DSA”(故意不解釋,看不懂的朋友請回了”聯系在一起。基本上就是,不同的ASIC的功能不一樣,大家一起坐下來,像攢服務器一樣攢個芯片。畢竟,過去大家都已經成功地攢了很多服務器。
這個項目就是
這個NFP感覺很眼熟,定睛一看原來是netronome的芯片,這家公司應該算是老相識了。我上一個老板就是他們的VP,一個住在東海岸boston的老美。第一在深圳相見的時候,他主動要吃湘菜,他說之前去南山區的時候就好這口,只是netronome在關鍵時間點敗給了Mellanox,之后就沒有之后了。對于NFP,一切要從Flow processor說起。Intel 22nm的第一個flow processor。
從架構上也是那段眾核熱的產物,和被Mellanox收購的ezchip類似。在使用TCAM做包處理的基礎上再前進一步,不僅在match階段,在action階段也是基于flow。
第一個問題就是好靈活呀,固件同學很辛苦。
果然在網站上看到了很多軟件。
從硬件角度來講,基于SRAM的確是延時最低的。這個比現在大家做的in-memory computing的架構都先進,除了難編程和擴展性差。
當然,和第8期的IBM 一樣,也有數據加速單元。
這里要講一下,他的string matching技術還是很不錯的,Sakir Sezer后面搞了一家做Reg-EX的公司,2019年被Mellanox 收購,并放在他們的Bluefield2的DPU中。
一個22nm的網卡芯片,沒有25G的serdes,在現在的市場如何生存。看了一下產品。原來和之前的Intel一樣。2x40G改2x25G,這樣的話,成本和功耗估計都沒有優勢。在我常去的HPC和數據中心部件的網點,沒有人敢賣2X25G超過300$, 連一直是最貴的chelsio的T6也只要285$.
作為從業人員,其實很理解這種悲涼。沒有資金流下一代的芯片,一直用14nm++++++來對抗AMD這樣的事,也就Intel可以干。記得上次換工作的時候,有家NVDIMM-F的公司拉我入伙,他們當時自己流片的DDR3的控制器,等到了DDR4的時候,他們已經在用我司的產品了,沒資金流DDR4了,趕不上技術發展,IT行業的淘汰太殘酷了。
回到ODSA,也看了他們的whitepaper,例子就是Smartnic。
CPU Chiplet 是Free的RISC-V,I/O Chiplet應該就是serdes,覺得中間那個switching chiplet應該就是NFP了吧。不過,真的要做這個,個人覺得可以用商用的TCAM[7]也行吧。至于Domain Chiplets,我大膽地估計他們會對互聯網新貴們講,“這個是你們的應用!!!”
從最初的構想到現在最新的update,個人認為已經有一些偏差了。這個最新的project的進展:
沒有了netronome的NFP的身影,而是一個NIC+FPGA+CPU的路,大家看到這個估計會笑了。目前國內的大部分smartnic已經開始從NIC+FPGA+CPU演進到了FPGA+CPU的階段。不知道這些人target的用戶到底是那些人。不過其中的OCP3.0的網卡規格的確是個好東西。2X100G的網卡數據中心標準,連Dell的服務器上都用上了。
對了,事情都是人在做,發現netronome公司的變化也挺大,
OCP Server/ODSA Project Leader Bapi 離開了公司,原來做編譯器的華人大佬也去了華為英研做編譯器。而整個公司的靈魂人物Gavin 居然離開了公司。
因為“新冠疫情”,這個我最近注意到第二個人。
還有一個是Nutainx 的CEO。[8] 隱隱感覺下一篇也有了著落。OCP已經快10年了,只要ticktok被打壓,Facebook應該會一直玩下去,最新的美國國會作證讓小馬哥很火,估計他們也放棄了,畢竟我們在微信,頭條和抖音的關照下沒功夫理這個臉書了。
原文標題:互聯網新貴搞OCP十年了,到底行不行?
文章出處:【微信公眾號:ssdfans】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
互聯網
+關注
關注
54文章
11163瀏覽量
103405 -
OCP
+關注
關注
0文章
79瀏覽量
16451 -
AWS
+關注
關注
0文章
432瀏覽量
24393
原文標題:互聯網新貴搞OCP十年了,到底行不行?
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論