想要提高芯片之間的通訊速度,應該怎么做呢?傳統的思路是優化芯片之間的通信接口。
谷歌發布了CloudTPU測試版,以及GoogleKubernetesEngine的GPU。比如谷歌云服務中心使用的AI芯片TPU,就專門在每塊芯片上都專門設計了4個用來做芯片之間通信的接口,但是這種思路有一個天花板,就是如今的接口技術,芯片之間的通信技術,達到每秒鐘幾百甚至上千GB,就已經接近極限了,再要提升,技術上可能會非常困難,這里要額外提一句,每秒鐘幾百GB的速度,聽起來還是挺快的,但對于云計算中心而言,依然會成為制約整個系統運算性能的關鍵因素,那還有什么別的辦法可以繼續提高數據傳輸速度呢?
這里就要說到Cerebras這家公司的“巨無霸”芯片了,它的思路就是把很多塊小芯片合在一起,做成一塊大芯片,這樣原來需要很多芯片之間相互通信的任務,就可以在芯片內部進行數據傳輸了。要知道,芯片在自己內部傳輸數據的速度,是遠遠高于芯片之間通信的速度的,這就如同,我們左腦跟右腦互相溝通的速度,肯定比我們跟別人溝通說話的速度要快,事實上,按照這家公司披露的數據,這塊芯片內部通信網絡的速度,可以達到1000PB每秒,是目前最快的芯片之間的通信接口速度的10萬倍。如果未來超級計算機,都使用這種“巨無霸”芯片,那就能夠很好的解決芯片間通信速度。
這個制約運算速度的瓶頸對整體性能的制約影響,那既然把計算芯片做大有那么多的好處,為什么以前就沒人做呢,事實上,不是沒人做,而是這件事太難了,還沒有人能做到,為什么這么說呢,問題的關鍵就在“可靠性”三個字上,眾所周知,所有的芯片都是在一塊圓形的硅片上,經過非常精細的半導體工藝加工而成的,在加工的過程中,難免會有一些加工缺陷和誤差,導致硅片上局部失效。在過去,一片硅片上通常會切割出幾百塊小芯片,而這些局部工藝的誤差,頂多也就是影響其中一部分芯片,我們只需要把剩下的部分完好無損的挑出來,就可以到市場上銷售了。
看到這里你可能已經明白了,既然加工過程中,難免會出現一些工藝缺陷,那一塊芯片的面積越大,上面出現缺陷的概率就越大。所以想要成功的把它制造出來的難度也就越高,像這次發布的“巨無霸”芯片,面積是過去芯片的50多倍,對于工藝可靠性的要求理論上也就提高了50多個量級,這么高的可靠性要求,在過去是很難做到的,這也就是,在過去很少有這種超大型芯片的原因。
責任編輯人:CC
-
芯片
+關注
關注
455文章
50731瀏覽量
423197 -
通信接口
+關注
關注
3文章
237瀏覽量
30982
發布評論請先 登錄
相關推薦
評論