國產芯片的發展面臨兩個機遇。
首先是缺芯困局下,國產化替代的呼聲越來越高,這無疑給國內芯片創業者提供了一個發展的緩沖期。對于 2020 年創業做大算力芯片的后摩智能創始人&CEO 吳強來說,「在芯片成長早期,這個條件是國內獨有的,我在美國是不敢做芯片創業的。」
而在人工智能快速發展的當下,對于大算力的需求,給予了芯片創業新的機會。尤其是自動駕駛領域。
傳統汽車以控制為主,算力要求很小,而 L4 級別的自動駕駛就要求 1000T 以上的算力,不僅如此,汽車端的供電和散熱能力也對芯片的低功耗提出了新需求。雖然英偉達剛推出算力高達 2000T 的計算芯片 DRIVE Thor,但顯然不是所有的車型都能裝備這樣的芯片。
對于被「卡脖子」的國產芯片廠商來說,想要參與這場「算力大戰」,顯然也無法指望依靠制程工藝去實現芯片算力的提升。
在吳強看來,存算一體芯片可能是國產芯片算力彎道超車的機會。相比較傳統的馮·諾依曼架構芯片,「存算一體」架構能夠整合計算單元和存儲單元,優化數據傳輸路徑,提高芯片算力天花板。在縮短系統響應時間的同時,也在能效比上帶來了數量級的提升,更適合自動駕駛、泛機器人等邊緣端算力的需求場景。
存算一體芯片的成本優勢從而何來?如今又在哪些行業得到落地?國內芯片創業的機遇和差異化優勢在哪里?在 9 月 28 日極客公園的 Rebuild 2022,極客公園創始人&總裁張鵬和吳強聊了聊存算一體大算力 AI 芯片的發展與未來前景。
01大算力下低成本的
解決方案
張鵬:存算一體到底是什么?會帶來哪些改變?
吳強:簡單來說,存算一體是一種創新的計算芯片架構,相對于傳統計算和存儲分離的馮·諾依曼架構,存算一體更好地把存儲和計算融合在一起,把存儲和計算盡可能靠近,甚至完全融合,比如在存儲中進行計算,這是存算一體的基本概念。
存算一體比較適合數據量很大的計算,例如當下非常火的 AI 計算,它做 AI 計算是最高效的,對 AI 計算來說是非常通用的。很多人有所誤解,認為存算一體是非常專用的 AI 芯片,其實不是,因為存算一體本質上是乘加運算的加速,做矩陣運算會非常高效,矩陣運算本身就占據了 AI 計算中百分之八九十的計算成分。基于此,可以做出很多系列化的指令,一些非常細微的指令甚至可以允許客戶自定義算子,那么就可以做出非常通用的 AI 芯片,類似于英偉達的芯片。
張鵬:存算一體的發展有哪些技術關鍵點?
吳強:存算一體在學術界有十多年的歷史,一直在發展。最近幾年,學術界的一些技術突破到一定程度,可以應用到更大算力的場景,比如智能駕駛或者主流的 AI 應用場景,才有了后續商業化的一些嘗試。
首先從產業鏈的角度來說,是依賴于存儲介質工藝,后摩智能目前的產品是基于 SRAM,我們還有下一代產品,基于其它一些存儲機制:MRAM、RRAM 等。存儲工藝依賴于上游廠商如臺積電等,他們在做一些工藝或者硬件層面的創新。目前 RRAM 在臺積電的成熟度屬于風險等級,距離完全量產大約有兩年時間。這是產業鏈的依賴,但是 SRAM 是一個完全成熟的存儲介質,目前可以用作商業量產。
另外,存算一體是一種新的設計方式,是架構創新,雖然之前學術界做了很多,但基本是以學術研究的方式在做,從學術到商業量產還有一定距離。后摩和其他一些創業企業更多是按照商業量產的標準去做,過去兩年,我們不斷探索,比如怎么做量產,怎么做 DFT,怎么做冗余,怎么做自修復,這些都是我們要解決的問題。包括跟 AI 芯片、架構設計、編譯器以及算法之間的融合等。
存算一體架構與傳統馮·諾依曼架構 | 來源:電子工程專輯網站
張鵬:存算一體的架構能在成本上帶來優勢嗎?
吳強:算力越大越需要高成本,存算一體的一個優勢是如果不依賴于先進存儲工藝,或者不依賴于先進的封裝技術,像 HBM 的 2.5D 內存封裝技術,也能把算力做上去,也能滿足智能化訴求,這樣成本能控制下來,比如降到一半的成本,也許十多萬的車就能用得起幾百 T 算力的芯片。所以我們首先想的不是通過堆工藝或者其他東西把算力做上去,而是通過底層架構的創新,把算力做上去,成本又不增加,讓更多的平價車能夠用到更智能的自動駕駛技術。
第二,如果功耗低,散熱就會簡單,不像之前需要很多資金或者增加系統的復雜性。從這幾方面,我們希望能夠給智能駕駛的用戶提供一個不一樣的芯片。
張鵬:存算一體的大芯片對芯片工藝的要求更高嗎?
吳強:存算一體是架構的創新,工藝是兩個維度的事情。首先好的工藝肯定是好事,我們現在也會用先進工藝,因為本身是疊加的工藝,如果沒有先進工藝,比如某一天國內所有玩家必須退回到 28 納米,對存算一體來說,對先進工藝依賴度其實是更低的。相對于常規的設計方式,這是我們的一個優勢。
張鵬:感存算一體最近討論也比較熱,你們如何看待?
吳強:感存算一體就是把傳感器、內存更好地結合,以便更好地計算。這是一個比較新的概念,最近幾年學術界研究比較多。目前感存算不管是算力還是存儲量相對都比較小,數據處理方式和功能相對來說比較有限,比較適合 AR、IoT 等場景,還不太適合大算力場景,暫時我們不會往這個方向走,但會密切關注。
02、國產化替代的需求
催生了芯片創業
張鵬:決定在 2020 年創業的考慮是什么?是有什么新的技術突破嗎?
吳強:第一點是技術上的突破,傳統的存算一體是基于一些傳統的存儲介質,比如 Nor Flash,Nor Flash 本身只適合做小算力的場景如語音等。2017-2018 年開始,存算一體技術開始突破做大算力,基于 SRAM 去做,SRAM 和其他一些存儲介質更適合大算力。首先以臺積電張孟凡老師為代表的學術界,把整個電路設計做了一些突破,讓做大算力的存算一體變得有可能。
第二點是需求方面剛好發展到一個階段,不管是智能駕駛,還是云端,對算力要求越來越大,行業內也遇到了一些瓶頸和痛點。我之前的工作做過 CPU、GPU,后來也做 AI 芯片,發現很多時候算力上不去,不是計算部分不行,而是帶寬變成了一個瓶頸,很多時候處于計算等待數據傳輸的狀態。想提高算力就要優化帶寬,這是一個痛點,我們也一直在思考怎么解決數據帶寬這個瓶頸問題。
在創業初期,創始團隊大概有兩撥人,一撥人是存算一體的大牛,一直在做存算一體,尤其是大數量存算一體技術。另一撥人像我一樣是一直做大芯片的,CPU、GPU、AI 芯片等。我們在一起頭腦風暴之后,覺得存算一體已經到了一個節點,可以商業落地,發展到足夠成熟的地步,可以解決一些現實的痛點。另一方面,需求方對傳統芯片設計有越來越高的要求,很多痛點沒法解決,用存算一體也許可以解決這些問題。后摩智能在 2020 年創立的時候,是國內第一個用存算一體做大算力的企業,也是唯一的一家。現在存算一體越來越火,我們也很高興看到更多公司一起加入這個賽道。
張鵬:創業做一家芯片公司,當時是怎么評估可行性的?
吳強:之前在硅谷生活了很多年,見證了國際芯片巨頭的發展。首先做芯片是很難的一件事,國內的芯片創業公司特別多,為什么國外沒有那么多芯片創業公司?首先芯片的創業需要很多高級人才,人才密集以及資本密集,落地時間相對來說比較長。在國外純商業的環境下,很難做商業創業。這也是為什么美國從 2010 年以后,真正的芯片創業公司沒有幾個,當然有一些大牛,像吉姆·凱勒 (Jim Keller,Apple A4、A5 處理器和 AMD Zen 系列處理器的主設計師),但是大家都還沒有跑出來。
中國有個天生的優勢,我們有國產替代的訴求,國家重視,給了芯片創業的企業足夠的成長空間,這是非常重要的。在芯片成長早期,這個條件是國內獨有的,我在美國是不敢做芯片創業的。但是在國內特別是 2020 年左右有這樣的契機,雖然并不能保證一定成功,畢竟只是給你一個機會,最終還是要做出回歸商業本質的產品。
所以還是要產品的差異化方面做得更好,怎樣做出一個東西,即使拿去跟英偉達相比,仍然具備一定的差異化,在局部有一定的優勢,而不單單是國產替代。
張鵬:芯片公司對人才的要求很高,你們公司現在的技術人員構成是什么樣的?
吳強:我們和其他芯片公司又不太一樣,畢竟我們用的是創新的構架,首先需要的是一些有學術背景的人才,做過存算一體研究的,要對存算一體的電路構架包括工藝層面都比較熟悉。這可能是其他芯片公司不需要的。
其次,我們做的是大芯片處理器,而且還是應用于 AI 的處理器,存算只是其中一個環節,首先還要考慮的是如何設計一款復雜的芯片,要對 AI 的算法有充分的理解,這樣的人才能做出符合 AI 應用場景的 AI 芯片。
最后還需要芯片之外的軟件設計人員,之前有文章分析說國內的芯片公司其實硬件差距并不大,關鍵還是軟件系統如編譯器等的差距比較大。硅谷尤其是英特爾有很多編譯器相關人才,但是國內很缺。好的芯片需要配合上好的編譯器,好的系統軟件和工具鏈,才能讓客戶覺得芯片性能好。很多創業公司最后無法落地,就是因為編譯器人才比較缺乏。
張鵬:在理想狀態下,存算一體架構在成本、功耗方面會帶來什么級別的優勢?
吳強:英偉達能做 2000T 是因為有很強的工程積累,工程能力很強,用最新的工藝,用最好的 HBM,我相信他是能做出來的。但如果是一個創業公司,工程能力包括資源不如巨頭,想做這樣的東西,通過架構的創新,比如存算一體,是可以用更低的成本去做的。成本上我們希望能做到英偉達一半的成本,但功耗上我覺得存算一體理論上可以做一個數量級的提升,能效比希望至少是 2-5 倍的提升。
張鵬:以前存算一體基本是往可穿戴上做小算力低功耗,后摩智能直接做大算力,難度是不是很大?
吳強:難度是更大的,首先有兩層難度,第一,存算一體首先要解決很多問題,比如數據精度問題,大算力的話,精度要支持 INT8。另外需要解決電路層面的容量問題,因為模型要大,怎么樣把精度做好做高,這是電路設計的問題。
另一個大的難度是大芯片本身除了存算之外也很復雜,一個 AI 處理器如果能處理幾百 T 的算力,那么相應的其他東西也不要大,比如 CPU 怎么設計,除了存算之外,對 vector 的支持和其他的支持,編程的內存怎么做,這些都是大芯片的要求,包括怎么配合編譯器、配合算法、量化怎么做。這些跟存算沒關系,是大芯片本身的復雜度。對人才的要求也高,畢竟中國做大芯片是近幾年開始,這部分的人才也是國內比較缺的。
張鵬:為什么不做云端的算力提升,而是直接做邊緣計算?
吳強:云端相對來說應用場景比較廣,如果做訓練芯片,英偉達的軟件生態壁壘特別厚,這是個挑戰,很多國內創業同行都要面臨這個挑戰。另外云端數據中心有很多應用場景,相對來說對軟件的挑戰會更大。云端對功耗不是那么敏感,畢竟在數據中心你也可以用空調等降溫設備,低功耗當然是個優勢,但不像邊緣端是絕對的優勢。
03、芯片公司的競爭壁壘
是軟件生態
張鵬:如何理解你們宣傳的軟硬解耦?
吳強:這是我們設計芯片的一個理念,我們希望定位為芯片公司,把芯片做得有差異化、有優勢。做自己的工具鏈、編譯器,把這些做好,能夠支持更多客戶,客戶可以有自己不同的算法,各種算法我們都盡可能支持,這就是軟硬解耦,應用層和芯片層盡可能解耦,重點把芯片和編輯器打造得更好。
所以對芯片的通用性要求比較高,這是一個挑戰。怎么支持各種各樣不同的算法、不同的用戶?我們從創業第一天就希望不單是提供算力,還能提供更底層的接口,讓客戶可以自己定義算子,這樣可以在算法上具有更大的空間和自由度。各種各樣的客戶都可以在上面使用我們的芯片,我們的芯片將來的應用場景會更廣闊。這是我們一直堅持的技術方向。
張鵬:軟硬解耦在商業模式上會是一個很大的挑戰嗎?
吳強:我們在中國做芯片除了國產化之外,還提供貼身服務,但貼身服務需要有個度。前面的客戶我們可以用新的東西,幫助客戶一起把整套方案做出來,但是后面的客戶我們希望變成一個標準化的東西,可以用我們很好用的工具鏈,讓客戶自己去做,這樣的芯片公司才能做大,不用每個客戶都投入一堆人人力,這是我們的目標,這樣做的話必須是軟硬解耦,我們一直在朝這個方向努力。
希望慢慢地將整個供應鏈變得很標準化,用最小的支持,能支持更多客戶,客戶才會越來越多,我們也可以不停打磨我們的工具鏈,這是我們一直以來的奮斗目標。
張鵬:還有哪些其它場景是存算一體未來有機會發揮優勢的?
吳強:存算一體的特點是可以把算力用更低的成本方式做大,另外能效比很高,功耗更低。很多場景如果對智能化要求比較高,對算力要求也比較大,同時對功耗比較敏感,比如電池驅動,邊緣端很多都是電池驅動的,這些都是可能的應用場景,說白了是市場需求和產品特性相匹配。
比如無人機需要做一些避障、智能飛行、自動返航等,和其他更高級別的智能化,我們又希望無人機小巧,大疆的很多無人機在 500g 以內,最小的有 250g,電池不大,又要保證續航,算力要求又很大,對功耗也敏感,這就是個天生的矛盾。我們有沒有可能做出一個能效比極致高的大算力芯片,讓即使很小的無人機也可以很智能?哪怕是大無人機,像美團的貨運無人機,功耗低可以讓電池部分承擔更多貨物,而不是用來做計算,這些是可能的應用場景。
包括現在酒店和家庭使用的機器人,大家對于這類服務機器人的智能化需求會越來越多,它們本身也是電池驅動,想提高算力也需要考慮存算一體。甚至還有 VR 設備,作為邊緣設備,由電池驅動,需要做環境感知,也需要算力的支持,這也是一個可能的應用場景。
張鵬:你們的差異化的競爭優勢是什么?
吳強:大芯片領域競爭很激烈,首先是英偉達、高通這樣的國際巨頭,還有一些國內的創業公司走在我們前面。我們要想生存下來,經營策略還是不太一樣。對于巨頭來說,多少有點農村包圍城市的一些想法。
第一,首先是要選擇一個合適的環節,不要碰巨頭最強的部分,這里就包括了產品定位,比如賽道,選云端、選邊緣端、選乘用車、無人車、無人機、機器人、安防等,每個人都會選擇自己比較舒適的賽道。同時又有很多細化的領域,怎么去選擇?巨頭相對薄弱的環節去打,這點很重要,最好選擇相對來說巨頭不太重視的領域,比如說無人車,我們先切入進去,逐漸形成農村包圍城市的概況。
其次是差異化,英偉達在推 2000T 算力的芯片,我們并沒有必要去比拼算力,而是去尋找一些英偉達還沒有解決的或者暫時解決不了的客戶的痛點。比如很多車企希望在中端車上也上大算力芯片,同時對功耗和散熱又比較敏感,這種需求就是英偉達暫時沒有滿足,而我們可以提供的服務。找到差異化,局部做到極致,這也是當年很多互聯網巨頭能夠崛起的原因。
張鵬:如果英偉達這樣的巨頭未來也要做存算一體,你們會怎么應對?
吳強:創業之初很多人問過我這個問題,首先存算一體目前還是比較新的,尤其是大算力相關,基于 SRAM,對我們來說有技術積累,給了我們一個先發優勢。對于英偉達來說,進入一個新的領域,會有自身的一些壁壘。因為它之前所有的積累都是在傳統方式上去做,很多架構上的積累是基于 GPU 的,架構上的積累和軟件上的積累都是在另一個方向。如果轉到存算一體,需要拋棄很多舊的東西,才能進入一個新的領域。后摩沒有這樣的包袱,因為我們是從零開始,本來就一無所有。
英偉達進入這個賽道還會有一段時間,除非他發現存算一體已經可以大規模商業化或者認為對它造成了威脅,這給創業公司帶來一段時間上的先發優勢。
如果有一天英偉達真的要進來,怎么辦?基于 SRAM 的儲存是不是壁壘?基于 RRAM 的儲存是不是壁壘?我的觀點一直是任何技術本身都不是壁壘,只能給你一定的先發優勢。我們在這方面有最長的技術積累,是國內第一個做這些的,我們希望盡快把技術優勢轉化成產品優勢,能拿出一個好的產品,不能是改良款,而是性能上一定要比別人好很多倍,最好是 2-5 倍,別人才愿意嘗試這個芯片。
我們希望能有更好的芯片,解決一個確實的痛點,讓別人愿意嘗試,逐漸用自己的軟件生態作為護城河。真正的護城河不是技術本身,而是軟件生態。我的軟件生態、工具鏈、合作伙伴,這才是真正的護城河,真正的壁壘。有一天像英偉達這樣的巨頭進來,可以有一定的壁壘去阻擋巨頭。
編輯:黃飛
?
評論
查看更多