大灣區(qū)沖出一家AI芯片創(chuàng)企,研發(fā)“六邊形戰(zhàn)士”,叫板英偉達。
蟄伏六年后,這家清華系A(chǔ)I芯片創(chuàng)企終于開始在國產(chǎn)GPGPU江湖高頻出場。
今年4月,國內(nèi)首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8亮相,現(xiàn)已小規(guī)模量產(chǎn)。其背后的珠海GPU芯片創(chuàng)企芯動力,就此浮出水面。
芯動力創(chuàng)始人、CEO李原是一位芯片連續(xù)創(chuàng)業(yè)者。他1989年本科畢業(yè)于清華大學(xué)物理系,隨后任職于英特爾、德州儀器等芯片巨頭。在英特爾任職期間,他曾開發(fā)至強CPU服務(wù)器系統(tǒng),擁有從產(chǎn)品定義、量產(chǎn)到商用的全鏈條經(jīng)驗。
從德州儀器辭職后,李原2008年在美國加州創(chuàng)立IPG Communications,承接通訊基站大型芯片設(shè)計項目。IPG獨創(chuàng)的Turbo譯碼器被英特爾應(yīng)用于其至強處理器。這家公司后來被美國老牌通信芯片商敏訊科技(MindSpeed)收購,敏訊科技的無線業(yè)務(wù)又在2013年被英特爾收購。
就在英偉達提出GPGPU新概念的前后腳,李原也開始琢磨類似的思路,即如何在發(fā)揮GPU并行計算能力和通用性優(yōu)勢的同時,通過引入其他類架構(gòu)的長處,研發(fā)出能更好平衡性能、功耗、成本、延遲、部署速度的硬件。從2011年到2016年,經(jīng)過長達六年的摸索,他們團隊獨創(chuàng)了一個將NPU的高效率與GPU的高通用性相結(jié)合的創(chuàng)新架構(gòu)——可重構(gòu)并行處理器架構(gòu)(RPP)。
他為何早早選擇進入GPGPU賽道創(chuàng)業(yè)?又如何組建團隊,將芯動力RPP架構(gòu)從圖紙中的創(chuàng)新設(shè)想,變成了在實際應(yīng)用場景中發(fā)揮價值的硬件?在這外部環(huán)境復(fù)雜多變的五年之間,他對AI芯片及GPU行業(yè)的發(fā)展脈絡(luò)與方向有哪些新的感悟與思考?近日,芯東西與這位國內(nèi)GPGPU領(lǐng)域的創(chuàng)業(yè)代表人物進行了深入交流。
01.清華物理系校友創(chuàng)業(yè)已在半導(dǎo)體領(lǐng)域深耕19年
創(chuàng)立芯動力之際,李原早已是一位入局半導(dǎo)體行業(yè)19年之久的資深老兵。
1989年,他從清華大學(xué)物理系本科畢業(yè)后,接連遠(yuǎn)赴日本、加拿大進修無線通信專業(yè)。2004年,李原入職德州儀器,主攻通訊系統(tǒng)研發(fā),在這里,他和芯動力的另一位聯(lián)合創(chuàng)始人、當(dāng)時已是德州儀器資深硬件工程師的朱建斌相識,這為多年后芯動力核心團隊的組建奠定了基礎(chǔ)。 當(dāng)李原第一次籌備創(chuàng)業(yè)期間,朱建斌主動提出要轉(zhuǎn)到芯片設(shè)計行業(yè),并要從一位硬件工程師跨界成算法工程師,這令李原感到“有點不可思議”。朱建斌很快憑借其出色的學(xué)習(xí)能力、抗壓能力證明了自己,李原的創(chuàng)業(yè)團隊也組建就緒。 2008年,李原、朱建斌以及幾位來自德州儀器的同事共同創(chuàng)業(yè),在美國加州創(chuàng)辦了一家無線通信芯片公司IPG Communications。 他們的初始目標(biāo)很簡單,先靠創(chuàng)業(yè)生存下來,再換個視角觀察整個半導(dǎo)體行業(yè)。IPG創(chuàng)立后不久就承接設(shè)計了休斯頓衛(wèi)星GlobalStar系統(tǒng)的通訊芯片,自研的Turbo譯碼器被英特爾應(yīng)用至其至強處理器,隨后在2011年順利被美國老牌通信芯片商敏訊科技(MindSpeed)收購。
▲芯動力發(fā)展歷程
這一次創(chuàng)業(yè),也讓李原對半導(dǎo)體產(chǎn)業(yè)的認(rèn)識更加深刻,他們發(fā)現(xiàn)幾個特點:
半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈綿長,芯片設(shè)計公司就是其中的靈魂。
半導(dǎo)體行業(yè)全球競爭激烈,中小規(guī)模的公司不停被兼并、收購,很多從業(yè)人士被迫改行。李原的觀點是,不能這樣,“我們要逆流而上,要去看一看不同的風(fēng)景”。
競爭激烈的行業(yè)共識后,他們還意識到,一旦在半導(dǎo)體行業(yè)里處于領(lǐng)先地位,企業(yè)就能獲得巨大市場。最后可能形成第一家公司供應(yīng)產(chǎn)品,第二家公司艱難競爭,第三家公司基本不存在的現(xiàn)象。
因此,第二次創(chuàng)業(yè),李原和團隊的目標(biāo)就是:“我們應(yīng)該成為一家什么樣的公司才有可能存活下來。”
2011年,他們把各種各樣不同種類的芯片擺到一張圖上,他們發(fā)現(xiàn)其中有一個很大的空缺,在常見的CPU、GPU、DSP,以及專用的通信芯片之外,還有一類芯片的位置空缺,未被發(fā)現(xiàn)。
在這個空白處畫下的大大的問號,成為芯動力創(chuàng)立的起點。經(jīng)過5年的探索,2016年他們找到了答案——可重構(gòu)并行處理器架構(gòu)。基于這一創(chuàng)新架構(gòu),李原等人先是在美國成立了公司,2017年轉(zhuǎn)回國內(nèi),在珠海創(chuàng)立芯動力公司。
02.研發(fā)“六邊形戰(zhàn)士”處理器已實現(xiàn)千片級小規(guī)模量產(chǎn)
芯動力剛剛成立,李原曾問過朱建斌一個問題:什么樣的節(jié)點代表他們做的事情成功了?朱建斌的答案是:“我們只要把這顆芯片真的做出來,達到了我們預(yù)期的性能指標(biāo)。”
今年他們迎來了這一時刻。4月,芯動力發(fā)布首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8。
RPP-R8每顆芯片內(nèi)含有1024個計算核,相比傳統(tǒng)GPU架構(gòu)在同樣的算力占用更小的芯片面積,實現(xiàn)了低功耗和高能效的有效平衡。RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達到同類產(chǎn)品的7~10倍,能效比也超過3倍,可滿足高效并行計算及AI計算應(yīng)用。
▲GPU和RPP架構(gòu)性能比較
這顆芯片于2020年一次性流片成功,李原透露,RPP-R8目前實現(xiàn)上千片級小規(guī)模量產(chǎn),并且已經(jīng)進行大規(guī)模測試,之后他們會根據(jù)客戶反饋進行產(chǎn)品修正,再繼續(xù)下一個產(chǎn)品研發(fā)。
事實上,基于RPP架構(gòu)的芯片成果做出來,在成立時的他們看來是不可能的事情。
這背后的原因可以先從現(xiàn)在的三大GPGPU技術(shù)流派來看,第一類較多公司采用的是在比較成熟的GPU架構(gòu)之上,構(gòu)建矩陣計算的能力;第二類是純粹基于可重構(gòu)技術(shù)來做;第三類是將可重構(gòu)技術(shù)與GPU編程模型CUDA語言相結(jié)合。
芯動力選擇的即是第三類。李原解釋說,主要有兩大技術(shù)原因,首先選擇可重構(gòu)技術(shù)是因為,采用傳統(tǒng)GPU架構(gòu)很難追齊行業(yè)頭部玩家,因此他們需要尋找更好的技術(shù);其次,與CUDA語言相結(jié)合是因為其可擴展且廣為行業(yè)所接受。
走一條全新的路徑,也意味著他們一定程度上需要從0開始。李原談道,最難的地方就在于,不僅要創(chuàng)新,還要達到市場的需求。
RPP架構(gòu)是針對并行計算設(shè)計的芯片架構(gòu),芯動力將其稱作“六邊形戰(zhàn)士”。這一架構(gòu)既結(jié)合了NPU的高效率與GPU的高通用性優(yōu)勢,還支持實時操作系統(tǒng)(RTOS),具備DSP的低延時,可滿足高效并行計算及AI計算應(yīng)用,大大提高了系統(tǒng)的實時性和響應(yīng)速度。
芯動力同樣制程下的GPGPU芯片,與英偉達相比,在一些場景下性能提高達50%,且面積為類似芯片的1/7,功耗僅為其1/2-1/3。
這背后離不開芯動力的研發(fā)團隊,其核心成員有平均年限超過15年的資深半導(dǎo)體從業(yè)背景,且均來自英特爾、高通、德州儀器、聯(lián)發(fā)科等半導(dǎo)體知名企業(yè),研發(fā)人員占比超過80%。
時至今日,當(dāng)李原再次問到什么是最大的成功時,朱建斌已經(jīng)忘記了當(dāng)初的說法,他的回答變成了:“我們把它在商業(yè)上做到成功,我們把這個事情變成一個客戶喜歡的商品,這樣才是真的成功。”
03.第一家客戶是銀行率先落地三大應(yīng)用場景
李原也一直在為做“客戶喜歡的商品”而努力。
芯動力GPGPU芯片的第一家客戶是一家銀行。李原認(rèn)為,芯片行業(yè)周期長,因此芯片設(shè)計必須按照產(chǎn)品需求來設(shè)計,否則芯片公司拿出的產(chǎn)品很容易因市場需求變化而被淘汰。
因此2017年以后,芯動力團隊花了很長一段時間進行市場調(diào)研,調(diào)研結(jié)果與這家銀行的需求不謀而合。銀行希望將智能攝像頭的“智能”和“攝像頭”區(qū)分開,邊緣算力盒子可以獨立于攝像頭進行升級迭代。
李原談道,這也是他們與同類企業(yè)在市場策略上的不同之處——更加強調(diào)對于客戶需求的分析。
在這個過程中,他們將客戶分為三層,終端用戶、軟件集成商、硬件集成商。其中,關(guān)注設(shè)備功能的終端用戶目前不在芯動力的合作伙伴之列。
目前,他們采用的策略是,與軟件集成商合作先拿到市場,贏得硬件集成商的認(rèn)同,進一步推廣芯片產(chǎn)品。
芯動力的產(chǎn)品已經(jīng)在邊緣計算領(lǐng)域與銀行、通訊領(lǐng)域與醫(yī)療超聲波方向、AI方向的高性能計算等領(lǐng)域?qū)崿F(xiàn)應(yīng)用。
作為產(chǎn)業(yè)鏈的上游玩家,芯片行業(yè)的封裝、模組、軟件、芯片本身領(lǐng)域都會影響到相關(guān)芯片企業(yè)研發(fā)或者進入新領(lǐng)域的動作,因此,芯動力目前的策略是把現(xiàn)存的幾個方向做扎實,按照節(jié)奏來走。
在公司的未來規(guī)劃中,李原有一個最為清晰的原則,那就是“技術(shù)是有邊界的”。放到RPP架構(gòu)中來說,就是這一架構(gòu)只做適合的并行計算,不會做串行計算。
從任職大廠到自主創(chuàng)業(yè)、從半導(dǎo)體老兵到創(chuàng)企CEO,這些此前的工作經(jīng)歷及身份的轉(zhuǎn)變,幫助李原為芯動力一步步確立起了清晰的技術(shù)路線和應(yīng)用方向等。他說,最大的改變是視野不同。創(chuàng)業(yè)之前,有限的視野讓他產(chǎn)生諸多困惑,例如自己到底在做什么,做的東西有沒有用;創(chuàng)業(yè)之后,會更關(guān)注眼前的困惑,更加重視現(xiàn)在的產(chǎn)品。
04.GPGPU賽道競爭激烈必須在細(xì)分賽道拿下第一
針對當(dāng)前國內(nèi)GPGPU產(chǎn)業(yè),李原反復(fù)提及四個字:競爭激烈。
國內(nèi)相關(guān)創(chuàng)企迎著半導(dǎo)體熱潮涌入GPGPU賽道,李原認(rèn)為,想要在這條賽道活下來,企業(yè)必須拿出產(chǎn)品驗證自己存在的價值,在某一些方面超過英偉達,做到英偉達做不到的事。
英偉達這個強大的競爭對手,也是國內(nèi)GPGPU芯片走向落地的最大攔路虎。李原感慨道,最高端,英偉達的A100、H100芯片擁有市場其它芯片無法匹敵的能力;最低端,英偉達的芯片同樣在性能、價格上有競爭力。
面對這一勁敵,李原認(rèn)為,全球競爭激烈的半導(dǎo)體產(chǎn)業(yè)中,他們必須超過第一位,成為這個賽道的龍頭,才有可能生存下來。想要和英偉達競爭,就要先從與之不同的行業(yè)切入。他補充道,英偉達雖然有不同產(chǎn)品,但不見得其產(chǎn)品在每個行業(yè)都無可替代。深耕這些行業(yè),使得產(chǎn)品在性能、價格上擁有競爭力是芯動力目前最重要的事情。
此外,當(dāng)下大模型狂潮席卷,GPU缺貨風(fēng)波不斷,也為GPGPU產(chǎn)業(yè)帶來了很好的機會。在李原看來,主要有兩個方向:
首先是AI訓(xùn)練,參數(shù)規(guī)模龐大的大型語言模型,需要強大的計算能力,國內(nèi)創(chuàng)企未來的技術(shù)演進或許能滿足這一需求。不過,目前而言,英偉達在這一方向的領(lǐng)先性鮮少有企業(yè)可以與之抗衡。
其次是應(yīng)用部分,大型語言模型在應(yīng)用端的計算需求,一般芯片也可以滿足,因此這對于國內(nèi)創(chuàng)企而言是一個巨大的機會。即便大型語言模型距離未來真正落到某一個場景還有一段距離,但李原對這個方向十分樂觀,其現(xiàn)在面臨的局限性未來有機會被打破。
就芯動力而言,他認(rèn)為,大型語言模型呈現(xiàn)出的能力和人相比還有一段距離,芯動力會在自己的技術(shù)上做一些思考,如何找到創(chuàng)新的芯片架構(gòu)路徑,使得大型語言模型性能達到替代人的地步。
最后,在半導(dǎo)體行業(yè)的漫漫創(chuàng)業(yè)路中,李原說:“要保持樂觀。”他和團隊選擇了一條艱難的路創(chuàng)業(yè),正因為他們沒有在整個半導(dǎo)體行業(yè)走下坡路時放棄,現(xiàn)在也幸運地碰到了其中為數(shù)不多蓬勃發(fā)展的好機會。
05.結(jié)語:國產(chǎn)GPGPU新秀發(fā)力核心團隊離不開三大要素
GPGPU將GPU的應(yīng)用范圍擴展到了圖形計算之外,在眾多大規(guī)模并行計算中得到了廣泛的應(yīng)用。今年芯片實現(xiàn)小規(guī)模量產(chǎn)的芯動力開始在這一領(lǐng)域嶄露頭角。
李原總結(jié)了芯動力核心研發(fā)團隊具備的幾大核心要素: 首先要有資深從業(yè)背景,芯動力的研發(fā)團隊準(zhǔn)入門檻非常高,有熟練研發(fā)經(jīng)驗、善于從事這一行業(yè)的工作,是最起碼的要求。 其次,要對新技術(shù)保持開放的心態(tài),他說:“當(dāng)我們把這件事情做的很好的時候,我們往往會給自己畫地為牢,走出來是很難的。” 第三,研發(fā)團隊要有激情,遇到挑戰(zhàn)不低頭。芯動力選擇的路線是沒人做過的事情,因此挫折往往更多。 對于GPGPU賽道則更為艱難,英偉達身處霸主地位已經(jīng)成為業(yè)界共識,另辟蹊徑的芯動力或許有望通過“六邊形戰(zhàn)士”的RPP架構(gòu),在部分特定能力上做到超越英偉達。
在今年9月14日-15日舉行的2023全球AI芯片峰會期間,李原將對RPP芯片架構(gòu)給AI芯片帶來的發(fā)展前景及機遇進行深入解讀,分享這一架構(gòu)在適配各種不同AI算法和應(yīng)用場景方面的通用性,以及如何為AI企業(yè)提供強大的計算能力,推動AI產(chǎn)品的應(yīng)用落地。
-
芯片
+關(guān)注
關(guān)注
455文章
50726瀏覽量
423177 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9125瀏覽量
85335 -
通訊基站
+關(guān)注
關(guān)注
0文章
2瀏覽量
64
原文標(biāo)題:珠海誕生的GPGPU新勢力!清華系芯片老兵創(chuàng)業(yè),首款芯片已量產(chǎn)
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論