今天,龍芯中科發(fā)布龍芯4000系列CPU芯片,分別為3A4000和3B4000。性能方面,3A4000/3B4000采用28nm FDSOI工藝,微架構(gòu)為GS464V核心,通用處理性能提升一倍以上,這將成為我國自主CPU發(fā)展史上又一新的里程碑。
據(jù)悉,龍芯4000系列進一步完善對虛擬機的支持,效率達到95%以上。在相同主頻下,龍芯4000系列比3A3000的流水線效率提高50%,主頻提升至1.8GHz-2.0GHz。
龍芯中科總裁、中科院計算技術(shù)研究所總工程師、龍芯CPU首席科學(xué)家胡偉武博士介紹,龍芯4000系列是首次全面集成可信模塊、國內(nèi)密碼算法、訪問控制等安全機制的CPU芯片。
也就是說,龍芯4000系列處理器除了性能大幅提升之外,還擁有片內(nèi)安全機制和高效云化的特點。
據(jù)介紹,龍芯在2019年的芯片出貨量已超50萬顆。未來,龍芯中科將著重提升CPU主頻與核數(shù),3A5000和3C5000兩款芯片將分別計劃在2020年上半年和下半年流片。
▲龍芯中科總裁、中科院計算技術(shù)研究所總工程師、龍芯CPU首席科學(xué)家胡偉武博士
一、我國自主CPU發(fā)展的里程碑
龍芯中科是國產(chǎn)自主高性能通用處理器技術(shù)領(lǐng)先者和產(chǎn)品提供商,搭載龍芯中科CPU的計算機已進入政府采購目錄。
龍芯脫胎于中國科學(xué)院計算所,曾研發(fā)出我國首枚擁有自主知識產(chǎn)權(quán)的通用高性能微處理芯片。
CPU芯片長期被英特爾等國外巨頭所壟斷,龍芯先推出的龍芯1號、龍芯2號,打破了中國缺自主研發(fā)CPU芯片的歷史,是中國形成自主知識產(chǎn)權(quán)計算機產(chǎn)業(yè)道路上的一座里程碑。
從2001年至今,龍芯研發(fā)了龍芯1號、龍芯2號、龍芯3號三個系列處理器和龍芯橋片系列。
龍芯1號系列為32位低功耗、低成本處理器,主要面向低端嵌入式和專用應(yīng)用領(lǐng)域;龍芯2號系列為64位低功耗單核或雙核列處理器,主要面向工控和終端等領(lǐng)域;龍芯3號系列為64位多核系列處理器, 主要面向桌面和服務(wù)器等領(lǐng)域。
今天發(fā)布的龍芯3A4000是龍芯3號系列處理器的最新產(chǎn)品,據(jù)上一代龍芯3A3000發(fā)布已相隔兩年。
2017年時,龍芯年營收達1.5億元,利潤2000多萬元,2018年營收和利潤均比2017年翻番,利潤達到歷史最高水平,交的稅款已超過國家給龍芯各類補助的總和。
胡偉武表示,今年上半年龍芯收入已超過去年全年,利潤是去年全年的1.3倍左右,預(yù)計到2021年,龍芯交給國家的稅將超過之前所有的研發(fā)投入。
二、采用GS464v架構(gòu),實現(xiàn)三大特點
龍芯3A4000是龍芯第三代高性能處理器核,采用新一代處理器架構(gòu)GS464V,擁有雙DDR4-2400/2133內(nèi)存通道,雙HT3.0系統(tǒng)總線,效率提升一倍。
性能方面,其主頻為1.8GHz,睿頻2.0GHz,采用37.5mm*37.5mm封裝工藝,典型功耗為30-40W。
據(jù)胡偉武介紹,龍芯3A4000主要有三方面特點:
1、相同工藝性能成倍提高
龍芯3A4000采用28nm工藝,進一步通過設(shè)計優(yōu)化提升處理器性能,反映傳統(tǒng)桌面性能的SPEC INT2000的單核base分值,從930分提高到了2090分。
此外,它的科學(xué)計算性能與3A3000相比,提升了4倍以上,支持128/256位向量。而3B4000支持四路直連,與3B3000雙路服務(wù)器相比,四路服務(wù)器性能亦提升了4倍。
與此同時,龍芯3A4000的虛擬機效率大幅度提高,從原先的88%提升至98%。胡偉武稱,其單核性能已高于用14nm實現(xiàn)的Arm處理器。
2、片內(nèi)安全機制
龍芯3A4000支持AES、MD5、SHA等加解密算法,片內(nèi)集成安全可信模塊,支持國密算法。
此外,它支持操作系統(tǒng)內(nèi)核棧防護機制,支持IO防護、安全執(zhí)行環(huán)境等訪問控制,其高性能密碼算法服務(wù)能力支持商密及以上算法。
3、自主研發(fā)
龍芯3A4000的所有模塊源代碼和各類全定制模塊均為自主研發(fā),除了廠家提供的標(biāo)準(zhǔn)單元庫和內(nèi)存編譯器(Memory Compiler)外,沒有任何第三方IP。
除此之外,龍芯3A4000在功耗管理和封裝方面也有了進一步提升。
一方面,它第五個核(GS132E)監(jiān)控主核運行,并進行動態(tài)功耗管理。例如,搭載龍芯3A4000的筆記本電腦工作時長比3A3000相比,提高了一倍以上;
另一方面,龍芯3A4000的封裝尺寸比3A3000更小,支持普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支持四層布線。
值得一提的是,龍芯4000系列用于片間互連及連接橋片的HT控制器帶寬提高了一倍以上,內(nèi)存控制器從DDR3升級至DDR4,SPEC CPU2006定點和浮點單核分值提高到20分。
但胡偉武也指出,龍芯4000系列處理器依然存在兩大問題。
一是DDR4內(nèi)存頻率不夠高。DDR4規(guī)定的速率范圍是1600至3200,而龍芯4000系列最高DDR4工作速率為2400/2133,與規(guī)定范圍還存在一定差距。
二是功耗偏大。其非向量模式的典型功耗為30至40W,主要在于工藝不夠先進,設(shè)計優(yōu)化比較極致,建議科學(xué)計算環(huán)境下使用256位浮點向量時,適當(dāng)降低電壓和頻率。
三、未來重點突破主頻與核數(shù)
胡偉武談到,龍芯的下一步將會把研發(fā)重點放在提高主頻與核數(shù)上。
一方面,龍芯3A5000將提高主頻至2.5GHz,采用12nm工藝,單核性能將提高至30分左右,計劃于2020年上半年流片。
同時,其內(nèi)存控制器延遲/寬帶進一步優(yōu)化,LLC增加一倍,實現(xiàn)操作系統(tǒng)級二進制兼容。
另一方面,龍芯3C5000將增加核數(shù),同樣采用12nm工藝,支持4至16路服務(wù)器,計劃將于2020年下半年流片。
在胡偉武看來,目前國內(nèi)CPU企業(yè)發(fā)展核心技術(shù)主要有兩個途徑,一是市場換技術(shù),如汽車產(chǎn)業(yè);二是市場帶技術(shù),如航天產(chǎn)業(yè),而龍芯中科走的則是第二條路。
龍芯中科通過體制內(nèi)市場引導(dǎo),帶動技術(shù)進步后,再進一步參與體制外的市場競爭。同時,龍芯CPU自主編寫CPU源代碼,在應(yīng)用中不斷演進,并注重自主CPU的自主生態(tài)建設(shè),以逐步提高產(chǎn)品性能和完善生態(tài)。
雖然,龍芯發(fā)展至今已經(jīng)為我國半導(dǎo)體產(chǎn)業(yè)的崛起提供了不可或缺的力量。但胡偉武認為,我國自主CPU與國外先進水平相比,在通用處理能力、單核性能和設(shè)計能力三大方面還存在較大差距。
“龍芯需要練好內(nèi)功,通過設(shè)計優(yōu)化提高單核通用處理性能?!焙鷤ノ湔f到,3A4000和3B4000已基本填補單核通用處理性能的缺陷,性能提高2至3倍(約20-30分),達到AMD的水平。
而目前,市場主流CPU使用GCC編譯的單核分值為20至40分。
四、龍芯操作系統(tǒng)支持軟件生態(tài)建設(shè)
胡偉武談到,龍芯的操作系統(tǒng)目前具有兩種商業(yè)和技術(shù)模式。
面向?qū)iT企業(yè),龍芯提供桌面和Windows服務(wù)器系統(tǒng);面向設(shè)備企業(yè),龍芯則基于基礎(chǔ)版開源OS維護,支持OS、整機和應(yīng)用企業(yè)。
實際上,龍芯已面向三大不同的平臺開發(fā)相應(yīng)的操作系統(tǒng):
1、面向通用信息化系統(tǒng)的Loongnix。該系統(tǒng)基于通用Linux平臺進行完善和優(yōu)化,為統(tǒng)一操作系統(tǒng)UOS龍芯版提供支撐。
2、面向高可靠實時終端的LoongOS。該系統(tǒng)基于Linux/RT-Linux構(gòu)建了簡潔高效的OS。
3、面向?qū)崟r嵌入式應(yīng)用的LoongWorks。該系統(tǒng)針對歷史應(yīng)用,基于VxWorks內(nèi)核,完善圖形和網(wǎng)絡(luò)等API。
另一角度看,龍芯操作系統(tǒng)針對不同的硬件和應(yīng)用,亦分別提出了兩種不同的二進制兼容。
除此之外,胡偉武也提到,龍芯將進一步統(tǒng)一系統(tǒng)架構(gòu),構(gòu)建標(biāo)準(zhǔn)規(guī)范體系,實現(xiàn)操作系統(tǒng)跨主板整機兼容和CPU代際兼容。
從龍芯3A4000開始,龍芯也將參考設(shè)計全面支持統(tǒng)一系統(tǒng)架構(gòu),開發(fā)支持ACPI主板、固件、內(nèi)核及OS的參考設(shè)計,以及基于ACPI/EC筆記本標(biāo)準(zhǔn)的解決方案。
結(jié)語:我國自主CPU研發(fā)的里程碑
龍芯中科經(jīng)過近二十年的發(fā)展,已經(jīng)成為我國國產(chǎn)自主高性能通用處理器的技術(shù)領(lǐng)先者,不僅打破了我國缺乏自主研發(fā)CPU芯片的歷史,同時也是我國形成自主知識產(chǎn)權(quán)計算機產(chǎn)業(yè)道路上的一座里程碑。
近二十年來,龍芯的自主CPU和OS已經(jīng)趨于成熟。胡偉武稱,龍芯CPU單核通用處理性能已達到AMD水平,OS成熟度也已接近Windows XP。
然而,龍芯尚未豐富的應(yīng)用和產(chǎn)業(yè)不配套,無疑是擺在自主CPU和OS未來發(fā)展道路上的一個阻礙。未來,龍芯如何完善基礎(chǔ)軟件環(huán)境和配套芯片,推動CPU和OS生態(tài)的進一步成熟發(fā)展,這十分值得我們期待。
評論
查看更多