以前設計一個產(chǎn)品,先要規(guī)劃好硬件架構,等硬件設計全部完成后,才會開始軟件部分的開發(fā),然后才是完整產(chǎn)品的發(fā)布。現(xiàn)在,隨著云計算、互聯(lián)網(wǎng)的發(fā)展,以及AI、5G和自動駕駛的興起,硬件和產(chǎn)品的開發(fā)流程需求在發(fā)生著前所未有的變化,比如更高的硬件性能;更高的安全和保密需求;不斷增加的傳感器類型和接口;不斷演進的AI算法和模型;以及軟件開發(fā)需要與硬件開發(fā)同步進行等等。
在這些新需求的推動下,“軟件定義硬件”的概念被人多次提到,人們希望芯片中所有操作的控制和調(diào)度都由軟件來完成,從而減少相應的硬件開銷,把節(jié)省的部分用于運算和片上存儲。這個愿望看起來很美好,但實現(xiàn)起來還是有不少難度的,比如FPGA可以實現(xiàn)一部分的軟件定義硬件功能,但其效率比ASIC低,功耗卻比ASIC高。那有沒有什么更好的辦法呢?
自適應平臺的優(yōu)勢
賽靈思的自適應計算平臺就是為此而生的。根據(jù)賽靈思的自適應計算白皮書和自適應計算專區(qū),自適應計算以FPGA技術為基礎,支持在芯片上動態(tài)構建特定領域架構(DSA)。也就是說,自適應計算允許DSA隨需求變化進行動態(tài)更新,從而避免受到漫長的ASIC設計周期和高昂的NRE成本的約束。隨著處理的分布式水平不斷提高,自適應計算不僅能夠支持軟件的無線(OTA)更新,也支持硬件無線更新,而且更新可以幾乎無線的次數(shù)反復進行。
“自適應平臺”則指以自適應硬件為核心的任意類型產(chǎn)品或解決方案。自適應平臺完全基于相同的自適應硬件基礎,但其包含的內(nèi)容遠不止芯片硬件或器件,而是涵蓋了全部的硬件和全面的成套設計軟件和運行軟件。
有了自適應平臺后,硬件工程師可以從那些重復和低端的設計工作中解放出來,專注于自己擅長的專業(yè)功能的開發(fā),軟件工程師則可以跟硬件工程師同一時間開始設計工作,而不需要等到所有硬件全部設計好之后才開始工作。
當然,除了這個好處之外,自適應平臺還有以下一些優(yōu)勢:
一是加快產(chǎn)品上市進程。比如賽靈思的其中一個自適應計算平臺產(chǎn)品Alveo數(shù)據(jù)中心加速器卡,使用該加速卡來構建的應用,能為特定應用加速,而不需要特別的硬件定制。且只需將PCIe卡添加到服務,就可以從現(xiàn)有的軟件應用中直接調(diào)用加速庫。
二是可以降低運營成本。與基于 CPU 的解決方案相比,由于計算密度的提升,基于自適應平臺的優(yōu)化應用能在每節(jié)點提供大幅提高的效率。
三是可靈活且動態(tài)地配置工作負載。自適應平臺可根據(jù)當前需求重新配置。開發(fā)者可以在自適應平臺內(nèi)輕松切換已部署應用,使用相同設備即可滿足不斷變化的工作負載需求。
四是能兼容未來。自適應平臺能不斷進行調(diào)整。如果現(xiàn)有應用需要新的功能,則可以對硬件重新編程,以最佳方式實現(xiàn)這些功能,減少硬件升級需求,進而延長系統(tǒng)使用壽命。
五是可加速整體應用。因為AI推斷很少單獨存在,一般是更大的數(shù)據(jù)分析與處理鏈條的組成部分,往往與使用傳統(tǒng)(非AI)實現(xiàn)方案的多個上游級和下游級并存。這些系統(tǒng)中的嵌入式AI部分得益于AI加速,而非AI部分也能從加速中獲益。自適應計算的天然靈活性適合為AI和非AI處理任務進行加速,稱之為“整體應用加速”。隨著計算密集型AI推斷滲透到更多應用中,其重要性也在日益提升。
自適應計算的成功落地案例
以前,工程師如果要使用FPGA,就需要自己構建自己的硬件板,并用硬件描述語言(HDL)配置好FGPA才行。如今,自適應平臺的開發(fā)者只需要使用自己熟悉的軟件框架和語言(比如C++、Python、TensorFlow等),直接發(fā)揮自適應計算的效能。也就是說,軟件和AI開發(fā)者不需要構建電路板,或者成為硬件專家,就能自如地運用自適應計算。
更為方便的是,工程師不僅可以通過API直接調(diào)用他們現(xiàn)有的軟件代碼,還可以使用獨立軟件供應商(ISV)生態(tài)系統(tǒng)和廠商提供的開源庫,庫里有大量的加速API可供使用。
以賽靈思已經(jīng)量產(chǎn)的兩款自適應計算平臺產(chǎn)品Kria SOM和Alveo加速器卡為例。Kria SOM基于Zynq UltraScale+ MPSoC 架構而構建,支持開發(fā)者在交鑰匙自適應平臺上開發(fā)邊緣應用。通過將系統(tǒng)的核心部分標準化,開發(fā)者有更多時間專注于打造差異化功能特性。
賽靈思首款量產(chǎn)的Kria SOM產(chǎn)品就是K26 SOM,硬件配置方面,K26 SOM基于Zynq UltraScale+ MPSoC架構設計,整體尺寸為77×60×11mm,搭載四核Arm A53處理器,內(nèi)置64位4GB的DDR4內(nèi)存,擁有256K系統(tǒng)邏輯單元和1.4TOPS AI處理器性能,支持4K 60p的H.264/265視頻編解碼器。
Kria SOM是作為量產(chǎn)就緒型的產(chǎn)品來設計、制造和測試的,它可以承受各種嚴苛的應用環(huán)境。目前Kria SOM分為工業(yè)級和商用級兩種類別,工業(yè)級支持更高的振動和更極端的溫度,同時也有更長的生命周期等級和維保。
Kria SOM主要針對智能視覺的應用,因此,它可以用于智慧城市中的高速目標檢測,比如車牌識別等應用;同時,它也可以用于工業(yè)產(chǎn)線上的機器視覺應用。
對于Alveo 加速器卡,它采用行業(yè)標準的PCI-e接口,可為任意數(shù)據(jù)中心應用提供硬件卸載能力,同時還可用于SmartSSD存儲,在存儲訪問點上進行加速。此外,還能用于SmartNIC,直接在網(wǎng)絡流量上提供加速。
比如Alveo SN1000 SmartNIC,它擴展了SmartNIC的性能包絡,其以數(shù)據(jù)中心和邊緣計算平臺為目標,結(jié)合了高性能網(wǎng)絡、CPU集群和大規(guī)模FPGA,在一塊板子上構建了一個高性能計算(HPC)平臺,具有顯著的網(wǎng)絡加速功能。
此外,Alveo SN1000 SmartNIC采用標準化和軟件框架,不需要直接處理FPGA的編程,使用更加方便。工程師可以利用賽靈思或第三方支持FPGA中使用的大部分固件,甚至CPU集群上運行的軟件。CPU集群可運行標準的Linux發(fā)行版,如Ubuntu和Yocto Linux。SmartNIC驅(qū)動程序可用于Red Hat Enterprise Linux (RHEL)、CentOS和Ubuntu等主機平臺。
在應用方面,Alveo適用于基因組學分析、圖形數(shù)據(jù)庫、醫(yī)療影像的處理分析,以及基于視頻影像監(jiān)控類應用。在應用落地方面,已經(jīng)有數(shù)據(jù)中心及基因測序應用方面都有應用。
結(jié)語
軟件正在改變硬件,軟硬件的結(jié)合發(fā)展將會改變產(chǎn)品的形態(tài),進一步改變我們的生活。雖然現(xiàn)在軟件定義硬件并沒有大規(guī)模鋪開,但不論從我們常用的手機應用,到工業(yè)應用,以及自適應計算平臺中軟件的作用,我們可以明顯看到軟件在產(chǎn)品中所起到的作用越來越大。未來自適應計算平臺必將加速軟件定義硬件時代的到來。
編輯:jq
-
芯片
+關注
關注
455文章
50756瀏覽量
423335 -
asic
+關注
關注
34文章
1200瀏覽量
120457 -
cpu
+關注
關注
68文章
10858瀏覽量
211643 -
加速器
+關注
關注
2文章
799瀏覽量
37853 -
OTA
+關注
關注
7文章
580瀏覽量
35209
原文標題:自適應計算加速軟件定義硬件時代到來
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論