任何事物一旦進入泡沫期,就不免讓人擔心什么時候會崩盤,而當下的 AI 芯片已經(jīng)進入公認的泡沫期。
從 ASPLOS'14 上寒武紀的 DianNao,到當下 Google 的 TPUv3,AI 芯片只花了五年時間就取得了巨大的成功。搭上 AI 算力爆發(fā)的快車道,叫嚷著摩爾定律終結(jié),Domain Specific Architecture(領域定制架構(gòu)) 似乎成了唯一的出路。
可是當無數(shù)的巨頭和初創(chuàng)公司設計出一塊又一塊大同小異的 AI 芯片,我們需要回答這樣一個問題:真的需要這么多 AI 芯片嗎?
軟件復雜度
AI 芯片的快速發(fā)展,其中一個回避不了的問題就是軟件復雜度的指數(shù)級提升。很多公司花了兩年甚至更短的時間做出一款芯片,卻發(fā)現(xiàn)需要更長的時間支持繁多的框架、緊跟算法的進步,適配從手機到數(shù)據(jù)中心的各類平臺。當錯過了部署和量產(chǎn)的窗口期,即便做出了芯片也會很快落伍。與設計通用架構(gòu)不同,設計 AI 芯片這樣的專用架構(gòu)需要同時考慮到軟件的設計和優(yōu)化。芯片公司往往樂觀估計了軟件適配和優(yōu)化的成本,指望通過中間件和編譯器來解決所有問題。事實上,從 Intel 到 Google 再到 Nvidia,大量的軟件工程師正被投入到適配各種平臺,手動優(yōu)化網(wǎng)絡性能當中。而對于初創(chuàng)公司,芯片早已 tapeout 卻一再延期交付的問題比比皆是。
從本質(zhì)來看,當我們開始不斷挖掘芯片架構(gòu)的潛力時,軟件層的抽象也會變的越來越困難,因為其不得不在上層抽象中引入底層的架構(gòu)的模型或參數(shù)。現(xiàn)在的通常做法是做底層芯片架構(gòu)與上層軟件之間的中間件,然而開發(fā)這些中間件的代價也往往被低估。前段時間某芯片初創(chuàng)公司的同學咨詢我,開發(fā)一套類似 TensorRT 這樣的 Inference 中間件需要多少人力和多長時間?這并不是一個容易回答的問題,于是我反問他們有多少資源可以做這個項目。
令人意外的是,他的老板只給了三四個人頭,因為他們假設自己已經(jīng)有了一套底層的編譯器和一套上層的模型轉(zhuǎn)換工具,于是這樣一個用于架構(gòu)抽象的中間件并不需要太大力氣。我猜這樣的投入應該可以做出一個功能完好的產(chǎn)品,但我不相信最終的產(chǎn)品在實際應用中可以達到理想的性能指標,畢竟做芯片并不只是用來跑 ResNet-50 這樣的 Benchmark。
碎片化
只需要編寫一套代碼即可運行在不同平臺,是軟件工程師們的長久訴求。不同架構(gòu)的 AI 芯片帶來的碎片化會極大的打擊他們在實際軟件產(chǎn)品中應用 AI 的積極性。與以往的經(jīng)驗不同,深度學習糟糕的解釋性會帶來許多意想不到的缺陷。比如這樣一個常見的困擾,一個私有的模型可以在本地 CPU 上得到滿意的結(jié)果,然而卻在部署到某款設備后性能大幅下降。如何調(diào)試這些問題,誰來負責調(diào)試,通過怎樣的工具來調(diào)試,甚至調(diào)試的工程師能否拿到私有的模型?這些問題都難以回答。碎片化還表現(xiàn)在,專有架構(gòu)為了挖掘絕對性能往往會放棄向前兼容性。如上文提到的中間件,它的一端是碎片化的 AI 軟件框架,另一端則是一代又一代的芯片架構(gòu)。如何同時維護多個部分不兼容的指令集架構(gòu),并保證每一次軟件更新都能完整的覆蓋所有的設備?除了投入更多的人力,別無他法。一個常見的論調(diào)是像當下的消費級芯片一樣只保持一個短期的(2-3年的)軟件支持,然而當下 AI 芯片的常見應用領域,如智能攝像頭、工業(yè)智能、以及自動駕駛,一款芯片的生命周期可能長達十年。很難想象一家公司需要多大的量級才能提供持久的技術(shù)支持,如果預估一家初創(chuàng)公司活不過兩三年,如何才能放心的部署其產(chǎn)品到一款面向消費者的量產(chǎn)車上?
AI 芯片只是過渡期產(chǎn)物
從一個軟件工程師的角度,我個人堅信定制化的 AI 處理器只會是一個過渡期產(chǎn)物。一個統(tǒng)一的、可編程的、高并發(fā)的架構(gòu)才應該是我們追求的方向。回想過去的二十年,我們見證了專用架構(gòu)的小型機市場的萎縮,圖形處理器到通用向量處理器的發(fā)展,甚至連我們的手機和電腦的平臺都將趨于統(tǒng)一。有理由相信,現(xiàn)在再把資源投入到定制化的 AI 芯片絕不是一個好的投資。來源:知乎 Max Lv
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
芯片
+關(guān)注
關(guān)注
455文章
50731瀏覽量
423195 -
AI
+關(guān)注
關(guān)注
87文章
30759瀏覽量
268903 -
人工智能
+關(guān)注
關(guān)注
1791文章
47206瀏覽量
238279 -
架構(gòu)
+關(guān)注
關(guān)注
1文章
513瀏覽量
25468 -
軟件框架
+關(guān)注
關(guān)注
0文章
21瀏覽量
9864
發(fā)布評論請先 登錄
相關(guān)推薦
DAC5681z從FPGA讀數(shù)據(jù),為什么還需要一個DCLKP/N呢?
以DAC5681z為例,DAC芯片從FPGA讀數(shù)據(jù),然后按照自己的采樣速率CLKIN/CLKINC 每隔16bit轉(zhuǎn)換成1個電平值,為什么還需要一個DCLKP/N呢?
發(fā)表于 12-11 07:52
電機控制使用AMC1200或AMC1306等芯片,在線上采樣電流時是否還需要做PWM的觸發(fā)同步?
電機控制使用AMC1200或AMC1306等芯片,在線上采樣電流時是否還需要做PWM的觸發(fā)同步?
在線上采樣電流,電流應該是連續(xù)的,是否能一直讀取電流信號而忽略PWM的開關(guān)時刻。
如果這么做,是否有必要擔心大功率的開關(guān)噪聲會影響電流采樣
發(fā)表于 12-10 08:12
含有內(nèi)部ESD保護的運放,外部保護還需要加嗎?
含有內(nèi)部ESD保護的運放,外部保護還需要加嗎?因為加外部ESD保護有一定的漏電流存在,
這個會使電路失去一定的精度
發(fā)表于 09-04 06:54
新思科技探索AI+EDA的更多可能性
芯片設計復雜性的快速指數(shù)級增長給開發(fā)者帶來了巨大的挑戰(zhàn),整個行業(yè)不僅要向埃米級發(fā)展、Muiti-Die系統(tǒng)和工藝節(jié)點遷移所帶來的挑戰(zhàn),還需要應對愈加緊迫的上市時間目標、不斷增加的制造測試成本以及人才短缺等問題。早在AI大熱之前,
有了MES、ERP,為什么還需要QMS?
? 有了MES、ERP,質(zhì)量管理為什么還需要QMS? ?在制造業(yè),質(zhì)量管理始終是企業(yè)管理中永恒的主題。品質(zhì)管理要想做得更好,企業(yè)必須掌握足夠多、足夠有用的數(shù)據(jù)和信息,實現(xiàn)質(zhì)量管理信息化。很多中小企業(yè)
大數(shù)據(jù)起步之前我們還需要注意些什么?
超級傳感器的企業(yè)就意味著其掌握了對大數(shù)據(jù)應用至關(guān)重要的用戶信息數(shù)據(jù)。那么,在真正開始其大數(shù)據(jù)應用之前,我們還需要在起步時注意些什么? 創(chuàng)意比技術(shù)更重要 在談到大數(shù)據(jù)時很多人會把它看作是一個技術(shù)問題,其實這是
使用esp32c3開發(fā)matter時,開發(fā)好的產(chǎn)品還需要走matter官方認證流程獲得認證嗎?
使用esp32c3開發(fā)matter時,(SDK使用esp-matter),使用這個芯片開發(fā)matter的話,開發(fā)好的產(chǎn)品還需要走matter官方認證流程獲得認證嗎?詢問其他人時他們說是需要經(jīng)過一個
發(fā)表于 06-11 07:46
stm8如果使用到多功能引腳,用stvd調(diào)試仿真的時候,是否還需要設置option byte 來使功能正常使用?
各位前輩,請問一下如果使用到多功能引腳,其中的一個功能比如tim2_ch1 。用stvd調(diào)試仿真的時候,是否還需要設置option byte 來使功能正常使用。
我記得用stvp下載程序的時候需要
發(fā)表于 05-08 07:23
在freertos中,每個任務都是一個死循環(huán),那么還需要使用看門狗嗎?
在freertos中,每個任務都是一個死循環(huán),那么還需要使用看門狗嗎?該怎么使用?
發(fā)表于 05-07 06:55
#2024,立Flag了嘛? #學習spinal HDL還需要學習對應的Scala語言
學習spinal HDL還需要學習對應的Scala語言,但是spinal HDL直接貼近硬件編程,不知道對于學習spinal HDL有什么好的建議?
發(fā)表于 01-21 11:11
1200控制V90PN,極限開關(guān)接到伺服上,那PLC這邊還需要組嗎?
1200控制V90PN,極限開關(guān)接到伺服上,那PLC這邊還需要組嗎
接到V90上,假如絕對定位碰到極限,伺服自己會停止嗎
發(fā)表于 01-09 08:26
退出空載條件后,APNOLOAD和VARNOLOAD是否還需要清零?
空載條件后,APNOLOAD和VARNOLOAD是否還需要清零,還是說只是上電進行一次清零。
謝謝。
發(fā)表于 12-26 07:14
評論