電子發燒友網報道(文/李彎彎)近些年AI模型的應用場景飛速擴展,包括自動駕駛、智慧城市、教育、醫療、金融等等,行業的多樣性和應用場景的分散,使得AI模型爆炸式增長。
在日前某論壇上,商湯科技聯合創始人兼大裝置首席科學家林大華談到,商湯科技每年要生產幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經典算子雖然占據90% AI芯片算力,而90%長尾算子卻占據大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現,充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數學問題的公式實現。算法框架可以讓算法執行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發更方便。
目前算法框架已經非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。
為此,商湯科技希望基于已經開源開放的算法體系,構建統一的接口,把大家協同在一起,在軟件層面,在算法的結構分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術界和工業界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統計,每個算法模型在實際訓練中存在不同的卷積輸入參數配置,不同參數配置的卷積算子使用頻率存在較大的差異。
再得出高優Spec優化清單,從算法模型優先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權評分,再得到高優Spec優化清單,芯片廠商可參考優化的清單進行針對性優化。
總之,基于算法分級體系的算子優化方法可以助力挖掘高優Spec,確認常用卷積輸入配置優化優先級,提高芯片廠商適配能效。
長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統一算子接口及函數簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發框架和應用模型。
傳統芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產業在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產業要長期健康的發展,還需要上下游機構、廠商一起,攜手合作構建出一個繁榮的生態,這中間的算法框架在連接起底層芯片和上層業務方面,承擔著重要責任。
在日前某論壇上,商湯科技聯合創始人兼大裝置首席科學家林大華談到,商湯科技每年要生產幾萬個AI模型,然而模型豐富,算子的長尾效應也很明顯,10% 經典算子雖然占據90% AI芯片算力,而90%長尾算子卻占據大量計算時間。
多元化的應用催生了多樣的算法框架,算法支持應用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現,充當AI芯片與應用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數學問題的公式實現。算法框架可以讓算法執行更高效,比如最早玩深度學習的人都用Theano,基于Theano去開發算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學習的算法開發更方便。
目前算法框架已經非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發AI算法的,也就是說深度學習框架銜接起了硬件芯片算力和上面AI算法應用,然而AI訓練框架逐漸豐富,但未形成統一的芯片接口,這使得AI訓練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應用上的快速迭代。
為此,商湯科技希望基于已經開源開放的算法體系,構建統一的接口,把大家協同在一起,在軟件層面,在算法的結構分解出一些標準算子,表明哪些算子在哪些應用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標準算子接口體系。據林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學術界和工業界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進行分級,這樣可以給出方向性的應用參考。
接著是卷積輸入配置頻率統計,每個算法模型在實際訓練中存在不同的卷積輸入參數配置,不同參數配置的卷積算子使用頻率存在較大的差異。
再得出高優Spec優化清單,從算法模型優先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權評分,再得到高優Spec優化清單,芯片廠商可參考優化的清單進行針對性優化。
總之,基于算法分級體系的算子優化方法可以助力挖掘高優Spec,確認常用卷積輸入配置優化優先級,提高芯片廠商適配能效。
長尾算子在實際應用中占比非常高,但卻不在標準算法庫里面,因此需要建立標準算子接口來提升芯片和框架的適配。
標準算子接口體系,包括統一算子接口及函數簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴展,與標準接口定義保持一致,具有可移植性和強適用性,提供一致性的錯誤處理機制,支持主流開發框架和應用模型。
傳統芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風險難以控制;3、適配案例和經驗難以復用到其它芯片和框架適配場景中。而接入標準算子接口體系的芯片和框架適配流程,有幾個優點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產業在芯片算力、算法、框架,以及應用方面都有很大的進步,然而如果AI產業要長期健康的發展,還需要上下游機構、廠商一起,攜手合作構建出一個繁榮的生態,這中間的算法框架在連接起底層芯片和上層業務方面,承擔著重要責任。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI芯片
+關注
關注
17文章
1889瀏覽量
35078 -
AI算法
+關注
關注
0文章
251瀏覽量
12278
發布評論請先 登錄
相關推薦
【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+介紹基礎硬件算法模塊
結構性的,而是算法性和原理性的,如WiFi芯片,里面充斥著各種復雜的矩陣運算、復數運算等,因為它們要解決的是多天線在無線道下的輸入、輸出問題。AI芯片、圖像/語音/視頻等多媒體處理
發表于 11-21 17:05
迅為瑞芯微RK3568核心板橋梁監測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監測,提高監測效率和準確性。同時,RK3568處理器在智能顯示、工業控制等領域有廣泛應用,適配系統新增雙麒麟系統,增強產品競爭力
發表于 09-13 10:11
迅為RK3568核心板橋梁監測設備接口應用
RK3568核心板以其豐富的接口擴展能力和高性能AI算力,支持橋梁全面監測,提高監測效率和準確性。同時,RK3568處理器在智能顯示、工業控制等領域有廣泛應用,適配系統新增雙麒麟系統,增強產品競爭力
發表于 07-27 11:56
AI算法/模型/框架/模型庫的含義、區別與聯系
在人工智能(Artificial Intelligence,簡稱AI)的廣闊領域中,算法、模型、框架和模型庫是構成其技術生態的重要基石。它們各自承擔著不同的角色,但又緊密相連,共同推動著AI
平衡創新與倫理:AI時代的隱私保護和算法公平
成了一把雙刃劍,其銳利的一面正逐漸指向我們的核心價值。面對這些挑戰,制定一套有效的AI治理框架和隱私保護機制變得迫在眉睫。
確保AI決策的透明度是解決這些問題的關鍵一步。透明度不僅要求公開
發表于 07-16 15:07
ai大模型和ai框架的關系是什么
AI大模型和AI框架是人工智能領域中兩個重要的概念,它們之間的關系密切且復雜。 AI大模型的定義和特點 AI大模型是指具有大量參數的深度學習
AI大模型與AI框架的關系
多個領域取得顯著成果。而AI框架則是為開發和訓練AI模型提供的一套標準接口、特性庫和工具包,它集成了算法的封裝、數據的調用以及計算資源的使用,是AI
CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數中是怎么回事?
當我將網絡模型部署到STM32F407VGT6中時,CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數中是怎么回事?CUbeAI庫的版本是9.0。期待您的回復,謝謝
發表于 05-30 06:11
risc-v多核芯片在AI方面的應用
RISC-V多核芯片在AI方面的應用主要體現在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。
首先,RISC-V適合用于高效設計實現,其內核面積更小,功耗更
發表于 04-28 09:20
評論