色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CNN高效升級,有一定的可編程性

高工智能汽車 ? 來源:未知 ? 作者:胡薇 ? 2018-10-20 09:13 ? 次閱讀

2018年7月18日,自適應和智能計算公司賽靈思(Xilinx, Inc.)宣布完成對專注于神經網絡剪枝、深度壓縮技術及系統級優化的中國AI芯片公司深鑒科技的收購。

這是迄今為止第一家中國AI芯片初創公司與全球芯片領軍廠商的深度綁定。

深鑒科技CTO單羿在近日舉辦的賽靈思全球開發者大會上表示,公司此前本身在深度學習方面有一定的技術積累,用戶不需要寫底層的RTL,就可以通過提供的API接口,進行應用的開發,可以進一步降低開發者的難度,這是最適合客戶的開發模式。

賽靈思在客戶積累以及服務方面,有著豐富的經驗和能力,對于創業公司而言,一般是缺乏客戶的開發能力,以及后續的技術支持方面的能力。

因此對于深鑒而言,同賽靈思合作,可以彌補這一方面的劣勢,更快的將產品推廣給更廣范圍的用戶,省去教育用戶的開銷。

另外,賽靈思和深鑒科技雙方對于客戶的看法是一樣的,今天的AI的算法是一直在變化的,ASIC的做法并不適用,加之流片的成本也越來越高,周期較長,傳統的做法并不是適應這個變化極快的時代。

FPGA在靈活性方面有著不可比擬的優勢,目前的頻率是在數百兆HZ,未來也會根據需求以及技術的成熟,達到過GHZ的頻率;FPGA上也有著豐富的DSP資源,充分的互聯,接口眾多。這些特性都對應了這個AI算法快速迭代發展的時代。

因此,雙方的優勢和互補性使得彼此走到了一起。

深鑒提供全棧的解決方案,包括基本的檢測、追蹤、分割等算法,比如汽車檢測、行人檢測、交通標志牌識別的參考算法,免費給用戶。既有標準化的優化算法技巧,也給用戶定制化的可能。

這些方案是基于FPGA的部署,深鑒科技實際上做的就是DPU的設計,處理器的架構中,有自己的存儲訪問的Hardware、調度器、微體系結構等。有了這些之后,用戶使用CNN就會變得高效,有一定的可編程性。

一.

DNNDK降低AI startup門檻

為了方便用戶使用,深鑒科技開發了一套軟件的工具DNNDK(Deep Neural Network Development Kit,深度學習開發與部署全棧式解決方案)。

最新的版本可支持兩種賽靈思的方案,ZCU102和ZCU104。這個工具每月會定期的更新,方便用戶下載使用。

對于AI創業公司而言,能夠使其具備競爭力的,就是產品的差異化,而差異化是需要在軟件上不斷的訓練不同的模型。

訓練模型是需要依賴算法團隊的實力,很少有創業公司能夠兼顧模型精準和短小精悍。為了讓用戶無差異的使用相同的處理器平臺,提供了模型壓縮技術。

通過自動化工具,可以訓練模型,經過不長的時間,就可以得到一個精簡、輕量化的模型。深鑒科技的自動化模型壓縮工具,是基于硬件進行的,因此更適合硬件加速。

壓縮工具工作主要有兩個步驟,量化和剪枝,量化就是改變參數,從浮點表達變成定點表達,剪枝就是去掉無用的部分,比如一些連接和神經元。

分類網絡的壓縮結果,保證壓縮的精度變化不大。比如SSD+VGG壓縮能夠在保證網絡成倍數減小的同時,精度不發生太大變化,同時運行速度還會有提升。

這些技術不僅可以用于安防,同樣也可以用在自動駕駛中。

模型壓縮的下一步,可通過增強學習或者機器學習的方式,提升工具的自我進化,去掉人類因素的干擾;另外一方面,做更低bit的量化,這個量化技術是下一步模型壓縮中關鍵的技術。

二.

突破1Tops/天花板

對于AI處理器而言,算力大小是一個重要的指標,但如果應用到終端上的時候,單位功耗下的算力才是硬實力,尤其是汽車行業。

目前CNN卷積網絡處理器的天花板是1Tops/w,而無論FPGA、ASIC還是GPU,都徘徊在這個指標附近,如果要完成更復雜的工作,更精細化的處理,就必須要提升這個關鍵性指標。

單羿表示,因為這個天花板是在寬bit的量化性能下得到的,所以要改變這個值必然要換一種方式。

目前的解決方式有兩種,Sparsity和Low Precision,前者實際上是模型壓縮,將網絡的模型變小,后者是將參數的位寬變小,使得硬件在同樣的DSP下,能夠支持更多的乘法和加法的運算。

在Sparsity方面,深鑒團隊從算法、軟件、硬件方面分別進行了探索。這方面有不少的挑戰,比如隨機MEM的訪問和固定格式的計算,帶來計算的低效,非常挑戰體系結構的設計;

另外一方面就是在壓縮模型的同時進行稀疏,以及為了稀疏,需要做的一些索引。隨著稀疏的增加,花費的資源越多,最終會使得壓縮工作沒辦法進行。

Low Precision方面,2018年的時候,ISSCC已經開始嘗試一些更低bit,從原來的8bit已經延生到了1bit。

學術界之所以這樣做,是因為同樣功耗下,更低bit比更高bit的算力能提升一個數量級,模型大小的存儲量也會大大的降低。存儲量的降低意味著可以把更多的參數放到片上來進行,片上帶寬極高,latency也會短。而用FPGA做Low Precision的方式是比較恰當的。

深鑒科技此前的做法是,將FPGA中敏感的層,保留8bit,不敏感的層,用其它較低bit代替。當然這樣的處理方式也給處理器的設計帶來問題,因為dsp原來是支持8bit,現在卻要支持更多bit。

深鑒使用了2bit和6bit,3bit和5bit的搭配方式,適合與賽靈思FPGA的架構,使得量化過程中不同層可以使用不同的位寬,從而達到提升效率的目的。

通過以上兩種方式,處理器單位瓦數下的算力,就有可能提升。

三.

FPGA的減法

自動駕駛是當下一個火熱的應用,其需要進行目標檢測、分割、可行駛區域、以及行人車道線的識別等等,這些工作都是需要不同層網絡進行計算處理。但這些工作同時用FPGA來做,系統負擔會非常大。

為此,深鑒科技提出了一個通過多任務模型的訓練,得到單一網絡的方案,復用特征提取層的運算,把運算量最大的部分放到FPGA中的一個網絡中進行。

而不同任務中,不同層的計算才可能會進行多次,從而達到緩解FPGA處理器運算壓力的目的。

在系統級的優化方面,可以簡化攝像頭的圖像處理,傳統的攝像頭內部有ISP、編解碼等等,分屬不同芯片處理,而通過使用賽靈思的FPGA,則只需要一塊芯片既可以完成,內部不僅有DSP資源,同時還集成了第三方的ISP的庫,可搭載一個完整的系統。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21781

    瀏覽量

    604936
  • cnn
    cnn
    +關注

    關注

    3

    文章

    353

    瀏覽量

    22277

原文標題:Sparsity+Low Precision突破CNN天花板 | GGAI技術

文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是可編程邏輯

    。事實上,由于可編程邏輯器件,些設備制造商現在正在嘗試為已經安裝在現場的產品增加新功能或者進行升級。要實現這點,只需要通過因特網將新
    發表于 05-29 11:36

    求問有沒有可編程的電源識別芯片

    有沒有可編程的芯片,可以輸入不同的電壓,輸出為一定的值,做到能識別電源,我想用兩個電源
    發表于 11-08 13:59

    如何輸入自己的可編程模擬電路

    如何輸入自己的可編程模擬電路摘要:只有為數不多的公司在模擬IC 中提供拓撲可編程,其中最著名的公司Zetex 公司、Lattice半導體公司和Anadigm 公司。這些IC 提供
    發表于 03-30 16:58 ?34次下載

    可編程SoC(SoPC),什么是可編程SoC(SoPC)

    可編程SoC(SoPC),什么是可編程SoC(SoPC) SOPC ( System on a Programmable Chip,片上可編程系統)是以PLD(可編程邏輯器件)取代A
    發表于 03-26 17:01 ?2454次閱讀

    SLPC可編程調節器PID控制參數整

    SLPC可編程調節器PID控制參數整
    發表于 12-11 23:15 ?0次下載

    可編程六路電源序器和監控器

    可編程六路電源序器和監控器
    發表于 05-18 12:38 ?7次下載
    <b class='flag-5'>可編程</b>六路電源<b class='flag-5'>定</b>序器和監控器

    片上可編程系統原理及應用

    片上可編程系統SOPC是種靈活、高效的SoC解決方案,而FPGA 是可編程再設計的“萬能”芯片,FPGA是作為專用集成電路(ASIC)領域中的
    發表于 10-01 09:07 ?1925次閱讀

    可編程電源的原理 可編程電源的優缺點

      可編程電源是種可以通過計算機編程來控制電源輸出的電源。它可以根據用戶的需求,自動調節電源的輸出電壓和電流,從而滿足用戶的需求。可編程電源具有節能、穩定性好、可靠
    發表于 02-21 15:16 ?2460次閱讀

    可編程邏輯器件測試

    可編程邏輯器件 (Programmable Loeie Device,PLD)是種用戶編程實現某種邏輯功能的邏輯器件,主要由可編程的與陣列、或陣列、門陣列等組成,可通過
    發表于 06-06 15:37 ?706次閱讀
    <b class='flag-5'>可編程</b>邏輯器件測試

    可編程交流電源的特點及應用

    。傳統的固定輸出交流電源通常只能提供固定的電壓值,而可編程交流電源可以根據需要在一定范圍內調節輸出電壓。這種可調節使得可編程交流電源能夠滿足各種應用中的不同電壓需求。 其次,
    的頭像 發表于 11-09 16:58 ?897次閱讀

    數字可編程變頻電源使用哪些注意事項?

    數字可編程變頻電源使用哪些注意事項? 數字可編程變頻電源是種能夠根據用戶需求調整輸出電壓和頻率的電源設備。它在工業生產和實驗室研究等領域中被廣泛使用。然而,使用數字
    的頭像 發表于 11-13 16:09 ?775次閱讀

    PLC(可編程邏輯控制器)的升級方式哪些呢?

    PLC(可編程邏輯控制器)的升級通常包括硬件升級和軟件升級兩個方面。
    的頭像 發表于 05-27 11:26 ?861次閱讀

    可編程電源如何編程

    可編程電源如何編程? 可編程電源是種可以調節輸出電壓和電流的電源設備,廣泛應用于電子設備測試、研發和生產等領域。通過編程,用戶可以根據需要
    的頭像 發表于 06-10 15:24 ?1455次閱讀

    用TMAG5328電阻器和電壓可編程霍爾效應開關實現可編程和診斷

    電子發燒友網站提供《用TMAG5328電阻器和電壓可編程霍爾效應開關實現可編程和診斷.pdf》資料免費下載
    發表于 09-11 10:01 ?0次下載
    用TMAG5328電阻器和電壓<b class='flag-5'>可編程</b>霍爾效應開關實現<b class='flag-5'>可編程</b><b class='flag-5'>性</b>和診斷

    可編程晶振的優點和缺點

    可編程晶振,近年來漸入人們眼中。什么是可編程晶振,與普通晶振什么區別?可編程晶振的優點和缺點哪些?1,什么是
    的頭像 發表于 09-30 10:44 ?462次閱讀
    <b class='flag-5'>可編程</b>晶振的優點和缺點
    主站蜘蛛池模板: 国产Av男人的天堂精品良久| 国产麻豆剧果冻传媒免费网站| 国产精品永久在线| 麻豆影视在线直播观看免费 | 99视频免费看| 邻居的阿2中文字版电影| 131美女爱做视频午夜剧场| 久久麻豆亚洲AV成人无码国产| 亚洲中字慕日产2020| 久久xxxx| 91在线一区二区| 欧美互交人妖247| 成人在无码AV在线观看一 | 又爽又黄又粗又大免费视频| 久久受www免费人成_看片中文| 中文人妻熟妇精品乱又伦| 免费韩国伦理2017最新| 被滋润的艳妇疯狂呻吟白洁老七| 日本视频久久| 国产三级91| 亚洲字幕久久| 麻豆区蜜芽区| 大中国免费视频大全在线观看| 三色午夜秀| 国产午夜人做人免费视频中文| 亚洲一区免费香蕉在线| 巨胸美女狂喷奶水www网麻豆| a4you销魂gogo人体| 肉动漫无码无删减在线观看| 国产精品亚洲二线在线播放| 野花日本高清在线观看免费吗| 免费看成人毛片| 国产 亚洲 中文在线 字幕| 亚洲精品网址| 年轻的搜子8中字在线观看| 国产成人一区二区三中文| 一区不卡二区卡| 区一区二视频免费观看| 好爽胸大好深好多水| 99久久99久久久精品久久| 亚在线观看免费视频入口|