色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

做芯片要軟硬結合

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2020-10-30 10:11 ? 次閱讀

2016 年,第一顆基于可重構計算的人工智能芯片誕生于清華。該成果曾發表在《IEEE 固態電路期刊》,《麻省理工科技評論》也報道過該芯片。

這是清華可重構計算實驗室 “十年磨一劍” 的成果。2006 年起,清華開始研究可重構計算并成立實驗室。

2018 年,該實驗室開始走向產品化,并成立清微智能公司。兩年來,公司已在語音識別、視覺識別等領域研發出規模化應用產品,并和阿里巴巴等互聯網巨頭建立合作。如今,清微智能將最新技術運用于 AI 編譯工具鏈中,并服務于其量產芯片 TX5 系列中,通過編譯優化,全球首款多模態智能計算芯片TX510 用于人臉識別時,其處理速度能夠提升一倍。

DeepTech 近日聯系到清微智能首席科學家、清華大學微電子與納電子學系教授尹首一,就該公司的主要產品、和他本人近日以通訊作者發表的新論文進行了深度交流。

自 2018 年以來,清微智能針對終端產品的語音和視覺兩大應用場景,量產出貨兩款芯片產品:超低功耗的智能語音 SoC 芯片 TX210,已應用至多款 TWS 耳機、電子產品及多種智能家居產品中;TX510 芯片于 2020 年 7 月實現量產,在金融支付、智能安防、工業機器人、航空等領域也已分批交付客戶,出貨量已超十萬片,并承擔多個國家重大項目的建設。

圖|TX 510 應用領域

以清微智能的 TX510 智能視覺芯片系列為例,該芯片的休眠功耗為 10uW、支持中斷喚醒,冷啟動下的人臉檢測識別時間小于 100ms,典型工作功耗為 350mW,算力達 1.2T (Int8)/9.6T (Binary),AI 有效能效比達 5.6TOPS/W。

TX510 還擁有可重構 AI 引擎,其支持 AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、YOLO、SSD、FCN 和 SegNet 等主流神經網絡,可實現人臉識別、物體識別和手勢識別等功能,適用于 AIoT、智能安防、智能家居、智能穿戴、智能制造等領域。

TX510 內置 3D 引擎,支持 3D 結構光、TOF(Time of flight,飛行時間)和立體視覺,誤識率千萬分之一的情況下識別率大于 90%。

接口方面,TX510 支持市面上主流的視頻接口、存儲接口和通用接口,可保證產品兼容性。

盡管從硬件層面芯片性能已經取得了較大進步,但尹首一告訴 DeepTech,業界向來有一個共識,光有芯片架構還不夠,編譯工具和開發工具等軟硬件體系也必須做好。否則,很難完全把硬件功能的優勢發揮出來。

在軟件上面,其團隊已經有新進展。

做芯片要軟硬結合

在近日的第 16 屆 ACM/IEEE 國際嵌入式系統會議 上,清華微電子所魏少軍、尹首一教授團隊的論文《面向神經網絡處理器的非規則網絡結構高效調度技術》(“Efficient Scheduling of Irregular Network Structures on CNN Accelerators”) 獲得最佳論文獎。

尹首一表示,這是中國完成單位首次在 AI 編譯優化領域獲得國際學術會議最佳論文獎。該研究成果填補了大規模、非規則神經網絡編譯映射這一技術空白,可大幅提升神經網絡處理器的計算性能。

該成果解決的痛點在于,隨著 AI 算法的不斷普及,以 AIoT 為代表的嵌入式系統應用,給 AI 芯片的性能、功耗、成本、可靠性和可編程性等提出了嚴格且迫切的需求。為此,基于可重構架構、專用指令集架構、存內計算架構等技術的神經網絡處理器應運而生。

相比 CPU/GPU 等傳統架構,神經網絡處理器可將 AI 算法的計算能效提高 1~2 個數量級,目前其已在移動設備、可穿戴設備、智能傳感器等應用場景中獲得廣泛的應用。

但是,神經網絡處理器的應用離不開編譯器的支撐,編譯器一方面實現了 AI 應用到芯片的自動化部署,另一方面通過優化算法到芯片架構的適配,能為 AI 應用的執行效率帶來大幅提升。

當架構設計經過工藝制造并固化為硬件電路后,硬件電路的運算行為則由編譯器所生成的機器碼來指揮,執行速度和能量開銷也將因此而確定。因此,編譯器的優化程度是研發 AI 芯片的關鍵所在。

然而,當前最先進的神經網絡模型,仍舊具備不可預測的非規則網絡拓撲結構,在編譯層面表現為錯綜復雜的數據流圖、和呈指數增長的解空間,而這給編譯器中的表達式優化、算子調度、資源分配、循環優化、自動代碼生成等關鍵技術環節帶來嚴峻挑戰。

現有的深度學習編譯框架,如 TVM、TensorRT 等僅針對網絡中的某些特定模式進行優化,它們沒有處理任意結構的能力,因此未能有效解決上述難題。

針對上述問題,魏少軍、尹首一團隊在本次研究中,研發出支持任意網絡拓撲結構的端到端深度學習編譯框架(下稱編譯框架),相比同類編譯映射方法實現了 1.41-2.61 倍的計算加速。

圖|支持任意網絡拓撲結構的端到端深度學習編譯框架

具體來說,本次編譯框架有三大創新性技術貢獻點。

第一, 針對結構復雜的數據流圖,提出了基于計算節點深度聚類的編譯方法,該方法可對圖結構進行復雜度降維和搜索路徑生成,進而可求解到具備全局最優特性的圖調度方案,在硬件處理器上表現為多級存儲系統間的數據傳輸開銷、與額外計算開銷之間的最佳平衡,即推理計算性能達到最優;

第二,針對非規則網絡結構導致的解空間指數增長,提出了一種基于回溯搜索和參數匹配的啟發式資源分配方法,并對神經網絡基本算子在時空域上的分布進行聯合優化,從而實現硬件層面上處理器緩存資源利用率最大化;

第三,針對新型網絡結構的循環優化問題,該團隊推導得出最小循環變換粒度,并在編譯框架中建立了最優陣列映射機制,使得嵌套循環的運算與計算資源達到最優匹配。

由于該編譯框架的優化方法具備通用性,因此它也能用于專用神經網絡處理器以外的其他架構。

對于研究該問題的初衷,尹首一表示,這來自該團隊親身經歷的痛點。過去,在開發神經網絡處理器時,人們往往只考慮到處理單元陣列的搭建和底層的數據復用等問題。而對于神經網絡算法編譯,由于當時的模型結構簡單、調度空間有限,僅僅采用常規編譯優化就已足夠。

然而,在面對近年來基于神經架構搜索(NAS)等方法所生成的復雜網絡結構時,之前的設計范式不再能提供具備接近最優性能的解決方案,從而大大制約了算力的發揮。因而該團隊認識到,必須要有針對性的軟件編譯工具,才能對新型 AI 應用進行充分的優化和加速。

尹首一告訴 DeepTech,在編譯方面他們并非 “新人”。他和團隊十多年來一直研究通用可重構處理器編譯問題,已具備較為深厚的研究基礎,因而在面對神經網絡編譯這一新問題時,能迅速把握問題本質,從而得以快速完成研究。

據他介紹,目前由其擔任首席科學家的清微智能,已經將該論文的技術發明運用在 AI 編譯工具鏈中,并已服務于量產芯片 TX5 系列中。對終端客戶而言,這意味著可用同樣的費用買到更多的算力。例如,通過編譯優化,TX510 芯片用于人臉識別時,其處理速度能夠提升一倍。

目前,清微智能的 AI 編譯工具鏈還在不斷升級優化中,旨在使實際運行中的神經網絡處理器逼近其理論算力上限。

AI 芯片公司應 “軟硬” 結合

尹首一認為,和所有初創公司一樣,AI 芯片企業要想構建成功的商業模式,在市場競爭中站穩腳跟,就得扎實細致地研究客戶實際需求。

當前,AI 芯片的客戶多數是整機和應用開發相關企業,這類客戶主要面向算法和應用來開發神經網絡模型,他們急需的是將生成的模型、便捷高效地在硬件設備上進行部署,因此他們不太關心硬件的底層架構和編譯細節。

但是,芯片公司光有先進的硬件和架構是不夠的,因為這無法讓客戶快速用起來,也無法將硬件算力轉化為可觀的計算性能。這時,AI 芯片公司就得提供軟硬件全棧式解決方案。參照英偉達在圖形加速領域的成功經驗,有兩點值得其他公司學習:其一是先進的 GPU 硬件架構,其二則是 GPU 開發工具鏈的成熟和完善。

目前,尹首一把主要精力集中在前沿研究上,這些研究成果不斷支撐著產品的競爭優勢。以清微智能 AI 編譯工具鏈為例,它集成了模型自動量化、定點訓練、通用算法計算和網絡調度映射等多方面的先進技術,可高效處理神經網絡和及其他 AI 算法,并且兼容主流的深度學習框架,因而實現了從應用算法、到可重構計算硬件的端到端部署。

通過這套 AI 工具鏈,開發者可在不改變編程習慣的情況下,快速高效地部署 AI 算法。以已經量產出貨的視覺智能芯片 TX510 為例,開發者可以僅僅通過調用功能級 API,就實現包含剪枝參數和權值位寬參數在內的最優模型壓縮策略,以及包括數據流圖優化、算子時空域映射在內的最優調度結果。

尹首一最后總結到,和操作系統一樣,編譯器也是核心基礎軟件,它是一切可編程芯片的靈魂,應當受到國內公司的更多重視。做 AI 芯片的公司,應當從開發伊始就對軟硬件兩方面的技術路線進行充分布局,這樣才能走得更遠。

-End-

原文標題:AI芯片公司,架構、編譯兩手都要硬!搭載清華最新深度學習編譯研究成果的芯片已商用

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    50910

    瀏覽量

    424514
  • AI
    AI
    +關注

    關注

    87

    文章

    31042

    瀏覽量

    269391
  • 人工智能
    +關注

    關注

    1792

    文章

    47378

    瀏覽量

    238882

原文標題:AI芯片公司,架構、編譯兩手都要硬!搭載清華最新深度學習編譯研究成果的芯片已商用

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    芯片為什么進行封裝?

    來源 Optical Fiber Communication 我們經常說起芯片封裝,那為什么要對芯片進行封裝,今天我們就來簡單聊聊這個話題。 ? 在半導體制造過程中,芯片封裝是一個至關重要的環節,它
    的頭像 發表于 12-17 10:15 ?160次閱讀
    <b class='flag-5'>芯片</b>為什么<b class='flag-5'>要</b>進行封裝?

    瑞薩電子與吉利汽車聯合舉辦汽車主控芯片軟硬解耦能力提升訓練營

    近日,由瑞薩電子與吉利汽車研究院聯合舉辦的“汽車主控芯片軟硬解耦能力提升訓練營”順利落幕。
    的頭像 發表于 12-09 10:50 ?285次閱讀

    芯片銷售終端需要應酬嗎?

    芯片
    芯廣場
    發布于 :2024年11月26日 18:23:15

    結合芯片行業現狀,數字芯片設計什么方向最值得投身?

    時間已經來到了2024年,芯片行業的熱度已然大幅下降,但這個行業的價值依然在。芯片應用的種類繁多,也意味著芯片的類型多種多樣,我也經常會被問到芯片
    的頭像 發表于 11-16 01:09 ?559次閱讀
    <b class='flag-5'>結合</b><b class='flag-5'>芯片</b>行業現狀,數字<b class='flag-5'>芯片</b>設計什么方向最值得投身?

    地平線征程家族出貨量突破700萬

    近日,地平線征程家族出貨量正式突破700萬套,在刷新百萬量產速度的同時,也標志著地平線軟硬結合的高級輔助駕駛與高階智駕解決方案實現大規模量產落地!
    的頭像 發表于 11-13 13:38 ?283次閱讀

    使用NE555芯片MOS管延時的控制芯片,帶載啟動的時候,定時器工作在打嗝狀態,MOS管不能正常打開,怎么解決?

    使用NE555芯片MOS管延時的控制芯片,先通電然后打開負載可以正常控制,但是帶載啟動的時候,定時器工作在打嗝狀態,MOS管不能正常打開 想請問一下各位大佬,這種情況怎樣優化
    發表于 11-08 15:27

    香橙派與昇思MindSpore合作提速,軟硬結合助力開發者構建創新AI應用

    近日,昇思MindSpore開源社區與香橙派合作成果加速落地,持續為開發者提供普惠的端側算力與好用的AI框架,軟硬結合助力高校AI課程建設,幫助開發者基于昇思MindSporeAI框架及香橙派
    的頭像 發表于 11-01 17:02 ?810次閱讀
    香橙派與昇思MindSpore合作提速,<b class='flag-5'>軟硬結合</b>助力開發者構建創新AI應用

    Orin芯片與邊緣計算結合

    Orin芯片,作為英偉達推出的一款高性能AI處理器,與邊緣計算的結合,無疑將為智能計算領域帶來革命性的變化。 一、Orin芯片的創新特點 Orin芯片是英偉達推出的一款專為自動駕駛和邊
    的頭像 發表于 10-27 16:51 ?776次閱讀

    線路板廠一文詳解PCB軟硬結合板優缺點

    軟硬結合板巧妙地融合了剛性電路板和柔性電路板的特性。一方面,它擁有剛性板的穩定性和支撐力,能夠為電子元件提供可靠的安裝平臺。無論是復雜的芯片還是精密的傳感器,都能在硬性部分得到穩固的安置,確保在各種環境下都能保持良好的工
    的頭像 發表于 10-23 17:29 ?223次閱讀

    紫光同芯重磅發布兩款芯片,未來重點布局人工智能等領域

    ——THA6412。 據介紹,E450R包括開放式硬件架構和開放式軟件架構。開放式硬件架構具備開放式指令集、更強的剪裁和擴展功能,開放式軟件架構擁有高效指令集、支持ISO/IEC國際標準語言和結構化虛擬機。軟硬結合幫助集成該芯片的設備大幅提升安全性和交易性能、精簡應用代碼
    的頭像 發表于 08-26 16:11 ?796次閱讀
    紫光同芯重磅發布兩款<b class='flag-5'>芯片</b>,未來重點布局人工智能等領域

    激光焊錫技術在R-FPC線路板制造領域的應用

    FPC軟板是一種充滿創意和智慧的發明,它讓電子產品變得更加輕便、美觀和智能。隨著技術的發展,催生了PCB與FPC軟硬結合線路板R-FPC這一新產品。這種結合不僅提升了電子設備的組裝效率,還增強了設備的可靠性和耐用性。
    的頭像 發表于 08-23 17:27 ?725次閱讀
    激光焊錫技術在R-FPC線路板制造領域的應用

    官宣10家首批量產合作車企,地平線征程6發布即爆款

    4月24日,地平線舉辦“征程所向,向高而行”——2024智駕科技產品發布會。立足于智能駕駛時代,地平線憑借對軟硬結合全棧技術理念的前瞻預判和深厚積累,重磅發布新一代車載智能計算方案征程?6系列以及
    的頭像 發表于 04-25 07:07 ?7229次閱讀
    官宣10家首批量產合作車企,地平線征程6發布即爆款

    不用搶,你芯片都在芯廣場

    芯片
    芯廣場
    發布于 :2024年03月15日 18:33:15

    芯片為什么時鐘信號 時鐘芯片的作用是什么?

    芯片為什么時鐘信號 時鐘芯片的作用是什么? 時鐘信號在芯片中起著非常重要的作用。它是芯片的“心臟”,相當于人體的心臟,用于同步和控制
    的頭像 發表于 01-29 18:11 ?4324次閱讀
    主站蜘蛛池模板: AV无码九九久久| 久久极品视频| 秋霞三级理伦免费观看| 办公室里做好紧好爽H| 欧美丰满熟妇无码XOXOXO| 成人在线免费| 先锋影音av无码第1页| 精品国产品国语在线不卡| 中国xxxxx69| 欧洲xxxxx| 国产亚洲精品AV片在线观看播放| 一本大道香蕉中文在线视频观看| 妹妹我要色| 广播电台在线收听| 亚洲色噜噜狠狠网站| 男同志vdieos免费| 人人爽天天碰狠狠添| 俄罗斯美女z0z0z0在线| 羞羞漫画视频| 老湿司午夜爽爽影院榴莲视频| videos gratis欧美另类| 先锋影音 av| 美女脱了内裤张开腿让男人桶到爽| 成人在线视频免费| 一本一本之道高清在线观看| 欧美国产一区二区三区激情无套| 亚洲精品高清在线| 国产AV国产精品国产三级在线L| 亚洲精品无码国产爽快A片百度| 男男校园园bl文全肉高h寝室| 国产成人ae在线观看网站站 | 国产99久久久国产精品成人| 一本道的mv中文字幕| 天美传媒在线完整免费观看网站| 国产精品自在自线亚洲| 亚洲AV精品乱码专区| 女人精69xxxxx| 九九九色成人网| 国产精品久久高潮呻吟无码| 97人人添人人澡人人澡人人澡| 日本无码专区亚洲麻豆|