色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何設計更智能的Edge AI

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Tony King-Smith ? 2022-07-10 11:30 ? 次閱讀

作為一名擁有 40 多年半導體業務研發總監和 CMO 經驗的工程師,我認為我自己和我的同行是合乎邏輯的。然而,我們當中有多少人可以誠實地說我們沒有被諸如“我的小部件比你的快?”這樣的說法所誘惑。恐怕這只是人性,尤其是當我們對你的專業知識沒有信心來調查這些說法時。

問題始終是一個定義:我如何定義“更快”或“更低功率”或“更便宜”?這是基準試圖解決的問題——它是關于具有一致的上下文和外部標準,以確保您將同類與同類進行比較。任何使用基準測試的人都非常清楚這一點(aiMotive 誕生于一家領先的 GPU 基準測試公司)。

在嘗試比較汽車 AI 應用的硬件平臺時,解決這種轟炸式索賠的需求從未像現在這樣緊迫。

10 TOPS 什么時候不是 10 TOPS?

無論是否有專用的 NPU,大多數 SoC 都將其執行 NN 工作負載的能力稱為 TOPS:每秒 Tera 操作。這只是 NPU(或整個 SoC)原則上每秒可以執行的算術運算總數,無論全部集中在專用 NPU 中還是分布在多個計算引擎中,例如 GPU、CPU 矢量協處理器、或其他加速器。

但是,沒有任何硬件執行引擎能以 100% 的效率執行任何工作負載的各個方面。對于神經網絡推理,某些層(例如池化或激活)在數學上與卷積非常不同。在卷積本身(或其他層,如池化)可以開始之前,數據必須重新排列或從一個地方移動到另一個地方。其他時候,NPU 可能需要等待來自控制它的主機 CPU 的新指令或數據,每個層甚至每個數據塊。這些都導致完成的計算更少,從而限制了理論上的最大容量。

硬件利用率——不是它看起來的樣子

許多 NPU 供應商會引用硬件利用率來表明他們的 NPU 執行給定 NN 工作負載的情況。這基本上是說,“這就是我的 NPU 的理論容量有多少被用于執行 NN 工作負載。” 當然,這告訴我我需要知道什么。

不幸的是沒有。硬件利用率的問題是定義之一:數量完全取決于 NPU 供應商選擇如何定義它。事實上,硬件利用率和 TOPS 的問題在于它們只告訴你硬件引擎理論上能夠實現什么,而不是它實現的程度。

這可能會導致一些誤導性信息。下面的圖 1 顯示了我們在額定 4 TOPS 的 aiWare3P NPU 與另一個額定為 8 TOPS 的知名 NPU 之間進行的比較。

poYBAGLKR_eAck4HAACgiX1heSI601.png

圖 1:兩個汽車推理 NPU 的利用率與效率比較

對于兩個不同的知名基準,競爭對手 X NPU 聲稱 8 TOPS 容量,而 aiWare3P 的 4 TOPS。這應該意味著它將提供大約 2 倍于 aiWare3P 的 fps 性能。然而,實際上,情況正好相反:aiWare3P 的性能提高了 2 到 5 倍,盡管它只是聲稱的 TOPS 的一半!

結論:TOPS 是衡量 AI 硬件能力的一種非常糟糕的方法;硬件利用率幾乎與 TOPS 一樣具有誤導性。

NPU 效率和自主性:優化 PPA 的關鍵

這就是為什么我認為您必須根據執行一組代表性工作負載時的效率而不是原始理論硬件容量來評估 NPU 能力。效率定義為為一幀執行特定 CNN 需要多少操作,占聲稱的 TOPS 總數的百分比。該數字僅基于定義任何 CNN 的基礎數學算法計算得出,無論 NPU 實際如何評估它。它比較了實際與聲稱的性能,這才是真正重要的。

展示出高效率的 NPU 意味著它將充分利用用于實現它的每平方毫米硅片,這意味著更低的芯片成本和更低的功耗。效率可為汽車 SoC 或 ASIC 提供最佳 PPA(性能、功率和面積)。

NPU 的自治性是另一個重要因素。NPU 在主機 CPU 上放置多少 CPU 負載才能達到最高性能?這與內存子系統有什么關系?NPU 必須被視為任何 SoC 或 ASIC 中的大塊——它對芯片和子系統其余部分的影響不容忽視。

結論

在設計任何 SoC 或 ASIC 汽車時,AI 工程師必須專注于構建能夠可靠執行其算法的生產平臺,同時實現卓越的 PPA:最低功耗、最低成本、更高性能。他們還必須在設計周期的早期就選擇硬件平臺,通常是在開發最終算法之前。

效率是實現這一目標的最佳方式;TOPS 和硬件利用率都不是好的衡量標準。如果要滿足苛刻的生產目標,評估 NPU 的自主性也至關重要。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10901

    瀏覽量

    212686
  • soc
    soc
    +關注

    關注

    38

    文章

    4199

    瀏覽量

    218815
  • AI
    AI
    +關注

    關注

    87

    文章

    31490

    瀏覽量

    269915
收藏 人收藏

    評論

    相關推薦

    人工智能和機器學習以及Edge AI的概念與應用

    與人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發展與相關應用。 人工智能和機器學習是現代科技的核心技術 人
    的頭像 發表于 01-25 17:37 ?82次閱讀
    人工<b class='flag-5'>智能</b>和機器學習以及<b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>的概念與應用

    北斗智聯入選2024 EDGE AWARDS年度汽車科技榜

    近日,以“ALL-in on Globalization,ALL-in on AI”為主題的2024 T-EDGE創新大會暨鈦媒體財經年會在京順利舉辦,大會重磅揭曉了“2024 EDGE AWARDS創新評選”榜單,北斗智聯強勢
    的頭像 發表于 12-10 15:15 ?260次閱讀

    康普推出RUCKUS Edge云托管邊緣平臺

    近期,康普推出了用于服務交付的RUCKUS Edge云托管邊緣平臺。RUCKUS Edge平臺基于AI驅動型RUCKUS One網絡保障和商業智能平臺,將基于云的RUCKUS One平
    的頭像 發表于 12-05 16:34 ?332次閱讀

    貿澤開售適用于AI和機器學習應用的 AMD Versal AI Edge VEK280評估套件

    2024 年 11 月 19 日 – 專注于引入新品的全球電子元器件和工業自動化產品授權代理商貿澤電子 (Mouser Electronics) 即日起供應AMD全新Versal? AI Edge
    發表于 11-21 14:23 ?132次閱讀

    在設備上利用AI Edge Torch生成式API部署自定義大語言模型

    我們很高興地發布 AI Edge Torch 生成式 API,它能將開發者用 PyTorch 編寫的高性能大語言模型 (LLM) 部署至 TensorFlow Lite (TFLite) 運行時
    的頭像 發表于 11-14 10:23 ?516次閱讀
    在設備上利用<b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> Torch生成式API部署自定義大語言模型

    Google AI Edge Torch的特性詳解

    我們很高興地發布 Google AI Edge Torch,可將 PyTorch 編寫的模型直接轉換成 TFLite 格式 (.tflite),且有著優異的模型覆蓋率和 CPU 性能。TFLite
    的頭像 發表于 11-06 10:48 ?455次閱讀
    Google <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> Torch的特性詳解

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和
    發表于 10-14 09:21

    TDA4 Edge AI處理器的性能和效率基準測試

    電子發燒友網站提供《TDA4 Edge AI處理器的性能和效率基準測試.pdf》資料免費下載
    發表于 09-11 09:21 ?0次下載
    TDA4 <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>處理器的性能和效率基準測試

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬
    發表于 09-09 15:36

    使用TI Edge AI Studio和AM62A進行基于視覺AI的缺陷檢測

    電子發燒友網站提供《使用TI Edge AI Studio和AM62A進行基于視覺AI的缺陷檢測.pdf》資料免費下載
    發表于 09-03 10:38 ?0次下載
    使用TI <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b> Studio和AM62A進行基于視覺<b class='flag-5'>AI</b>的缺陷檢測

    Edge AI工控機的定義、挑選考量與常見應用

    連接到網絡,并依照特定的安全協議,允許網絡用戶安全地連線到服務器進行操作。 而近來熱門的Edge AI簡單來說就是邊緣運算 (Edge Computing)?和人工智能 (
    的頭像 發表于 08-14 10:51 ?507次閱讀

    凌華智能推出全新AI 邊緣服務器MEC-AI7400 (AI Edge Server)系列

    智能制造應用產品系列:凌華智能AI 邊緣服務器 MEC-AI7400 (AI Edge Ser
    的頭像 發表于 07-12 16:35 ?732次閱讀

    意法半導體ST Edge AI Suite人工智能開發套件上線

    邊緣人工智能進一步縮短了智能和決策能力與數據源之間的距離,是企業在當今的互聯網時代實現產品智能化的關鍵技術。2023年年底,意法半導體ST Edge
    的頭像 發表于 07-04 10:52 ?863次閱讀

    **十萬級口語識別,離線自然說技術,讓智能照明懂你**

    固定詞條等。針對這些問題,啟英泰倫現已推出成熟的可應用于照明設備的離線自然說方案,該方案已在多家智能照明廠商最新產品上實現應用落地。 照明離線自然說方案采用啟英泰倫第三代AI語音芯片(芯片Flash
    發表于 04-29 17:09

    【ALINX 技術分享】AMD Versal AI Edge 自適應計算加速平臺之 Versal 介紹(2)

    【ALINX 技術分享】AMD Versal AI Edge 自適應計算加速平臺之 Versal 介紹,以及Versal 芯片開發流程的簡介。
    的頭像 發表于 03-07 16:03 ?1102次閱讀
    【ALINX 技術分享】AMD Versal <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> 自適應計算加速平臺之 Versal 介紹(2)
    主站蜘蛛池模板: 成年人免费观看视频网站 | 国产午夜一级鲁丝片 | 97国产人妻精品无码AV在线 | 内射人妻无码色AV麻豆去百度搜 | 国产在线观看网址你懂得 | 久久亚洲精品成人 | 一起碰一起噜一起草视频 | 一本到2v不卡区 | 91蜜桃视频 | 人妻满熟妇AV无码区国产 | 国产精品xxxav免费视频 | 欧美含羞草免费观看全部完 | 久久久乱码精品亚洲日韩 | 99久久精品国产自免费 | 免费毛片网站在线观看 | 伊人网站在线 | 国产成人小视频 | 最近的2019中文字幕国语 | 嫩草影院精品视频在线观看 | 国产国产乱老熟女视频网站97 | 国产乱码卡二卡三卡4W | 亚洲精品久久无码AV片银杏 | 色婷婷激婷婷深爱五月小蛇 | 97久久国产露脸精品国产 | 共妻肉多荤文高h一女n男 | 色宅男午夜电影网站 | 人妻免费久久久久久久了 | 胸太大被男同桌吃好爽 | 色色色久久久免费视频 | 猫咪av永久最新域名 | 亚洲免费黄色 | 午夜日韩久久影院 | 东北女人一级毛片 | 国产高清视频免费最新在线 | 动漫H片在线观看播放免费 动漫H片在线播放免费高清 | 亚洲区视频 | 国产99精品在线观看 | 成年色黄APP下载 | 国产精品永久免费视频观看 | 最近的2019中文字幕国语完整版 | 色多多污污下载 |