色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

工程師說(shuō) | 面向AD/ADAS的SoC的AI性能優(yōu)化

瑞薩電子 ? 來(lái)源:未知 ? 2023-07-27 18:15 ? 次閱讀

摘要

本文介紹了瑞薩在早期設(shè)計(jì)階段針對(duì)自動(dòng)駕駛AD)和高級(jí)駕駛輔助系統(tǒng)(ADAS)的SoC中用于AI處理的深度神經(jīng)網(wǎng)絡(luò)(DNN)加速器的性能、電路尺寸和功耗的工作內(nèi)容。

Yuji Obayashi

Principal Software Engineer

背景

近年,隨著深度學(xué)習(xí)(DeepLearning)人工智能(AI)技術(shù)的進(jìn)步,我們的生活中出現(xiàn)了許多直接有益的應(yīng)用場(chǎng)景,例如自動(dòng)翻譯精度的提升和根據(jù)消費(fèi)者喜好的個(gè)性化推薦。截至2023年,AI在某些領(lǐng)域已經(jīng)成為產(chǎn)品和服務(wù)中不可或缺的應(yīng)用,其中之一就是自動(dòng)駕駛(AD)和先進(jìn)駕駛輔助系統(tǒng)(ADAS)。

以深度神經(jīng)網(wǎng)絡(luò)(DNN)為代表的最新人工智能模型的處理需要大規(guī)模的并行計(jì)算,因此在PC開(kāi)發(fā)中通常使用通用的GPU進(jìn)行并行計(jì)算。另一方面,用于AD和ADAS的SoC多數(shù)搭載了專用電路(以下簡(jiǎn)稱加速器),實(shí)現(xiàn)了低功耗和高性能的DNN處理。然而,在SoC開(kāi)發(fā)的早期階段,確認(rèn)搭載的加速器能否在實(shí)際所需的DNN中提供足夠的性能通常并不容易。性能比較的指標(biāo)常常使用加速器設(shè)計(jì)上的最大計(jì)算性能TOPS(Tera Operations Per Second)值,或者其與運(yùn)行時(shí)消耗的功率相除得到的TOPS/W值。然而,由于加速器是針對(duì)特定處理的專用設(shè)計(jì)(*1),即使TOPS值足夠高,在實(shí)際所需的DNN中也可能由于存在無(wú)法高效處理的計(jì)算或數(shù)據(jù)傳輸帶寬不足等問(wèn)題而無(wú)法提供足夠的性能。此外,加速器的功率增加可能導(dǎo)致整個(gè)SoC的功耗超過(guò)可接受的范圍。

(*1)專用設(shè)計(jì):雖然使用通用GPU作為加速器也是可能的,但處理特定任務(wù)的硬件,可以在較小的電路規(guī)模和功耗下獲得更高的處理性能。例如瑞薩的車載SoC R-Car V3H、R-Car V3M和R-Car V4H搭載的加速器具有專為處理DNN中使用卷積操作進(jìn)行特征提取的卷積神經(jīng)網(wǎng)絡(luò)(CNN)任務(wù)而設(shè)計(jì)的結(jié)構(gòu)。

隨著SoC開(kāi)發(fā)的深入,由于性能不足或功耗過(guò)大等原因而進(jìn)行設(shè)計(jì)變更的難度普遍增加,對(duì)SoC開(kāi)發(fā)進(jìn)度和開(kāi)發(fā)成本的影響也隨之增加。因此,在開(kāi)發(fā)面向車載AI設(shè)備的SoC時(shí),確認(rèn)搭載的加速器能否在實(shí)際顧客產(chǎn)品中所需的DNN中提供足夠的性能,并且功耗是否在可接受范圍內(nèi),已成為迫切的問(wèn)題。

面向AD/ADAS的一般AI開(kāi)發(fā)流程

在解釋如何解決上述問(wèn)題之前,先簡(jiǎn)單介紹一下AD/ADAS的AI開(kāi)發(fā)流程。下面的圖1展示了在AD/ADAS中以軟件為核心,并包括部分SoC開(kāi)發(fā)的AI開(kāi)發(fā)流程的示例。

1f98864a-2c65-11ee-815d-dac502259ad0.png

圖1:AD/ADAS中AI開(kāi)發(fā)流程的例子

圖1將整個(gè)開(kāi)發(fā)工作分為六個(gè)階段,其中第2和第3階段為SoC電路設(shè)計(jì),其他第1和第4-6階段為軟件開(kāi)發(fā)。下面給出了每個(gè)階段的工作概述。

第一階段 AI Application/Service Common Development

利用PC和云環(huán)境,以應(yīng)對(duì)市場(chǎng)需求和技術(shù)趨勢(shì),開(kāi)發(fā)面向AD/ADAS的AI應(yīng)用程序和服務(wù)。

第二階段 AI Accelerator Detail Design

涵蓋了構(gòu)成加速器硬件的部件設(shè)計(jì),如計(jì)算單元、內(nèi)部存儲(chǔ)器和數(shù)據(jù)傳輸單元。

第三階段 AI Accelerator Configuration

在第三階段中,第二階段中設(shè)計(jì)的組件被組合起來(lái),以優(yōu)化面積、功率和性能之間的權(quán)衡,同時(shí)確定加速器在SoC中的配置以實(shí)現(xiàn)各自的設(shè)計(jì)目標(biāo)。

第四階段 DNN Model Architecture Design

在第三階段中確定的加速器配置被用來(lái)優(yōu)化每個(gè)用于客戶產(chǎn)品的DNN網(wǎng)絡(luò)的結(jié)構(gòu)。

第五階段 DNN Inference Optimization

將針對(duì)經(jīng)過(guò)第四階段結(jié)構(gòu)優(yōu)化的每個(gè)網(wǎng)絡(luò)進(jìn)行適用于加速器的代碼生成,并進(jìn)行精度和處理時(shí)間的詳細(xì)評(píng)估。同時(shí),將對(duì)代碼和模型數(shù)據(jù)進(jìn)行優(yōu)化,以提高性能。

第六階段 Application Development

將使用第五階段中優(yōu)化的代碼和模型數(shù)據(jù),將AI處理部分嵌入到實(shí)際的自動(dòng)駕駛等處理中,并進(jìn)行應(yīng)用的實(shí)現(xiàn)和評(píng)估。

瑞薩的工作

在上一節(jié)所示的AD/ADAS中的AI開(kāi)發(fā)流程中,判斷實(shí)際使用的DNN是否能夠在所配備的加速器上提供足夠的性能,通常需要在決定加速器配置的第三階段AI Accelerator Configuration中進(jìn)行決策。

傳統(tǒng)上,在這一階段的決策是通過(guò)使用類似加速器的現(xiàn)有SoC進(jìn)行的基準(zhǔn)測(cè)試結(jié)果來(lái)估計(jì)的,但對(duì)于因增加或改變功能而與現(xiàn)有SoC規(guī)格不同的部分,無(wú)法獲得基準(zhǔn)測(cè)試結(jié)果,因此無(wú)法通過(guò)高度精確的估計(jì)來(lái)確定是否能達(dá)到設(shè)計(jì)目標(biāo)。

瑞薩通過(guò)使用PPA Estimator(PPA:Performance,Power,Area)而不是現(xiàn)有的SoC基準(zhǔn)測(cè)試來(lái)解決這個(gè)課題。PPA Estimator通過(guò)使用反映加速器每個(gè)組件設(shè)計(jì)的性能和功率計(jì)算模型,使性能和功耗在加速器配置最終確定之前得到估算。具體來(lái)說(shuō),列出可能的加速器配置(可改變的加速器參數(shù)的組合,如處理單元的數(shù)量和內(nèi)部存儲(chǔ)器的容量)進(jìn)行評(píng)估,選擇其中一個(gè)配置并與要評(píng)估的一個(gè)DNN一起輸入PPA Estimator中,以獲得所需的執(zhí)行時(shí)間和功耗。然后,可以針對(duì)所需評(píng)估的加速器配置和DNN的數(shù)量進(jìn)行重復(fù)操作,收集數(shù)據(jù),并找到最佳的加速器配置。如此,不僅可以確定一個(gè)特定的加速器配置和DNN組合是否有足夠的性能,而且還可以收集廣泛的數(shù)據(jù)并從中選擇最佳加速器配置。

此外,為了使第三階段AI Accelerator Configuration更加有效,瑞薩還通過(guò)將從PPA Estimator執(zhí)行結(jié)果中獲得的信息反饋給目標(biāo)DNN的網(wǎng)絡(luò)模型,并行改進(jìn)軟件方面的工作,也就是進(jìn)行硬件-軟件聯(lián)合設(shè)計(jì)(co-design)。AI Accelerator Configuration階段的工作流程如下圖2所示。

1fab0d06-2c65-11ee-815d-dac502259ad0.png

圖2:AI Accelerator Configuration工作流程

瑞薩已開(kāi)始將PPA Estimator應(yīng)用于從2023年開(kāi)始的一些帶有AI處理加速器的AD/ADAS的SoC的開(kāi)發(fā)中,并計(jì)劃逐步擴(kuò)大應(yīng)用范圍。瑞薩將利用PPA Estimator的高度精確性能尋找最佳配置以開(kāi)發(fā)高性能、低功耗的車載AI加速器。

點(diǎn)擊文末閱讀原文獲取更多有關(guān)瑞薩當(dāng)前和最新的車載AI SoC產(chǎn)品的信息。

1

END

1

瑞薩電子 (TSE: 6723)

科技讓生活更輕松,致力于打造更安全、更智能、可持續(xù)發(fā)展的未來(lái)。作為全球微控制器供應(yīng)商,瑞薩電子融合了在嵌入式處理、模擬電源及連接方面的專業(yè)知識(shí),提供完整的半導(dǎo)體解決方案。成功產(chǎn)品組合加速汽車、工業(yè)、基礎(chǔ)設(shè)施及物聯(lián)網(wǎng)應(yīng)用上市,賦能數(shù)十億聯(lián)網(wǎng)智能設(shè)備改善人們的工作和生活方式。更多信息,敬請(qǐng)?jiān)L問(wèn)renesas.com


原文標(biāo)題:工程師說(shuō) | 面向AD/ADAS的SoC的AI性能優(yōu)化

文章出處:【微信公眾號(hào):瑞薩電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 瑞薩
    +關(guān)注

    關(guān)注

    35

    文章

    22309

    瀏覽量

    86443

原文標(biāo)題:工程師說(shuō) | 面向AD/ADAS的SoC的AI性能優(yōu)化

文章出處:【微信號(hào):瑞薩電子,微信公眾號(hào):瑞薩電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何優(yōu)化SOC芯片性能

    優(yōu)化SOC(System on Chip,系統(tǒng)級(jí)芯片)芯片性能是一個(gè)復(fù)雜而多維的任務(wù),涉及多個(gè)方面的優(yōu)化策略。以下是一些關(guān)鍵的優(yōu)化措施: 一
    的頭像 發(fā)表于 10-31 15:50 ?558次閱讀

    AI大模型的性能優(yōu)化方法

    AI大模型的性能優(yōu)化是一個(gè)復(fù)雜而關(guān)鍵的任務(wù),涉及多個(gè)方面和策略。以下是一些主要的性能優(yōu)化方法: 一、模型壓縮與
    的頭像 發(fā)表于 10-23 15:01 ?772次閱讀

    康謀分享 | AD/ADAS性能概覽:在AD/ADAS的開(kāi)發(fā)與驗(yàn)證中“大海撈針”!

    在AD/ADAS開(kāi)發(fā)與驗(yàn)證中,如何從海量數(shù)據(jù)中快速獲得性能概覽,進(jìn)而快速定位關(guān)鍵事件?本文康謀帶您了解,如何利用IVEX智能概覽功能,結(jié)合安全與關(guān)鍵績(jī)效指標(biāo),實(shí)現(xiàn)高效檢索與分析,推動(dòng)AD/ADAS系統(tǒng)持續(xù)
    的頭像 發(fā)表于 10-23 09:24 ?2301次閱讀
    康謀分享 | AD/<b class='flag-5'>ADAS</b>的<b class='flag-5'>性能</b>概覽:在AD/<b class='flag-5'>ADAS</b>的開(kāi)發(fā)與驗(yàn)證中“大海撈針”!

    瑞薩電子推出R-Car V4M系列SoC,擴(kuò)展ADAS解決方案

    全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子近日宣布,正式推出面向入門(mén)級(jí)高級(jí)駕駛輔助系統(tǒng)(ADAS)的系統(tǒng)級(jí)芯片(SoC)——R-Car V4M系列,以進(jìn)一步擴(kuò)展其備受市場(chǎng)歡迎的R-Car產(chǎn)品家族。
    的頭像 發(fā)表于 10-12 15:42 ?414次閱讀

    瑞薩電子推出全新R-Car V4M系列車用SoC

    R-Car V4M系列產(chǎn)品及擴(kuò)展的R-Car V4H系列產(chǎn)品具有強(qiáng)大的AI處理能力和快速的CPU性能,同時(shí)具有良好的性能與功耗平衡。其卓越的TOPS/Watt性能
    的頭像 發(fā)表于 10-11 11:39 ?555次閱讀
    瑞薩電子推出全新R-Car V4M系列車用<b class='flag-5'>SoC</b>

    FPGA算法工程師、邏輯工程師、原型驗(yàn)證工程師有什么區(qū)別?

    邏輯工程師和 FPGA 原型驗(yàn)證工程師在工作重點(diǎn)和職責(zé)上存在一定的區(qū)別: FPGA 算法工程師: 主要關(guān)注算法的設(shè)計(jì)和優(yōu)化,以在 FPGA 平臺(tái)上實(shí)現(xiàn)高效的計(jì)算和處理。他們需要深入理
    發(fā)表于 09-23 18:26

    AMD 面向 ADAS 和數(shù)字座艙推出尺寸更小、成本優(yōu)化的車規(guī)級(jí) FPGA 系列

    優(yōu)化的 FPGA 符合車規(guī)標(biāo)準(zhǔn),并針對(duì) ADAS 傳感器應(yīng)用和車載信息娛樂(lè)系統(tǒng)( IVI )進(jìn)行了優(yōu)化。 ? 新款 Artix UltraScale+ XA AU7P 采用 9x9 毫米封
    發(fā)表于 09-20 18:12 ?283次閱讀

    使用邏輯和轉(zhuǎn)換優(yōu)化ADAS域控制器

    電子發(fā)燒友網(wǎng)站提供《使用邏輯和轉(zhuǎn)換優(yōu)化ADAS域控制器.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 10:27 ?0次下載
    使用邏輯和轉(zhuǎn)換<b class='flag-5'>優(yōu)化</b><b class='flag-5'>ADAS</b>域控制器

    高集成度大面陣SPAD-SoC面向ADAS前裝量產(chǎn)、L4/5自動(dòng)駕駛等應(yīng)用

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,識(shí)光發(fā)布高集成度大面陣SPAD-SoC SQ100,真正實(shí)現(xiàn)靈活分區(qū)的2D可尋址SPAD-SoC。SQ100面向ADAS前裝量產(chǎn)、L4/5自動(dòng)駕駛、
    的頭像 發(fā)表于 08-07 00:27 ?5360次閱讀

    微軟GitHub推出Models服務(wù),賦能AI工程師

    微軟旗下的代碼托管巨頭 GitHub 近期宣布了一項(xiàng)重大更新——GitHub Models 服務(wù),旨在成為 AI 工程師的得力助手。該服務(wù)專為開(kāi)發(fā)者設(shè)計(jì),旨在幫助他們輕松選擇并優(yōu)化最適合其應(yīng)用需求的
    的頭像 發(fā)表于 08-05 14:16 ?502次閱讀

    ADAS功能安全HiL仿真測(cè)試系統(tǒng)介紹#ADAS #VTHiL

    adas
    北匯信息POLELINK
    發(fā)布于 :2024年08月03日 20:07:34

    ADAS系統(tǒng)組成簡(jiǎn)介#ADAS

    adas
    北匯信息POLELINK
    發(fā)布于 :2024年08月03日 20:05:37

    一個(gè)更適合工程師和研究僧的FPGA提升課程

    各位編程精英er~ F學(xué)社打造的FPGA工程師培訓(xùn)班上線后,有不少同學(xué)后臺(tái)私信詢問(wèn):“能不能出個(gè)那種專門(mén)針對(duì)某個(gè)知識(shí)點(diǎn)的課程呢?我想針對(duì)自己的薄弱點(diǎn)深入學(xué)習(xí)。” 貼心如我,當(dāng)然會(huì)滿足大家的學(xué)習(xí)
    發(fā)表于 06-05 10:09

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    和通信協(xié)議,以及熟練掌握一種或多種編程語(yǔ)言和開(kāi)發(fā)工具。 主要負(fù)責(zé)的任務(wù)和領(lǐng)域 嵌入式軟件工程師的工作涉及到各種任務(wù),主要包括: * 系統(tǒng)設(shè)計(jì):包括確定系統(tǒng)功能、分配資源、優(yōu)化性能等。 * 軟件編程:包括編程
    發(fā)表于 05-16 11:00
    主站蜘蛛池模板: 入禽太深免费观看| 国产一区2区| 午夜阳光影院在线观看视频| 在线播放一区二区精品产| 俄罗斯美女性生活| 老师那里好大又粗h男男| 先锋影音av资源站av| 97人妻无码AV碰碰视频| 好男人WWW免费高清视频在线| 人驴交f ee欧美| 中国午夜伦理片| 国产香蕉尹人视频在线| 热综合一本伊人久久精品| 真人做受120分钟免费看| 国产色精品久久人妻无码 | 年轻的朋友4在线看中文字幕| 亚洲国产在线精品第二剧情不卡| 成人毛片免费观看视频大全| 麻豆国产96在线日韩麻豆| 亚洲黄色片免费看| 国产成人免费在线| 欧美美女一区二区三区| 战狼4在线观看完免费完整版| 国精产品一区二区三区| 射死你天天日| 被两根巨大同时进去高H| 免费看的一级毛片| 中文字幕日本一区| 久久国产精品无码视欧美| 性色AV一区二区三区咪爱四虎 | 精品日韩视频| 亚洲 无码 制服 日韩| 国产69精品久久久久乱码韩国| 欧美派对xxxhdparty| 最新国产av.在线视频| 九九热精品在线观看| 亚洲精品拍拍央视网出文| 国产欧美二区综合| 偷拍亚洲制服另类无码专区| 丰满饥渴老太性hd| 秋霞伦理电影在2017韩国在线伦|