尤物视频在线,校园高h,一个人看www在线是免费

現(xiàn)代社會(huì)的各個(gè)方面都需要先進(jìn)的人工智能（AI）來處理，例如對(duì)周圍環(huán)境的識(shí)別、行動(dòng)決策和運(yùn)動(dòng)控制，這包括工廠、物流、醫(yī)療、城市中的服務(wù)機(jī)器人以及安全攝像頭等應(yīng)用場(chǎng)景。然而，要在邊緣端實(shí)現(xiàn)人工智能，我們需要克服兩大挑戰(zhàn)：功耗和靈活性。

在云端，我們可以配備足夠的電源和冷卻機(jī)制來支持復(fù)雜的AI模型，但邊緣端的設(shè)備往往限制了功耗，這可能導(dǎo)致運(yùn)行時(shí)間的縮短和成本的增加。此外，隨著AI模型不斷發(fā)展，專用的AI加速硬件很快就會(huì)過時(shí)，這意味著我們需要一種更靈活的解決方案來支持新開發(fā)的AI模型。因此，嵌入式端的AI加速成為一個(gè)重要的解決方案，它可以在邊緣設(shè)備上實(shí)現(xiàn)AI任務(wù)的高效執(zhí)行，并為新的AI模型提供靈活性和支持。

為了滿足市場(chǎng)需求，瑞薩自主研發(fā)了用于AI加速的處理器DRP-AI（Dynamically Reconfigurable Processor for AI人工智能動(dòng)態(tài)可配置處理器），該處理器集成與RZ/V系列芯片中。

DRP-AI處理器具備邊緣端設(shè)備所需的低功耗和靈活性，經(jīng)過多年技術(shù)迭代已發(fā)展到第三代，實(shí)現(xiàn)了比上一代高約10倍的能效。DRP-AI3（集成與RZ/V2H）能夠適應(yīng)AI的進(jìn)一步發(fā)展和高性能機(jī)器人等應(yīng)用的復(fù)雜要求。

DRP-AI3解決了低功耗挑戰(zhàn)，并實(shí)現(xiàn)了高實(shí)時(shí)處理。它為具有AI能力的產(chǎn)品提供了更高性能和更低功耗。接下來，我們將深入了解DRP-AI3是如何實(shí)現(xiàn)這些目標(biāo)的。

1軟、硬結(jié)合系統(tǒng)性地實(shí)現(xiàn)AI模型的高速和低功耗

量化

從傳統(tǒng)的16位浮點(diǎn)運(yùn)算更改為8位整數(shù)運(yùn)算（INT8）。該方法也是現(xiàn)在比較流行的一種運(yùn)算處理方式。

修剪

采用靈活的N:M修剪方法

N:M技術(shù)的基本概念是將原始權(quán)重矩陣劃分為M行的權(quán)重矩陣組，并將其重構(gòu)為較小的N行權(quán)重矩陣組。在每組中，只提取有效權(quán)重，然后對(duì)新的權(quán)重矩陣組進(jìn)行并行運(yùn)算。DRP-AI3引入了一個(gè)新功能，它可以通過自由切換每個(gè)權(quán)重矩陣組的N值來調(diào)整運(yùn)算周期的數(shù)量，從而可以在實(shí)際的AI模型中對(duì)局部變化的修剪率執(zhí)行最優(yōu)的運(yùn)算處理。這種精細(xì)改變N的能力還允許詳細(xì)設(shè)置整個(gè)權(quán)重矩陣的修剪率，根據(jù)用戶對(duì)功耗、操作速度和識(shí)別精度的要求進(jìn)行最佳的修剪處理。

2AI系統(tǒng)架構(gòu)實(shí)現(xiàn)高功效

通過數(shù)據(jù)重用技術(shù)減少外部存儲(chǔ)器通信

DRP-AI采用了一種有效地重用一次輸入到AI-MAC的技術(shù)。例如，在3x3濾波器的卷積運(yùn)算中，一個(gè)數(shù)據(jù)像素用于九個(gè)濾波器運(yùn)算。im2col被廣泛用作GPU中的高度并行運(yùn)算方法，它以矩陣運(yùn)算的順序擴(kuò)展所有圖像數(shù)據(jù)作為輸入到GPU的預(yù)處理步驟。然而，這會(huì)導(dǎo)致一個(gè)像素的數(shù)據(jù)信息出現(xiàn)九次，數(shù)據(jù)的數(shù)量增加了九倍，進(jìn)而增加了功耗和通信帶寬的消耗。相比之下，AI-MAC可以通過將取入與MAC算術(shù)單元相對(duì)應(yīng)的寄存器中的數(shù)據(jù)移位到相鄰寄存器來重用數(shù)據(jù)，從而避免了重復(fù)存儲(chǔ)和傳輸數(shù)據(jù)，減少了功耗和通信帶寬的消耗。

通過采用如下圖所示的配置，與GPU相比，從外部存儲(chǔ)器和內(nèi)部緩沖器到AI-MAC的數(shù)據(jù)加載的數(shù)量可以減少多達(dá)九倍。這種優(yōu)化方案顯著降低了數(shù)據(jù)移動(dòng)所需的功率和通信帶寬消耗。此外，AI-MAC不僅可以對(duì)輸入數(shù)據(jù)進(jìn)行重用，還可以對(duì)輸出和權(quán)重信息進(jìn)行重用，從而將對(duì)外部存儲(chǔ)器的訪問減少了一個(gè)數(shù)量級(jí)以上。

使用輸入的零數(shù)據(jù)控制功耗

人工智能模型計(jì)算的一個(gè)特點(diǎn)是每一層的權(quán)重?cái)?shù)據(jù)和輸入/輸出數(shù)據(jù)中“零”值的比例很高，這被稱為稀疏化。例如，在圖像識(shí)別模型中，所有層50%以上的輸入和輸出數(shù)據(jù)平均為零值。這主要是因?yàn)樵S多人工智能模型使用激活函數(shù)（如ReLU），該函數(shù)會(huì)將乘積和運(yùn)算的所有負(fù)結(jié)果替換為零。在DRP-AI中，通過引入切換技術(shù)來減少不必要的計(jì)算能力。該切換技術(shù)預(yù)先檢測(cè)何時(shí)在操作的每個(gè)元素輸入中輸入零，并防止不必要的操作。

操作調(diào)度流程

除了數(shù)據(jù)重用技術(shù)之外，優(yōu)化外部數(shù)據(jù)訪問或MAC處理等操作的順序和定時(shí)對(duì)于有效的AI執(zhí)行至關(guān)重要。換句話說，調(diào)度操作流程可以最大化DRP-AI的性能。

例如，通過調(diào)度外部存儲(chǔ)器訪問定時(shí)，可以在AI-MAC操作期間提前讀取下一操作的權(quán)重信息并將其存儲(chǔ)在緩沖器中，從而防止和減少外部存儲(chǔ)器訪問延遲。這種方式也可應(yīng)用于內(nèi)部存儲(chǔ)器訪問和任何內(nèi)部算術(shù)處理的定時(shí)中，調(diào)度可以避免每個(gè)處理之間不必要的等待時(shí)間和功耗的產(chǎn)生。由于DRP-AI工具自動(dòng)生成這種優(yōu)化的調(diào)度，用戶能夠輕松應(yīng)對(duì)。

瑞薩開發(fā)的DRP-AI3（人工智能動(dòng)態(tài)可重構(gòu)處理器）是一種獨(dú)特的AI加速器。它將嵌入式端所需的低功耗和靈活性與人工智能模型輕量級(jí)的處理能力相結(jié)合，相較于以前的模型，DRP-AI3的能效提高了10倍（10 TOPS/W）。

瑞薩將繼續(xù)擴(kuò)大研發(fā)RZ/V系列，以提供更多配備這種卓越AI加速器的MPU產(chǎn)品。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19259

瀏覽量
229657
瑞薩

瑞薩

+關(guān)注

關(guān)注
35

文章
22309

瀏覽量
86241
AI

AI

+關(guān)注

關(guān)注
87

文章
30746

瀏覽量
268896

原文標(biāo)題：瑞薩黑科技——高性能AI加速模塊DRP-AI

文章出處：【微信號(hào)：瑞薩MCU小百科，微信公眾號(hào)：瑞薩MCU小百科】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺AI系統(tǒng)

RZ/V2H嵌入式AI微處理器，采用瑞薩最新的DRP-AI3技術(shù)，可提供高達(dá)8TOPS（Dense模型）/80TOPS（sparse模型）的

發(fā)表于 07-02 18:36 ?501次閱讀

基于<b class='flag-5'>瑞</b><b class='flag-5'>薩</b>RZ/V2H <b class='flag-5'>AI</b>微<b class='flag-5'>處理器</b>的解決方案：<b class='flag-5'>高性能</b>視覺<b class='flag-5'>AI</b>系統(tǒng)

Dialog宣布其EcoXiP? Octal xSPI閃存兼容瑞薩高性能RZ/A2M微處理器

具有領(lǐng)先嵌入式AI處理功能的業(yè)內(nèi)最低功耗高速Octal閃存器件與瑞薩動(dòng)態(tài)可重配置處理器（DRP）

發(fā)表于 08-12 09:12 ?1004次閱讀

瑞薩電子推出入門級(jí)MPU RZ/V2L具備出色電源效率和高精度AI加速器

DRP-AI可提供實(shí)時(shí)AI推理和圖像處理功能，具備支持?jǐn)z像頭所必需的色彩校正和降噪等功能。

發(fā)表于 05-19 13:50 ?2308次閱讀

<b class='flag-5'>瑞</b><b class='flag-5'>薩</b>電子推出入門級(jí)MPU RZ/V2L具備出色電源效率和高精度<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>

低功耗DRP-AI動(dòng)態(tài)可配置處理器有哪些關(guān)鍵特性呢

低功耗DRP-AI動(dòng)態(tài)可配置處理器有哪些關(guān)鍵特性呢？

發(fā)表于 11-08 09:16

瑞薩電子MPU中，DRP相機(jī)圖像處理庫如何應(yīng)對(duì)色差？

瑞薩電子MPU中，DRP相機(jī)圖像處理庫如何應(yīng)對(duì)色差？

發(fā)表于 09-26 18:06

瑞薩電子在中國(guó)的發(fā)展歷程

在IIoT（工業(yè)物聯(lián)網(wǎng)）領(lǐng)域，瑞薩電子推出了e-AI——嵌入式AI處理器，通過對(duì)通用嵌入式處理器

發(fā)表于 08-02 15:38 ?4397次閱讀

瑞薩電子推出支持入門級(jí)AI應(yīng)用設(shè)計(jì)的全新RZ/V2L MPU

MPU集成瑞薩獨(dú)有的人工智能（AI）加速器——DRP-AI（動(dòng)態(tài)可配置處理器），使嵌入式

發(fā)表于 05-24 09:59 ?2412次閱讀

使用RZ/V微處理器進(jìn)行AI評(píng)估

　　瑞薩嵌入式 AI 處理器的 RZ/V 系列還包括RZ/V2M ，其 AI 性能比這里介紹的R

發(fā)表于 04-24 09:39 ?1642次閱讀

使用RZ/V微<b class='flag-5'>處理器</b>進(jìn)行<b class='flag-5'>AI</b>評(píng)估

工程師說 | 引入DRP-AI TVM以簡(jiǎn)化AI模型的實(shí)施

。與云環(huán)境不同，嵌入式設(shè)備在實(shí)現(xiàn)人工智能方面有很多困難，比如要考慮HW性能、成本和功率限制。通過使用RZ/V系列AI-MPU和瑞薩的低功耗AI

發(fā)表于 05-11 20:16 ?561次閱讀

瑞薩電子RZ/V2系列MPU簡(jiǎn)介

RZ/V2系列是一種內(nèi)置瑞薩電子獨(dú)家硬件加速器 “DRP（Dynamically Reconfigurable Processor，動(dòng)態(tài)可配置處理器

發(fā)表于 09-13 12:24 ?1142次閱讀

基于瑞薩RZ/V2L MPU AI解決方案

瑞薩電子RZ/V2L配備Cortex-A55（1.2 GHz）CPU和內(nèi)置AI加速器“DRP-AI”，以提供更好的機(jī)器視覺

發(fā)表于 01-18 12:20 ?718次閱讀

RZ/V2L DRP-AI支持包版本.7.41發(fā)布說明

電子發(fā)燒友網(wǎng)站提供《RZ/V2L DRP-AI支持包版本.7.41發(fā)布說明.pdf》資料免費(fèi)下載

發(fā)表于 02-01 10:07 ?0次下載

瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理器加速器

瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理器（DRP-AI）加速器，在業(yè)界引起了廣泛關(guān)注。這款加速器擁

發(fā)表于 03-08 13:45 ?766次閱讀

下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入

發(fā)表于 08-15 11:06 ?0次下載

瑞薩電子推出高性能四核應(yīng)用處理器

全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子（TSE：6723）宣布，推出瑞薩面向工業(yè)應(yīng)用打造的最高性能微處理器

發(fā)表于 11-29 11:34 ?344次閱讀