在线观看的免费视频网站,天堂a免费视频在线观看,中文字幕影音先锋

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）AI、5G等新興產(chǎn)業(yè)的蓬勃發(fā)展催生了海量數(shù)據(jù)計(jì)算需求，同時AI算法模型持續(xù)迭代，復(fù)雜化日益凸顯，數(shù)字經(jīng)濟(jì)時代下市場需要強(qiáng)大、普惠的算力引擎。而從供給端來看，先進(jìn)制程的迭代周期變長，使得芯片能效比的提升并不顯著。

針對AI應(yīng)用特點(diǎn)實(shí)現(xiàn)硬件架構(gòu)創(chuàng)新是必然趨勢，墨芯人工智能CEO王維在某論壇上談到，依托對AI的理解用軟硬一體解決算力瓶頸問題是行業(yè)公認(rèn)的發(fā)展方向。他認(rèn)為，稀疏化能夠有效應(yīng)對算力瓶頸，實(shí)現(xiàn)原理是，不存儲和不處理零值，從而得到更小且更快的模型。

軟硬一體化稀疏路徑符合AI計(jì)算核心訴求軟硬一體化稀疏路徑符合AI計(jì)算高吞吐、低功耗、低延時的核心需求。AI稀疏產(chǎn)業(yè)化的成功要素包括：1、跨算法、軟件、硬件領(lǐng)域的協(xié)同開發(fā)；2、擁有持續(xù)多層次優(yōu)化稀疏運(yùn)算的底層算法能力；3、架構(gòu)需保證可編程性、高度可拓展屬性及快速迭代能力。

稀疏化路徑已具備批量化工程應(yīng)用能力。英偉達(dá)在2020年推出的A100產(chǎn)品中，就率先引入稀疏Tensor Core實(shí)現(xiàn)4：2結(jié)構(gòu)化稀疏，稀疏是神經(jīng)網(wǎng)絡(luò)輕量化的重要手段，英偉達(dá)稀疏化產(chǎn)品有效引領(lǐng)市場應(yīng)用趨勢。稀疏化架構(gòu)可與現(xiàn)有AI軟件生態(tài)深度適配，例如英偉達(dá)直接使用Tensor Core進(jìn)行稀疏矩陣乘累加操作，無需進(jìn)行底層編程。

基于雙稀疏特點(diǎn)，自研核心AI架構(gòu)墨芯是全球最早研發(fā)稀疏化算法及架構(gòu)的企業(yè)，并在2018年開始稀疏化的全球?qū)＠季郑?a target="_blank">公司也是最早商用稀疏化產(chǎn)品實(shí)現(xiàn)銷售的，第一款FPGA產(chǎn)品在2019年Q4開始產(chǎn)生銷售。

王維表示，現(xiàn)有芯片架構(gòu)設(shè)計(jì)在稀疏化支持中面臨較大局限，比如CPU架構(gòu)，可支持跳點(diǎn)運(yùn)算，但因其算力限制，僅能夠支持邊緣端應(yīng)用，無法支持更大的模型，再比如GPU架構(gòu)，只能進(jìn)行并行計(jì)算，所有元素（包括0元素）均參與運(yùn)算，無法實(shí)現(xiàn)高倍數(shù)加速。

基于雙稀疏特點(diǎn)，墨芯自研核心AI架構(gòu)。其雙稀疏架構(gòu)設(shè)計(jì)理念：平衡的權(quán)重和激活張量剪枝技術(shù)，可將精度損失降至最低的前提下保持對硬件的友好度；墨芯獨(dú)有的剪枝和壓縮技術(shù)可以再許多網(wǎng)絡(luò)和應(yīng)用中實(shí)現(xiàn)最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已經(jīng)回片，實(shí)測性能ResNet 50超33000SPS；墨芯板卡S4（單顆Antoum-1）僅30W功耗，實(shí)測性能實(shí)現(xiàn)英偉達(dá)主流產(chǎn)品T4近16倍能效比；墨芯板卡S4對比英偉達(dá)主流產(chǎn)品Latency可以做到1/4-1/5。

稀疏化計(jì)算產(chǎn)品商業(yè)落地，將賦能AI產(chǎn)業(yè)變革。一、助力云服務(wù)商降低單位算力擁有成本，2021年，Nvidia在中國營收超過38億美金，其中阿里，騰訊等頭部互聯(lián)網(wǎng)公司采購金額基本超過1億美金。隨著AI持續(xù)發(fā)展，數(shù)據(jù)量的指數(shù)上升導(dǎo)致AI芯片的需求會持續(xù)上升，云服務(wù)商采購額將逐年增加，因此他們對降低成本的訴求非常強(qiáng)勁，基于Antoum-1的推理卡S4相較于英偉達(dá)對標(biāo)推理卡T4，ResNest50及BERT每FPS/SPS成本降低約85%。

二、助力云服務(wù)商縮減能耗成本，電費(fèi)支出是數(shù)據(jù)中心最大的營業(yè)成本，平均數(shù)據(jù)中心近60%的營業(yè)成本是電力成本，降低能耗是數(shù)據(jù)中心和云服務(wù)商的最大痛點(diǎn)，2021年全國數(shù)據(jù)中心的耗電量占社會總用電的近3%，且增長率已連續(xù)8年超過12%，基于Antoum-1的推理卡S4相較于Nvidia主力推理卡T4，ResNest50及BERT每FPS/SPS能耗成本降低約90%。

小結(jié)目前基于稀疏化的AI架構(gòu)主要面向云端訓(xùn)練場景，不過理論上來說，稀疏化訓(xùn)練由于能大幅降低對內(nèi)存、帶寬與計(jì)算的需求，十分適合訓(xùn)練，未來墨芯在滿足推理市場的需求后，將切入訓(xùn)練市場，建立稀疏訓(xùn)練生態(tài)，產(chǎn)品在軟件層面對訓(xùn)練做更多的開發(fā)，支持訓(xùn)練專用的算子，同時硬件上也會為訓(xùn)練定義架構(gòu)。

審核編輯：彭靜

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

硬件

硬件

+關(guān)注

關(guān)注
11

文章
3315

瀏覽量
66205
AI

AI

+關(guān)注

關(guān)注
87

文章
30763

瀏覽量
268909
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47208

瀏覽量
238291

原文標(biāo)題：?稀疏化應(yīng)對算力瓶頸，助力云服務(wù)商大幅降低成本

文章出處：【微信號：elecfans，微信公眾號：電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

名單公布！【書籍評測活動NO.49】大模型啟示錄：一本AI應(yīng)用百科全書

一次大模型變革中，完全不缺態(tài)度，只缺認(rèn)知與落地的經(jīng)驗(yàn)。在過去的兩年中，我們看到了全球太多的巨頭和普通中小企業(yè)，進(jìn)入All in AI的投資周期。有的已經(jīng)開始落地到具體的生產(chǎn)流程，例如

發(fā)表于 10-28 15:34

華為云徐峰：AI 賦能應(yīng)用現(xiàn)代化，加速軟件生產(chǎn)力躍升

，分享了智能化應(yīng)用的行業(yè)實(shí)踐，并發(fā)布了華為云在應(yīng)用開發(fā)、運(yùn)行、運(yùn)維、集成領(lǐng)域的智能化新產(chǎn)品能力。在主題為“ AI 賦

發(fā)表于 10-14 09:45 ?516次閱讀

華為云徐峰：<b class='flag-5'>AI</b> <b class='flag-5'>賦</b><b class='flag-5'>能</b>應(yīng)用現(xiàn)代<b class='flag-5'>化</b>，加速軟件生產(chǎn)力躍升

云知聲入選億歐智庫“2024中國生成式AI企業(yè)商業(yè)落地Top20榜單”

價(jià)值。《報(bào)告》提出對AI商業(yè)落地的最新業(yè)態(tài)觀察，深度解析了決策式和生成式AI在垂直行業(yè)的應(yīng)用價(jià)值，并進(jìn)一步剖析了兩者在各行各業(yè)中引發(fā)的顛覆性變革

發(fā)表于 09-12 12:02 ?665次閱讀

RISC-V Summit China 2024 | 青稞RISC-V+接口PHY，賦能RISC-V高效落地

方式，從同質(zhì)化的市場環(huán)境中脫穎而出，通過專業(yè)接口技術(shù)將RISC-V導(dǎo)入下游廣闊的互聯(lián)互通場景，為萬物互聯(lián)的世界賦能。 03 青稞內(nèi)核+接口PHY，讓RISC-V高效

發(fā)表于 08-30 17:37

聚焦AI技術(shù)引領(lǐng)，智象未來全面賦能圖片及視頻內(nèi)容生產(chǎn)

當(dāng)前，AIGC浪潮不斷席卷各行各業(yè)，隨著其技術(shù)的不斷釋放，全新行業(yè)價(jià)值正在顯現(xiàn)，AI技術(shù)也在從產(chǎn)業(yè)化應(yīng)用向社會化應(yīng)用轉(zhuǎn)變，深刻影響著產(chǎn)品創(chuàng)新、內(nèi)容創(chuàng)作及

發(fā)表于 06-24 13:36 ?305次閱讀

數(shù)字EDA賦能RISC-V落地演進(jìn)技術(shù)研討會成功舉辦

為了推動RISC-V技術(shù)的落地與演進(jìn)，國家集成電路設(shè)計(jì)深圳產(chǎn)業(yè)化基地?cái)y手思爾芯，于2024年6月18日下午成功舉辦了“數(shù)字EDA賦能RISC-V落地

發(fā)表于 06-21 08:24 ?394次閱讀

數(shù)字EDA賦能RISC-V落地演進(jìn)技術(shù)研討會成功舉辦

為了推動RISC-V技術(shù)的落地與演進(jìn)，國家集成電路設(shè)計(jì)深圳產(chǎn)業(yè)化基地?cái)y手思爾芯，于2024年6月18日下午成功舉辦了“數(shù)字EDA賦能RISC-V

發(fā)表于 06-20 11:15 ?713次閱讀

AI引爆邊緣計(jì)算變革，塑造嵌入式產(chǎn)業(yè)新未來AI引爆邊緣計(jì)算變革，塑造嵌入式產(chǎn)業(yè)新未來——2024研華嵌入式

中國北京，2024年5月30日?- 2024年研華嵌入式產(chǎn)業(yè)合作伙伴會議在北京·中關(guān)村皇冠假日酒店成功舉辦，現(xiàn)場參會嘉賓逾300人。會議以“AI引爆邊緣計(jì)算變革，塑造嵌入式

發(fā)表于 05-31 13:53 ?306次閱讀

2024華為賦能江西數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展論壇成功舉辦

5月18日，由江西省科技基礎(chǔ)條件平臺中心主辦的“AI引領(lǐng)未來——華為賦能江西數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展論壇”在南昌成功舉辦。活動由江西省計(jì)算學(xué)會、江西

發(fā)表于 05-22 08:14 ?515次閱讀

中科創(chuàng)達(dá)全球首發(fā)面向中央計(jì)算的AI原生整車操作系統(tǒng)—滴水OS

2024年4月26日，作為全球領(lǐng)先的智能操作系統(tǒng)及端側(cè)智能產(chǎn)品和技術(shù)提供商，中科創(chuàng)達(dá)在北京國際車展上全球首發(fā)面向中央計(jì)算的AI原生整車操作系統(tǒng)——滴水OS，旨在賦

發(fā)表于 04-28 09:58 ?916次閱讀

文遠(yuǎn)知行與聯(lián)想車計(jì)算戰(zhàn)略合作，推進(jìn)自動駕駛商業(yè)化落地

文遠(yuǎn)知行與聯(lián)想車計(jì)算達(dá)成戰(zhàn)略合作，共同推進(jìn)L4級別自動駕駛解決方案的商業(yè)化落地，這一舉措無疑為自動駕駛領(lǐng)域注入了新的活力。這次合作不僅彰顯了雙方在自動駕駛技術(shù)方面的深厚積累，也預(yù)示著自動駕駛技術(shù)

發(fā)表于 03-20 10:19 ?520次閱讀

“AI+工業(yè)互聯(lián)網(wǎng)”賦能新型工業(yè)化的路徑分析

橫看成嶺側(cè)成峰，探索“AI+工業(yè)互聯(lián)網(wǎng)”技術(shù)賦能新型工業(yè)化的路徑，還要從技術(shù)視角、產(chǎn)業(yè)視角、應(yīng)用視角綜合分析。

發(fā)表于 03-14 10:57 ?1157次閱讀

國資委重磅部署！央企引領(lǐng) AI賦能 產(chǎn)業(yè)煥新

2月19日，國務(wù)院國資委召開“AI賦能 產(chǎn)業(yè)煥新”中央企業(yè)人工智能專題推進(jìn)會。

發(fā)表于 02-29 17:41 ?697次閱讀

高通持續(xù)推動終端側(cè)生成式AI變革，推出高通AI Hub賦能開發(fā)者

高通現(xiàn)賦能終端側(cè)AI在下一代PC、智能手機(jī)、軟件定義汽車、XR設(shè)備和物聯(lián)網(wǎng)等領(lǐng)域規(guī)模化商用，讓智能計(jì)算無處不在。

發(fā)表于 02-26 16:46 ?609次閱讀

AI PC是什么？如何變革PC產(chǎn)業(yè)（2023）

AI PC整合了輕量化AI模型，將實(shí)現(xiàn)各種生成式AI應(yīng)用的離線穩(wěn)態(tài)運(yùn)行。作為設(shè)備、邊緣計(jì)算和云技術(shù)的混合體，

發(fā)表于 12-27 17:37 ?1509次閱讀