人工智能應(yīng)用場(chǎng)景眾多,認(rèn)同AI安防優(yōu)先落地,有些場(chǎng)景需要在終端實(shí)現(xiàn),對(duì)芯片功耗、效率,運(yùn)算能力要求較高,這是當(dāng)前AI芯片發(fā)展方向,也是制約AI終端應(yīng)用大范圍落地的瓶頸。深鑒科技就在朝著這個(gè)方向努力,從基于FPGA和ASIC芯片的硬件定制化架構(gòu),到算法壓縮,深鑒致力于提供高效、低能耗的處理器。當(dāng)前已有標(biāo)準(zhǔn)化模組產(chǎn)品,助力圖像識(shí)別、結(jié)構(gòu)化算法加速,測(cè)試結(jié)果表明深鑒產(chǎn)品與其他終端處理器相比,在性能、效率方面等均有優(yōu)勢(shì)。
人工智能場(chǎng)景:應(yīng)用場(chǎng)景眾多,復(fù)雜程度不一。主要典型場(chǎng)景如下:
阿爾法狗下圍棋場(chǎng)景:行為較為單一,任務(wù)其實(shí)相對(duì)簡(jiǎn)單。
機(jī)器人運(yùn)動(dòng)場(chǎng)景:人的行走相對(duì)復(fù)雜,考慮因素眾多,相對(duì)復(fù)雜。
自動(dòng)駕駛場(chǎng)景:更為復(fù)雜,需要考慮社群行為。即除了自動(dòng)駕駛行為決策外,還要考慮其他行駛者行為的影響。
行業(yè)應(yīng)用落地場(chǎng)景:認(rèn)同AI落地第一個(gè)場(chǎng)景-AI安防的觀點(diǎn)。
當(dāng)前AI安防已經(jīng)有大量需求,2016年安防監(jiān)控出貨量:1億4千萬(wàn)個(gè)模組和傳感器。安防主要部署在終端,對(duì)處理器的成本、帶寬,延時(shí)等性能都有較高要求。
其他終端應(yīng)用場(chǎng)景:機(jī)器人和無(wú)人機(jī)
要求:時(shí)延低,功耗低,價(jià)格敏感,是AI具有挑戰(zhàn)性場(chǎng)景。
目前市場(chǎng)上已經(jīng)有消費(fèi)類產(chǎn)品:家庭陪伴機(jī)器人,掃地機(jī)器人,家庭語(yǔ)音聊天機(jī)器人等。主要是通過(guò)云端進(jìn)行語(yǔ)音識(shí)別進(jìn)行人機(jī)交互。
還有提升空間,核心處理轉(zhuǎn)移到前端將會(huì)帶來(lái)市場(chǎng)空間。
AI處理器現(xiàn)狀,目前尚處于早期,效率,功耗等均有待提高。阿爾法狗戰(zhàn)勝李世石用了2千個(gè)CPU,3千個(gè)GPU,同時(shí)還花費(fèi)電費(fèi)3千美元,難以在現(xiàn)實(shí)場(chǎng)景應(yīng)用。AI真實(shí)場(chǎng)景應(yīng)用,對(duì)計(jì)算能力,功耗,開發(fā)門檻要求較高。終端應(yīng)用對(duì)功耗要求更高,無(wú)論是終端還是云端都面臨成本壓力:降低前期投入成本和后期運(yùn)維成本。
AI三個(gè)關(guān)鍵因素:數(shù)據(jù),算法,硬件。當(dāng)前許多AI處理都在是云端完成,因?yàn)樾枰?jì)算集群提供強(qiáng)大運(yùn)算能力,短時(shí)間完成算法優(yōu)化、數(shù)據(jù)清洗、適配,訓(xùn)練數(shù)據(jù),快速迭代。但是有些場(chǎng)景不適用云端場(chǎng)景:延時(shí)要求較高的場(chǎng)景。終端設(shè)備無(wú)需連接服務(wù)器、延時(shí)較低,可以適用這些場(chǎng)景。預(yù)計(jì)未來(lái)終端應(yīng)用將會(huì)增加,數(shù)據(jù)也越來(lái)越多,形成數(shù)據(jù)量和處理能力之間的剪刀差。這是阻礙AI大范圍應(yīng)用的主要因素。
當(dāng)前大量公司開發(fā)硬件,基本所有AI相關(guān)公司都有想法或已經(jīng)付諸行動(dòng),部署相應(yīng)加速硬件。未來(lái)趨勢(shì),未來(lái)AI大規(guī)模應(yīng)用落地,高效、合適的計(jì)算平臺(tái)是必要條件。
深度學(xué)習(xí)處理器:大公司都在做,比如谷歌,百度,英偉達(dá)為典型。
創(chuàng)業(yè)公司主要有:寒武紀(jì)、深鑒科技、地平線機(jī)器人等等。
大家共同的目標(biāo):便宜高效完成AI計(jì)算。
深鑒科技主要擅長(zhǎng):
1.硬件加速:基于賽靈思的FPGA硬件和ASIC專為深度學(xué)習(xí)定制,設(shè)計(jì)專門AI硬件架構(gòu)。
2.算法壓縮和量化:人類神經(jīng)元數(shù)量連接數(shù)量3-5歲達(dá)到最高峰,十幾歲人腦功能達(dá)到穩(wěn)定,連接數(shù)減少到2/3-3/4。這一階段是學(xué)習(xí)最快的階段,大腦會(huì)自動(dòng)砍掉無(wú)效連接。算法壓縮就在做同樣的事,在不損失精度情況下壓縮網(wǎng)絡(luò)。對(duì)模型進(jìn)行剪枝、壓縮、量化,在不損精度情下,可以將運(yùn)算速度提升數(shù)倍至數(shù)十倍。
測(cè)試1.分類網(wǎng)絡(luò)壓縮:
對(duì)分類網(wǎng)絡(luò)做壓縮前后,兩類不同對(duì)象處理性能對(duì)比:可以在將模型壓縮到51%神經(jīng)元的情況下,達(dá)到同樣精度,大大提高處理速度。
測(cè)試2.SSD網(wǎng)絡(luò)壓縮:
測(cè)試表明:可以在實(shí)現(xiàn)相同精度情況下,將網(wǎng)絡(luò)縮小至10%。也就是原來(lái)一秒1張圖片,現(xiàn)在可處理10張圖片。
功耗需求:
面向AI終端定制芯片的目標(biāo)功耗是:1-10W區(qū)間,這一領(lǐng)域尚處空白,各公司均向這方向努力。
橫坐標(biāo):功耗,縱坐標(biāo):運(yùn)行速度,斜率越高效率越高。
1-10w的紅圈區(qū)域:空白區(qū)。當(dāng)前IOT功耗是幾十-幾百W,需要大規(guī)模量產(chǎn)化才能降低成本,并且?guī)资甒難以作為應(yīng)用端芯片。其他性能強(qiáng)大的芯片過(guò)高功耗,需要的成本較高。
測(cè)試3.效率比較:
衡量芯片兩個(gè)關(guān)鍵指標(biāo):峰值性能:取決于公司的技術(shù)水平以及財(cái)力,較高工藝需要較大成本。
效率:取決于公司技術(shù)情況。
效率定義:運(yùn)行時(shí)工作芯片單元占總芯片單元數(shù)比重,即100個(gè)計(jì)算單元,每個(gè)時(shí)鐘周期有多少在工作。
深鑒科技可達(dá)50%以上;iphone8可以達(dá)到20-40%;Kirin970:20%左右。
深鑒科技產(chǎn)品:
當(dāng)前市場(chǎng)主流AI應(yīng)用場(chǎng)景:安防,數(shù)據(jù)中心,機(jī)器類相關(guān)。深鑒科技也都在做。
深鑒目前標(biāo)準(zhǔn)量產(chǎn)化產(chǎn)品:前端智能模組,可以提高前端運(yùn)算能力。可以通過(guò)增加硬件的方式,實(shí)現(xiàn)支持多路、實(shí)時(shí)視頻處理,可以輔助進(jìn)行人臉識(shí)別,結(jié)構(gòu)化模型處理。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47350瀏覽量
238746 -
神經(jīng)元
+關(guān)注
關(guān)注
1文章
363瀏覽量
18461 -
AI芯片
+關(guān)注
關(guān)注
17文章
1889瀏覽量
35062
原文標(biāo)題:全球人工智能AI芯片有望提前在安防領(lǐng)域落地
文章出處:【微信號(hào):ittbank,微信公眾號(hào):ittbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論