色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

支撐移動端高性能AI的幕后力量!谷歌提出全新高性能MobileNet V3

nlfO_thejiangme ? 來源:lq ? 2019-05-10 09:39 ? 次閱讀

支撐移動端高性能AI的幕后力量!谷歌提出全新高性能MobileNet V3,網絡模型搜索與精巧設計的完美結合造就新一代移動端網絡架構。

在剛剛過去的谷歌I/O上小伙伴對新發布的技術一定過足了癮。支撐谷歌整合全球信息的AI被提到了至關重要的位置,從云到端,從安卓系統到移動設備無處不在的AI都顯示出向善的力量。移動端作為與用戶交流最為密切的設備,支撐它的AI技術正在飛速發展。為了實現更準確、更迅速更節能的移動端模型,在I/O大會召開的同日谷歌發表文章推出了最新一代移動端網絡架構MobileNet V3,也許這就是為Pixels提供優異表現背后的力量。在最新的論文里,研究人員結合了網絡架構搜索技術和新穎的架構設計實現了新一代的MobileNetV3,更適合移動端CPUs運行。新的模型在精度和延遲上進行了很好的平衡,并在圖像分類、檢測和分割上取得了超過V2版本15%~30%的速度提升。

V3兩個版本的模型與先前模型在精度-速度上表現的對比(TFLite在單核CPU上測試)。

同時在相同的模型大小下取得了更好的精度。

V3模型在模型大小、操作與精度上表現與先前模型的對比。

隨著AI的發展和落地,高效的神經網絡逐漸成為了移動設備和app的標配。一個高效的模型實現不僅能帶來順滑的體驗,更因為無需上傳用戶數據就能訓練模型而增強了對于用戶隱私的保護。除了帶來低延時的使用體驗,高效模型還為持久續行的移動設備節省了更多電能開銷。(I/O大會上對于隱私的強調和長續航的Pixels手機也許就有這個mobileNetV3的貢獻呢。)

在最新的論文中,研究人員提出了包含兩個子版本的MobileNetV3(Large/Small)為移動端高精度高效率的計算機任務提供AI動力。新模型不僅拓展了移動端網絡的能力邊界,更在實現過程中將模型自動搜索方法和新穎架構設計有機結合起來,創造出高效準確的模型架構。為了構建高效的網絡模型權衡精度和效率,研究人員設計了各設各樣精妙的模型,同時也利用了自動化的大規模架構搜索來不斷探索能力更強、效率更高的模型。這些精妙的設計不斷提高了移動端模型的效率和精度。SqueezeNet開始模型的參數量就不斷下降,為了進一步減少模型的實際操作數(MAdds),MobileNetV1利用了深度可分離卷積提高了計算效率,而v2則加入了線性bottlenecks和反轉殘差模塊構成了高效的基本模塊。隨后的ShuffleNet充分利用了組卷積和通道shuffle進一步提高模型效率。CondenseNet則學習保留有效的dense連接在保持精度的同時降低,ShiftNet則利用shift操作和逐點卷積代替了昂貴的空間卷積。除了各種精巧的設計,研究人員們還請來的算法幫忙自動化設計和搜索網絡模型。強化學習最先被引入這個領域,早期的工作主要集中在cell級別的結構搜索并復用所有層中,而最近的工作則拓展到了塊級別的架構,模型探索不同的層結構和不同分辨率的塊結構來構建網絡。此外網絡模型的剪枝和量化也是提高效率的重要途徑。在這些技術的加持下,Google的研究人員開始著手構建更強大的v3模型。在充分研究了v1版本的深度可分離模塊、v2版本的線性瓶頸和反轉殘差、MnasNet中的序列激活結構后,綜合了三種結構的優點設計出了高效的v3模塊,并利用了改進后的swish作為激活函數,使得后續的量化和效率提升更為有效。在構建v3版本模塊的過程中研究人員主要進行了網絡搜索和模型改進兩個部分,自動和手動的協同工作得到了更為先進的模型架構。

網絡搜索

對于模型結構的探索和優化來說,網絡搜索是強大的工具。研究人員首先使用了神經網絡搜索功能來構建全局的網絡結構,隨后利用了NetAdapt算法來對每層的核數量進行優化。對于全局的網絡結構搜索,研究人員使用了與Mnasnet中相同的,基于RNN的控制器和分級的搜索空間,并針對特定的硬件平臺進行精度-延時平衡優化,在目標延時(~80ms)范圍內進行搜索。隨后利用NetAdapt方法來對每一層按照序列的方式進行調優。在盡量優化模型延時的同時保持精度,減小擴充層和每一層中瓶頸的大小。

網絡改進

在機器搜索得到網絡架構的基礎上,研究人員引入了諸多新型的結構來提升模型的最終效果。不僅重新設計了網絡頭和尾的計算密集層,同時還引入了新的非線性激活h-swish,提升計算和量化能力。mobileNetV2模型中反轉殘差結構和變量利用了1*1卷積來構建最后層,以便于拓展到高維的特征空間,雖然對于提取豐富特征進行預測十分重要,但卻引入了二外的計算開銷與延時。為了在保留高維特征的前提下減小延時,將均值池化前的層移除并用1*1卷積來計算特征圖。特征生成層被移除后,先前用于瓶頸映射的層也不再需要了,這將為減少10ms的開銷,在提速15%的同時減小了30m的操作數。

同時在模型的前端,32個3*3的卷積通過h-swish非線性在保持精度的情況下壓縮到了16個卷積核,又減小了10m操作和3ms的開銷。

對于非線性激活函數,swish雖然很有效但在移動端運行開銷很大,研究人員從兩個方面著手解決這一問題。一方面利用了hard(硬)版本的激活函數:

這種非線性在保持精度的情況下帶了了很多優勢,首先ReLU6在眾多軟硬件框架中都可以實現,其次量化時避免了數值精度的損失,運行快。這一非線性改變將模型的延時增加了15%。但它帶來的網絡效應對于精度和延時具有正向促進,剩下的開銷可以通過融合非線性與先前層來消除。另一方面,研究發現非線性使用帶來的開銷會隨著網絡深度的加深而減小,所以研究人員將在后半部分較深的層中使用以減小開銷。研究人員提出了一大一小兩個模型,分別針對不同級別計算資源的硬件平臺。下表展示了兩種不同模型的架構。可以看到先前提到的h-wish集中在后半部分。

分類、檢測、分割驗證模型能力提升

為了驗證新模型的精度與效率,研究人員分別在圖像分類、目標檢測和實例分割任務上進行了測試,指標全面提升。首先來看ImageNet上的分類結果:

可以看到large版本的模型在精度、操作數上都得到了提升,特別是延時縮短了很多。研究人員還研究了網絡中的乘數因子與分辨率對精度和延時造成的影響:

此外還進行了消融性測試,分別分析了h-swish和各個部件對于模型精度延時的影響:

隨后在COCO數據集上基于V3實現的SSDLite進行了目標檢測任務的評測,可以看到map提升或者延時大幅下降了,100ms左右即可完成目標檢測:

最后還在Cityscape實例分割任務上進行了測試。研究人員還提出了新的輕型R-ASPP (reduced design of the Atrous Spatial Pyramid Pooling)模塊用于分割頭的架構。一個分支用了很大的池化核和大步長節省計算量,另一個分支只用了1*1卷積抽取稠密特征,并加入了底層特征來捕捉更多的細節信息。下圖顯示了減半輸出濾波器數量、改變分割頭、改變輸出步長情況下的實例分割結果,可以看到通過各種性能提升,可以在CPUs上實現400ms左右的分割。

目前github已經能搜到兩個v3版基于PyTorch代碼實現:

https://github.com/AnjieZheng/MobileNetV3-PyTorchhttps://github.com/leaderj1001/MobileNetV3-Pytorch

其中模型定義在model.py/mobilenet_v3.py中,感興趣的小伙伴可以嘗試下新版本的MobileNet香不香?配合論文學習,理論聯系實際學得快記得牢!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6161

    瀏覽量

    105303
  • 強化學習
    +關注

    關注

    4

    文章

    266

    瀏覽量

    11247
  • ai技術
    +關注

    關注

    1

    文章

    1266

    瀏覽量

    24287

原文標題:首發 | 精度、速度、效率、性能全面提升!揭秘谷歌最新一代移動端網絡架構MobileNet V3

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電工知識??電工接線??高性能實用工具? #硬聲創作季

    DIY高性能
    Hello,World!
    發布于 :2022年09月26日 20:20:37

    高性能實用工具??我愛發明??生活好妙招? #硬聲創作季

    DIY高性能
    Hello,World!
    發布于 :2022年09月26日 20:52:22

    #高性能實用工具 #好工具 #手工制作#硬聲創作季

    DIY高性能
    Hello,World!
    發布于 :2022年10月20日 12:12:09

    #硬聲創作季 家里的音箱壞了,便制作了一個高性能移動音箱

    音箱DIY高性能
    Mr_haohao
    發布于 :2022年10月20日 23:03:23

    [3.4.1]--專題報告:最新高性能天線設計方法林斌副教授_clip001

    高性能電波傳播天線技術
    jf_60701476
    發布于 :2022年11月22日 01:53:37

    [3.4.1]--專題報告:最新高性能天線設計方法林斌副教授_clip002

    高性能電波傳播天線技術
    jf_60701476
    發布于 :2022年11月22日 01:54:27

    Firefly支持AI引擎Tengine,性能提升,輕松搭建AI計算框架

    `Tengine 是OPEN AI LAB 為嵌入式設備開發的一個輕量級、高性能并且模塊化的引擎。基于ARM平臺高效的計算庫實現,針對特定硬件平臺的性能優化,吸取已有AI計算框架的優點
    發表于 08-13 15:58

    基于ZU3EG的低功耗高性能嵌入式AI高性能計算模組

    基于ZU3EG的低功耗高性能嵌入式AI高性能計算模組 ![在這里插入圖片描述](?x-oss-process=image/watermark,type_ZmFuZ
    發表于 12-14 08:38

    AutoKernel高性能算子自動優化工具

    主要由資深HPC工程師(高性能計算優化工程師)進行開發,為了加快開發進程,縮短深度學習應用落地周期,自動化算子優化是一個趨勢。AutoKernel是由OPEN AI LAB提出高性能
    發表于 12-14 06:18

    全新高性價比STM32H5讓性能和安全觸手可及

    全新高性價比STM32H5,引入STM32H5 MCU系列用于高性能設計,提高應用程序性能,有靈活的電源模式,安全性可擴展
    發表于 09-05 06:51

    請問k210能運行Mobilenet v3嗎?

    請問k210能運行Mobilenet v3
    發表于 09-14 07:40

    德州儀器推出全新高性能DSP

    日前,德州儀器 (TI) 宣布推出低成本、高性能 TMS320C6454 DSP,使設計人員在同等價格下獲得更高性能的 DSP 。全新 1 GHz C6454 DSP 建立在增強型TMS320C64x+TM DSP 內核與 TI
    發表于 12-02 15:57 ?9次下載

    全新高性能 Sitara?? AM263 MCU 如何發揮電氣化設計的全部潛能

    全新高性能 Sitara?? AM263 MCU 如何發揮電氣化設計的全部潛能
    發表于 10-28 11:59 ?0次下載
    <b class='flag-5'>全新高性能</b> Sitara?? AM263 MCU 如何發揮電氣化設計的全部潛能

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術發展的基石,更是推動AI應用落地、加速產業升級的重要工具。以下,是對AI
    的頭像 發表于 11-11 09:56 ?180次閱讀
    主站蜘蛛池模板: 在线伦理电影网| 无码骚夜夜精品| 青青草干免费线观看| 情浓野战台湾三级| 天美传媒在线完整免费观看网站 | 51国产偷自视频在线视频播放 | 最近2019中文字幕免费| 2017欧美狠狠色| 超碰97人人做人人爱少妇| 国产AV精品国语对白国产| 国产亚洲精品福利视频| 精品久久久久久久久免费影院| 噜噜噜狠狠夜夜躁精品| 日本熟妇乱妇熟色A片蜜桃| 武汉美女洗澡| 中文字幕专区高清在线观看| 扒开美女嫩bbb| 国际老妇高清在线观看| 免费国产久久啪久久爱| 熟女啪啪白浆嗷嗷叫| 在线观看国产视频| 乱奷XXXXXHD| 无码精品AV久久久奶水| 综合色一色综合久久网vr| 国产精品人妻系列21P| 毛片一区二区三区| 天天狠狠色噜噜| 9277高清在线观看视频| 国产女人喷潮视频免费| 欧美三级aaa| 中文字幕在线永久| 国产一级特黄aa毛片| 区产品乱码芒果精品P站在线| 在线观看视频亚洲| 国产露脸无码A区久久蘑菇| 欧美精品成人一区二区在线观看| 一边吃奶一边啪啪真舒服| 国产原创中文视频| 我的美女奴隶| 国产成人在线网站| 求个av网站|