色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IBM研制可兼顧高精度學習和低精度推理的深度學習芯片

EdXK_AI_News ? 來源:未知 ? 作者:胡薇 ? 2018-07-10 08:56 ? 次閱讀

IBM正在研制一種可兼顧高精度學習和低精度推理的深度學習芯片

深度學習領域仍在不斷發展,特別地,專家們認識到如果芯片能夠使用低精度的計算方式得出近似答案,神經網絡就可以用很少的資源完成大量的計算。這在移動設備和其他功率受限的設備中尤其有用。但對某些任務,尤其是訓練神經網絡去完成某些事情的任務來說,精確性仍然是必需的。IBM最近在IEEE VLSI研討會上展示了其最新的解決方案(目前仍然是原型):一款在上述兩方面都有良好表現的芯片。

訓練神經網絡與使用該網絡執行其功能(稱為推理)的需求之間存在脫節,這對那些從事于設計芯片以加速AI功能的人來說是一個巨大的挑戰。IBM的新型AI加速器芯片能夠滿足該公司提出的所謂范圍精度(scaled precision)要求。也就是說,它可以在32位、16位,甚至1位或2位模式下進行訓練和推理。

IBM約克鎮高地(Yorktown Heights)研究中心的杰出技術人員、該項工作的領導者Kailash Gopalakrishnan解釋說:“在訓練中,你能夠使用的最好精度是16位,而在推理中可以應用的最好精度是2位。這個芯片可能涵蓋了目前已知的最佳訓練和最好推理。”

該芯片能夠獲得上述表現的原因來自于兩項創新,而這兩項創新的目標都是實現相同的結果——保持所有處理器組件能夠得到數據和工作。

Gopalakrishnan說:“在深度學習方面,傳統芯片架構面臨的挑戰之一是利用率一般非常低。”也就是說,即使芯片可能具有非常高的峰值性能,通常只有20%到30%的資源能夠被用于解決問題。IBM始終將所有任務的目標定為90%。

利用率低通常是因為存在于芯片周圍的數據流瓶頸。為了突破這些信息障礙,Gopalakrishnan的團隊開發了一個“定制”的數據流系統。該數據流系統是一種網絡方案,可以加速數據從一個處理引擎到下一個處理引擎的傳輸過程。它還針對要處理的是學習任務還是推理任務以及不同的精度進行了優化。

第二項創新是使用專門設計的“便箋本”形式的片上存儲器,而不是CPUGPU上的傳統高速緩沖存儲器。構建高速緩存是為了遵守某些對一般計算有意義的規則,但會導致深度學習的延遲。例如,在某些情況下,緩存會將一大塊數據推送到計算機的主存儲器(強制推送),但如果神經網絡的推理或學習過程需要用到該數據,則系統將不得不保持等待狀態,直到可以從主存儲器中檢索到該數據。

便箋本遵循不同的規則。構建它的目標是為了保持數據流經芯片的處理引擎,并確保數據在恰當的時間處于正確的位置。為了獲得90%的利用率,IBM必須使設計出的便箋本具有巨大的讀/寫帶寬(每秒192千兆字節)。

由此產生的芯片可以執行當前所有的三種主要深度學習AI:卷積神經網絡(CNN)、多層感知器(MLP)和長-短期記憶(LSTM)。Gopalakrishnan解釋說,這些技術共同主導了語言、視覺和自然語言處理。在16位精度(尤其是針對訓練)情況下,IBM的新芯片能夠在每秒鐘內執行1.5萬億次浮點運算;在2位精度下(推理的最佳設置)則躍升到每秒12萬億次運算。

Gopalakrishnan指出,由于芯片是采用先進的硅CMOS工藝(GlobalFoundries的14納米工藝)制造的,每秒鐘內發生的所有這些操作都被限制在一個相當小的區域內。為了推理出一個CNN網絡,該芯片可以在每平方毫米內每秒執行平均1.33萬億次操作。這個數字很重要,“因為在很多應用中,你的成本受到尺寸的限制,”他說。

新的架構也證明了IBM研究人員幾年來一直在探索的東西:如果以高得多的精度訓練神經網絡,真正低精度的推理就無法正常進行。Gopalakrishnan說:“當低于8位時,訓練與推理將開始直接相互影響。一個在16位模式下訓練但以1位模式部署的神經網絡系統將出現無法接受的重大錯誤。因此,以與最終部署方式類似的精度訓練網絡將帶來最好的結果。”

尚無任何消息披露這項技術什么時候可能以Watson或其他形式進行商業化,但Gopalakrishnan的領導、IBM半導體研究所的副總裁Mukesh Khare表示希望它能夠發展和改進。他說:“這只是冰山一角,我們正在進行更多創新。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1758

    瀏覽量

    74727
  • 深度學習
    +關注

    關注

    73

    文章

    5506

    瀏覽量

    121259

原文標題:IBM正在研制通用型深度學習芯片

文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ADS7142如果保證其高精度呢?

    從ADS7142的Datasheet來看,應該是一個16位的高精度AD,但參考的基準電壓卻是用的電源,那么如果保證其高精度呢?因為常用的LDO的精度普遍大于1%且存在溫漂,如果用基
    發表于 12-16 07:07

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?414次閱讀

    AI大模型與深度學習的關系

    人類的學習過程,實現對復雜數據的學習和識別。AI大模型則是指模型的參數數量巨大,需要龐大的計算資源來進行訓練和推理深度學習算法為AI大模型
    的頭像 發表于 10-23 15:25 ?886次閱讀

    物聯網系統中高精度RTK定位方案的實現_高精度定位模塊

    物聯網系統中為什么要使用高精度定位模塊 物聯網系統中使用高精度定位模塊的原因主要體現在以下幾個方面: 提高定位精度 厘米級高精度高精度定位
    的頭像 發表于 09-26 17:53 ?1321次閱讀
    物聯網系統中<b class='flag-5'>高精度</b>RTK定位方案的實現_<b class='flag-5'>高精度</b>定位模塊

    VS高精度電壓傳感器

    ? ? ? ? VS系列電壓傳感器是一種量程覆蓋35kV及以下的直流、交流、周期性脈沖以及各種不規則波形的電壓傳感器,精度高達0.05%FS、帶寬高達100kHz,滿足寬頻帶、高精度電壓測試需求
    的頭像 發表于 09-19 15:55 ?387次閱讀
    VS<b class='flag-5'>高精度</b>電壓傳感器

    深度學習編譯器和推理引擎的區別

    深度學習編譯器和推理引擎在人工智能領域中都扮演著至關重要的角色,但它們各自的功能、應用場景以及優化目標等方面存在顯著的差異。以下是對兩者區別的詳細探討。
    的頭像 發表于 07-17 18:12 ?1278次閱讀

    深度神經網絡模型量化的基本方法

    深度神經網絡模型量化是深度學習領域中的一種重要優化技術,旨在通過減少模型參數的精度(即從高精度浮點數如32位浮點數FP32降低到
    的頭像 發表于 07-15 11:26 ?706次閱讀

    深度學習模型量化方法

    深度學習模型量化是一種重要的模型輕量化技術,旨在通過減少網絡參數的比特寬度來減小模型大小和加速推理過程,同時盡量保持模型性能。從而達到把模型部署到邊緣或者算力設備上,實現降本增效的目
    的頭像 發表于 07-15 11:01 ?499次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>模型量化方法

    什么是高精度定位平板?

    高精度定位平板是一種結合了高精度定位技術和強大計算能力的平板電腦,廣泛應用于測繪、地理信息系統(GIS)、精準農業、工程建設和公共安全等領域。其核心特點在于能夠提供亞米級甚至厘米級的定位精度,遠超
    的頭像 發表于 06-12 17:53 ?834次閱讀

    北斗高精度定位終端的工作原理和精度范圍

    北斗高精度定位終端的工作原理主要基于北斗衛星導航系統,通過衛星信號的接收、處理和計算,實現了對目標位置的精確測量。以下是關于北斗高精度定位終端工作原理的引文:北斗高精度定位終端?北斗高精度
    的頭像 發表于 05-28 11:15 ?687次閱讀
    北斗<b class='flag-5'>高精度</b>定位終端的工作原理和<b class='flag-5'>精度</b>范圍

    幾款高精度時鐘芯片的規格選型分析

    幾款高精度時鐘芯片,幾乎很多應用都需要精確的計時例如銀行系統,安全系統和電能表等。獲得高精度實時時鐘芯片的關鍵在于:精確頻率振蕩設備,以及用于控制它們的集成
    發表于 05-13 11:50 ?0次下載

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術,使得
    發表于 04-23 17:18 ?1315次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    友思特應用 | 高精度呈現:PCB多類型缺陷檢測系統

    高精度呈現!友思特PCB多類型缺陷檢測系統,借由深度學習自動標注功能排查全部微小缺陷,為工業 PCB生產制造提供了先進可靠的質量保障。
    的頭像 發表于 04-10 17:51 ?931次閱讀
    友思特應用 | <b class='flag-5'>高精度</b>呈現:PCB多類型缺陷檢測系統

    測新能源高精度檢測應用指南

    。這本《新能源高精度檢測應用指南》包含了涂布檢測、電池檢測、硅片檢測、鈣鈦礦檢測等應用,涵蓋了由微米級至亞納米級精度的檢測方案,一本在手,幫您解決新能源高精度檢測
    發表于 03-06 10:30 ?0次下載

    電感多少精度高精度

    電感作為電子電路中非常重要的電子元器件之一,我們在選擇電感時候會考慮它的精度。電感精度其實指的是電感值的公差或者容差,這個參數對于確保電路性能的穩定性很重要。那么,你知道電感多少精度的算高精度
    的頭像 發表于 01-23 09:21 ?582次閱讀
    主站蜘蛛池模板: 中文字幕亚洲欧美日韩2o19| 久久91精品久久久久久水蜜桃| 老司机深夜福利ae 入口网站 | 甜性涩爱dvd| 国内精品久久久久久久试看| 伊人久久综合影院| 暖暖 免费 高清 日本在线| 国产 浪潮AV性色四虎| 一个人在线观看免费中文www| 毛片手机在线看| 国产高清视频青青青在线| 一级做a爰片久久毛片免费| 欧美三级在线完整版免费| 国产午夜免费不卡精品理论片| 538prom精品视频我们不只是| 手机移动oa| 浪潮色诱AV久久久久久久| 国产成人免费a在线资源| 又硬又粗又大一区二区三区视频| 日本肉肉口番工全彩动漫| 久久99国产亚洲高清观着| 纯肉高H啪短文合集| 伊人大香人妻在线播放| 日韩a视频在线观看| 老湿影院色情a| 国产午夜精品一区二区| FREEHDXXXX学生妹| 幺妹视频福利视频| 天天干夜夜叭| 欧美性类s0x| 久久精品国产亚洲AV久五月天 | 99久久久久精品国产免费麻豆 | 最新无码二区日本专区| 亚洲 自拍 偷拍 另类综合图区| 欧美午夜理伦三级在线观看| 精品久久免费视频| 国产精品2020观看久久| H揉捏娇喘乳叫床NP调教视频| 伊人热人久久中文字幕| 亚洲AV精品无码成人| 日本人bbwbbwbbwbbw|