微軟已經為深度學習優化庫 DeepSpeed 申請了商標保護。該商標于2020年12月8日提交,其中提到“為人工智能處理和深度學習提供臨時使用的在線不可下載的計算機軟件”,這表明微軟可能在考慮通過在線云服務提供 DeepSpeed。
該庫于今年 2 月發布,可以在適度的硬件上訓練大規模的人工智能模型。它只需要使用 800 塊 Nvidia V100 顯卡就可以創建具有萬億參數的深度學習模型,是目前世界上最大的模型的 5 倍多。如果沒有DeepSpeed,同樣的任務需要 4000 塊 Nvidia A100(性能比 V100 快2.5倍),而且事件縮短了 100 多天。
在 GPT-3 顯示模型在神經網和數據集越大的情況下繼續改進后,這個工具特別有用。然而,這確實有可能將最新的創新推到資源較少的小型團隊的范圍之外,但DeepSpeed已經允許這些團隊以最小的硬件與更大的服務競爭。轉移到云處理可能會使大型模型AI訓練更容易獲得。
責任編輯:haq
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6590瀏覽量
104026 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238265 -
云服務
+關注
關注
0文章
818瀏覽量
38908
發布評論請先 登錄
相關推薦
通過工業智能網關實現與微軟Azure IoT中心快速配置操作
微軟Azure IoT 中心是一個基于Azure云服務構建的端到端IoT SaaS(軟件及服務)平臺,可以為企業及個人用戶提供實現靈活、輕松
美國的云服務器什么價格能買到?
美國云服務器價格因配置、地理位置、服務商等因素而異,月租費用大致在10美元至數百美元不等,年租費用則在120美元至數千美元之間?;A配置月租可能在20至50美元,高性能配置則高達數百美
新加坡云主機需要考慮哪些方面
新加坡云主機是指部署在新加坡的云計算主機服務,它能夠提供高度安全、可控和定制化的計算資源,滿足企業和個人特定需求。新加坡作為東南亞一個重要的經濟和科技中心,擁有良好的基礎設施和網絡連接
是否有可能在軟件中重新配置XMC4800的兩個MII端口,使其用于E-BUS通信?
。
(摘自https://www.ethercat.org/download/documents/ESC_Overview.pdf)
是否有可能在軟件中重新配置 XMC4800 的兩個 MII 端口,使其用于 E-BUS 通信,還是這一配置已在硬件中固定,因此無法更改?
發表于 07-19 07:02
CYUSB2014-BZXC是否有可能在固件上更改邏輯插座和EP之間的對應關系?
我對 CYUSB2014-BZXC 有疑問。
是否有可能在固件上更改邏輯插座和 EP 之間的對應關系? 如果是這樣,您能告訴我應該參考哪些示例代碼嗎?
發表于 07-03 07:54
微軟或成英偉達最大間接客戶
瑞銀的一份最新報告揭示,微軟可能在英偉達的客戶名單中占據舉足輕重的地位。報告預測,微軟有望成為英偉達最大的間接客戶,占據該芯片制造商2024財年收入的近五分之一,即19%。
微軟將采用AMD AI芯片以替代英偉達,為云計算提供更優解決方案
微軟將大規模采用AMD的旗艦產品MI300X,并通過Azure云計算平臺向用戶提供計算集群服務。鑒于Nvidia的H100和H200芯片供應
通過STM32+ESP8266 Wifi模塊 +云服務器,做一個數據收發控制的板子云服務器方面該如何選擇?
通過STM32+ESP8266 Wifi模塊 +云服務器 做一個數據收發控制的板子
云服務器方面該如何選擇?
發表于 04-25 08:16
PSoC4是否有可能在引導加載程序中將WCO延遲縮短到500毫秒?
大是否有可能在引導加載程序的以下功能中將 WCO 延遲縮短到 500 毫秒?
static void ClockSetup(void){/* Set Flash Cycles based
發表于 01-30 06:28
評論