電子發燒友網報道(文/李彎彎)日前消息,據相關人士透露,甲骨文(Oracle)和微軟(Microsoft)最近討論了一項不同尋常的協議,如果任何一家公司為使用大規模AI的云客戶提供的計算能力不足,雙方將相互租用服務器。
這筆交易將幫助這兩家互為競爭對手的云服務提供商滿足市場對可運行AI軟件的服務器日益增長的需求,這種需求已導致服務器短缺。
微軟和甲骨文曾多次合作
微軟和甲骨文雖然互為競爭對手,但卻曾多次攜手合作。2013年6月,微軟與甲骨文宣布達成合作,將Java、甲骨文數據庫以及其他甲骨文軟件帶到微軟WindowsServerHyper-V和WindowsAzure云平臺,這種合作為開發人員提供了極大的便利。
消費者可以在WindowsServerHyper-V和WindowsAzure上部署甲骨文軟件,包括Java、甲骨文數據庫、甲骨文WebLogicServer,甲骨文將提供完整支持。
作為合作的一部分,甲骨文將認證和支持自家軟件在微軟平臺上的運行,并為WindowsAzure用戶提供OracleLinux,微軟也向WindowsAzure用戶提供上述甲骨文軟件。
甲骨文與微軟的強強聯合,Java開發人員和企業用戶獲益最大,甲骨文數據庫與微軟云計算平臺的整合,使得他們可以直接將桌面上的傳統軟件遷移至云計算系統。
2019年6月,微軟和甲骨文又宣布建立一個新的合作關系,兩家公司將通過網絡直連他們的云服務,以便用戶可以在兩者之間無縫地遷移其工作負載和數據。
微軟和甲骨文發布的聯合聲明顯示,企業用戶將可以無縫地使用微軟Azure的分析和人工智能等服務,以及甲骨文自主數據庫等云服務。整體來說,雙方為用戶提供了一站式的服務,為用戶提供經營整個企業的所有云服務和應用程序。
據分析,微軟和甲骨文攜手合作是為了應對共同的競爭壓力。隨著移動互聯網快速發展,云計算市場重要性日益凸顯。微軟的AZure始終無法趕上亞馬遜云服務AWS的步伐,甲骨文更是由于最初對云計算前景的估計失誤而處境尷尬。
根據Synergy Research Group數據顯示,亞馬遜云服務以超過30%的市場占有率,成為全球云計算市場上的領跑者。微軟Azure以大約15%的市場份額位列第二,緊隨其后的是IBM Cloud以及谷歌Cloud。甲骨文(Oracle)這樣的小型云計算服務商,更是在上述四大云計算巨頭加強市場控制的壓力下,業務增速有所放緩。兩者攜手合作對于雙方來說都很有必要。
AI服務器需求快速增長
ChatGPT的出現掀起了全球AI大模型研究熱潮,無論是訓練還是推理,這都需要消耗大量的算力,尤其是訓練階段。以ChatGPT為例,根據OpenAI在2020年發表的論文,訓練階段算力需求與模型參數數量、訓練數據集規模等有關,且為兩者乘積的6倍:訓練階段算力需求=6×模型參數數量×訓練集規模。
GPT-3模型參數約1750億個,預訓練數據量為45 TB,折合成訓練集約為3000億tokens。即訓練階段算力需求=6×1.75×1011×3×1011=3.15×1023 FLOPS=3.15×108 PFLOPS
依據谷歌論文,OpenAI公司訓練GPT-3采用英偉達V100 GPU,有效算力比率為21.3%。GPT-3的實際算力需求應為1.48×109 PFLOPS(17117 PFLOPS-day)。
假設應用A100 640GB服務器進行訓練,該服務器AI算力性能為5 PFLOPS,最大功率為6.5 kw,則根據測算,訓練階段需要服務器數量=訓練階段算力需求÷服務器AI算力性能=2.96×108臺(同時工作1秒),即3423臺服務器工作1日。
在ChatGPT及各種AI大模型的推進下,AI服務器市場需求呈現高速增長趨勢。美國服務器供應商超微電腦在5月初的財報會議上表示,AI服務器業務正迎來創紀錄暴漲。公司向主要客戶交付新平臺的速度加快,2023財年有望迎來強勁收尾。
不過也因為需求強勁,AI服務器硬件資源也面臨短缺的問題,超微電腦就表示,AI服務器出貨量可能會受到供應鏈瓶頸的限制。
事實上,今年3月微軟公司就已經傳出面臨內部AI服務器硬件短缺的窘境。為此,微軟不得不對硬件資源采取配額供應的方式,限制其他內部AI工具開發團隊的使用量,從而確保基于GPT-4的新版必應聊天機器人和即將發布的新款Office工具獲得足夠的資源。
小結
可以看到,隨著AI大模型的研究推進,算力需求與日俱增,AI服務器企業也迎來大幅增長。然而由于受到供應鏈,比如高算力GPU芯片等限制,AI服務器硬件資源仍然面臨短缺。微軟和甲骨文的再次攜手合作,正是其應對當前困境的方式之一。
-
微軟
+關注
關注
4文章
6590瀏覽量
104024 -
AI
+關注
關注
87文章
30728瀏覽量
268886
發布評論請先 登錄
相關推薦
評論