在大咖云集的亞馬遜云科技re:Invent 2023全球大會現(xiàn)場,大家最關(guān)注的焦點話題是什么?
對于這個問題,相信很多人都會不假思索地在第一時間給出答案——生成式AI。
然而生成式AI的應(yīng)用以及大語言模型的訓(xùn)練,都對算力有著極高的需求。身為全球云計算開拓者和領(lǐng)軍者,亞馬遜云科技認(rèn)為這意味著怎樣的機(jī)遇?同時又帶來了怎樣的挑戰(zhàn)?企業(yè)可以通過生成式AI實現(xiàn)怎樣的轉(zhuǎn)型升級?為了滿足客戶的迫切需求,亞馬遜云科技又提供了怎樣的解決方案?
生成式AI帶來的機(jī)遇與挑戰(zhàn)
“生成式AI帶來的機(jī)遇非常明顯,對吧?大家都已經(jīng)有目共睹。”亞馬遜云科技計算和網(wǎng)絡(luò)副總裁David Brown向趣味科技表示,“我們希望亞馬遜云科技能夠成為運行這些工作負(fù)載的最佳場所,并且已經(jīng)為此投入了大量資金和資源。”
David Brown指出,生成式AI的發(fā)展帶來了極其廣袤的市場,通過與NVIDIA等合作伙伴的攜手合作,以及自研的Amazon Graviton和Amazon Trainium系列定制芯片,亞馬遜云科技正在努力為客戶提供更好的性價比,希望能夠幫助客戶以更低的成本引入和運行他們的模型。
而在挑戰(zhàn)方面,如何幫助客戶理解生成式AI,以及如何利用生成式AI為客戶的業(yè)務(wù)服務(wù),是當(dāng)下生成式AI應(yīng)用的難點,也是亞馬遜云科技一直在努力的事情。在探索與試驗的過程中,亞馬遜云科技很快意識到,在Amazon Bedrock模型中為客戶提供選擇是正確的做法。為此亞馬遜云科技在re:Invent 2023全球大會上宣布推出Amazon Bedrock更多模型選擇和強(qiáng)大功能,讓用戶可輕松訪問來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI以及亞馬遜的多種行業(yè)領(lǐng)先的大語言模型和其他模型,從而幫助企業(yè)更加輕松地構(gòu)建適合自身業(yè)務(wù)的定制化生成式AI應(yīng)用,極大地降低了生成式AI應(yīng)用的門檻。
當(dāng)前面臨的另一項挑戰(zhàn),是如何確保在客戶需要時提供足夠的GPU算力。為此亞馬遜云科技一邊持續(xù)在全球范圍內(nèi)構(gòu)建數(shù)據(jù)中心和電力足跡,一邊開展了多項技術(shù)和服務(wù)創(chuàng)新,包括推出Capacity Blocks服務(wù),使得即使是在供應(yīng)受限的環(huán)境中,也能夠幫助客戶找到電源、GPU和加速器,獲得GPU訪問權(quán)限,從而支持他們的生成式AI工作負(fù)載。
努力為客戶提供更好性價比
強(qiáng)大的算力自然離不開強(qiáng)勁的芯片。在這方面,亞馬遜云科技主要是通過兩種方式來實現(xiàn)自己的目標(biāo)。
一種方式是與NVIDIA的緊密合作。亞馬遜云科技與NVIDIA攜手進(jìn)行了大量投資,將最新的NVIDIA GPU引入亞馬遜云科技。繼成為全球首家提供NVIDIA GH100 Grace Hopper數(shù)據(jù)中心GPU訪問的云服務(wù)商之后,NVIDIA創(chuàng)始人、CEO黃仁勛又在re:Invent 2023全球大會現(xiàn)場宣布,亞馬遜云科技成為全球首家推出NVIDIA GH200 NVL32實例的云服務(wù)商。
“在數(shù)據(jù)中心運行NVIDIA GPU的工作非常具有挑戰(zhàn)性,工程設(shè)計非常困難,需要世界上最好的供應(yīng)商才能做好這些事情。”David Brown表示,“我認(rèn)為在這方面,亞馬遜云科技確實比其他任何公司都要出色。”
另一種方式是投資和設(shè)計自己的定制芯片。在re:Invent 2023全球大會上,亞馬遜云科技就宣布其自研芯片家族推出Amazon Graviton4和Amazon Trainium2等新一代產(chǎn)品,為生成式AI應(yīng)用和機(jī)器學(xué)習(xí)訓(xùn)練等廣泛的工作負(fù)載提供了更高的性價比和能效。其中Graviton4較上一代產(chǎn)品性能提升30%,獨立核心增加50%以上,內(nèi)存帶寬提升75%以上;Trainium2較上一代產(chǎn)品訓(xùn)練速度提升4倍,能效提升2倍,并能在EC2 UltraClusters中部署多達(dá)100,000個芯片。
“芯片是用戶所有工作負(fù)載的基礎(chǔ),如果你是一個希望運行生成式AI工作負(fù)載的客戶,你自然會選擇性價比最高、對自己來說最合理的芯片。”David Brown表示,“亞馬遜云科技每一代自研芯片都持續(xù)提升性價比和能效,為客戶提供了基于AMD、Intel以及NVIDIA等的最新芯片和實例組合之外的更多選擇,這使得Amazon EC2可以為客戶虛擬運行幾乎所有應(yīng)用和工作負(fù)載,同時也為客戶提供了更好的性價比。”
利用生成式AI助力企業(yè)轉(zhuǎn)型
如今越來越多的企業(yè)都對生成式AI投入了更多的關(guān)注。如何將生成式AI技術(shù)應(yīng)用到自身業(yè)務(wù),如何實現(xiàn)降本增效,如何為公司帶來價值,也成為了廣大企業(yè)正在努力研究的課題。
“生成式AI太新了,許多客戶都在努力研究如何將這一技術(shù)應(yīng)用到自己的業(yè)務(wù)當(dāng)中。我真正需要思考的主要是兩件事。”David Brown說道。
第一件事,是企業(yè)如何利用生成式AI的能力,并想出用這些能力為最終用戶構(gòu)建什么?David Brown認(rèn)為這是每家企業(yè)都在考慮的事情,實際上在亞馬遜云科技內(nèi)部,就有團(tuán)隊通過機(jī)器學(xué)習(xí)實驗室與客戶合作,幫助他們構(gòu)建概念證明,以實際測試生成式AI可以為客戶業(yè)務(wù)做些什么。目前在幫助客戶構(gòu)建生成式AI解決方案方面,亞馬遜云科技已經(jīng)取得了很大的成功。
第二件事,是一旦企業(yè)有了一個生成式AI解決方案,那么就必須確保公司盈虧能夠負(fù)擔(dān)得起它的運行成本。因為如果運行成本太高的話,企業(yè)實際上是無法實施部署的。因此亞馬遜云科技所做的就是幫助客戶找到成本優(yōu)化的方法。無論是改進(jìn)開發(fā)模型的方式,還是通過像Trainium這樣的自研芯片,亞馬遜云科技都希望能夠真正降低生成式AI應(yīng)用的成本。
在re:Invent 2023全球大會上,亞馬遜云科技數(shù)據(jù)與機(jī)器學(xué)習(xí)副總裁Swami Sivasubramanian博士在主題演講中重點介紹了亞馬遜云科技推出的生成式AI技術(shù)堆棧。該堆棧包括了底層負(fù)責(zé)訓(xùn)練和推理的基礎(chǔ)設(shè)施層、中間微調(diào)模型需求的工具服務(wù)層、上層構(gòu)建生成式AI應(yīng)用層等三個重要層級。通過對這三個層級的不斷重構(gòu),亞馬遜云科技能夠為客戶提供更具性價比和安全性的技術(shù)與服務(wù),從而利用生成式AI更好地助力企業(yè)轉(zhuǎn)型升級。
摩爾定律失效但芯片仍在進(jìn)步
說起芯片,很多人都會想起英特爾創(chuàng)始人之一戈登·摩爾多年前提出的大名鼎鼎的“摩爾定律”,也就是集成電路芯片上可容納的晶體管數(shù)目,大約每隔18個月便會增加一倍。
在上個世紀(jì),摩爾定律被證明是有效的,并且著實推動了芯片市場的進(jìn)步。然而近年來,由于晶體管尺寸和制造工藝的限制,摩爾定律也日益逼近極限。NVIDIA CEO黃仁勛就認(rèn)為,這種蠻力增加晶體管的方法基本上已經(jīng)走到了盡頭,從而引發(fā)了眾多業(yè)界人士有關(guān)“摩爾定律是否已死”的爭論。
“摩爾定律的爭論非常有趣,如果我們回到上個世紀(jì),有時會看到英特爾工程師們在為如何讓下一版CPU晶體管數(shù)量翻倍而絞盡腦汁,有時又會看到他們已經(jīng)實現(xiàn)了晶體管翻倍,反而要為下一代產(chǎn)品故意做一些保留。”談起摩爾定律的話題,David Brown如是表示,“但是令人驚訝的是,在幾十年后的今天,我們似乎已經(jīng)看到了摩爾定律的極限,因為現(xiàn)階段物理問題的限制,我們在技術(shù)上已經(jīng)無法再使CPU上的晶體管數(shù)量在短期內(nèi)實現(xiàn)翻倍。”
David Brown指出,事實上除了增加晶體管的數(shù)量之外,還有各種各樣的其他方法可以提升芯片的性能,包括改變設(shè)計芯片的方式,改變構(gòu)建芯片的方式,改變?yōu)樾酒峁┠芰康姆绞降鹊取R虼思幢闶悄柖墒В膊⒉灰馕吨酒粫^續(xù)創(chuàng)新和提高性能。這就是Amazon Graviton和Amazon Trainium系列芯片向其他芯片制造商展示的意義所在。
審核編輯:黃飛
-
摩爾定律
+關(guān)注
關(guān)注
4文章
634瀏覽量
78998 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102987 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268886 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2650瀏覽量
83317 -
AI算力
+關(guān)注
關(guān)注
0文章
72瀏覽量
8652
原文標(biāo)題:生成式AI算力如此緊張,怎樣選擇才最劃算
文章出處:【微信號:funnytechnology,微信公眾號:趣味科技v】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論