最近,總部位于舊金山的人工智能初創(chuàng)公司 Inflection AI 在新一輪融資中籌集了 13 億美元,投資方包括微軟、英偉達和谷歌前首席執(zhí)行官埃里克·施密特,這筆資金將支持 Inflection AI 的首款產(chǎn)品——名為Pi (Personal A.I)的個人助理和伴侶的進一步開發(fā),該產(chǎn)品于 5 月推出。
此次融資使 Inflection 籌集的資金總額達到 15 億美元。該公司此前曾于 2022 年初從部分投資者那里籌集了 2.25 億美元,其中包括前 Meta 首席技術(shù)官 Mike “Schrep” Schroepfer、Google DeepMind 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 以及流行藝術(shù)家Will.i.am。
Inflection 的目標是打造一種通用的人工智能數(shù)字助理。包括蓋茨在內(nèi)的許多技術(shù)專家將這種助手視為所有人機交互的未來。
蓋茨在高盛表示:“無論誰贏得personal agent,這都是一件大事,因為你將永遠不會再去搜索網(wǎng)站,你永遠不會再去生產(chǎn)力網(wǎng)站,你永遠不會再去亞馬遜。” 就在幾周前,蓋茨參與了另一家“獨角獸”,即估值超過 10 億美元的人工智能初創(chuàng)公司的融資,加入了一群著名投資者的行列,向礦業(yè)初創(chuàng)公司KoBold Metals 注入資金。
Inflection 新一輪融資的規(guī)模反映出投資者對開創(chuàng)生成式 AI 的初創(chuàng)公司的熱情高漲,尤其是那些創(chuàng)建底層大語言模型 (LLM) 的公司,這些公司是當前 AI 熱潮的核心。近幾個月來,Cohere、Anthropic 和 Runway 等初創(chuàng)公司已宣布完成數(shù)億美元的融資。但 Inflection 的 10 億多美元資金也反映出創(chuàng)建這些人工智能模型的巨額費用,這些模型必須在大型數(shù)據(jù)中心的昂貴的專用計算機芯片上進行訓(xùn)練。
英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在一份聲明中表示:“人工智能革命的一個強大好處是能夠使用自然的對話語言與超級計算機交互,以簡化我們?nèi)粘I畹母鱾€方面。” “Inflection AI 的世界級團隊正在幫助領(lǐng)導(dǎo)這項開創(chuàng)性的工作,部署 Nvidia AI 技術(shù)來開發(fā)、訓(xùn)練和部署大規(guī)模的生成式 AI 模型,從而實現(xiàn)令人驚嘆的個人數(shù)字助理。”
Inflection AI 由首席執(zhí)行官 Mustafa Suleyman 共同創(chuàng)立,他還于 2012 年與 Hassabis 一起幫助創(chuàng)建了高級人工智能研究實驗室 DeepMind。谷歌于 2014 年以約 6.5 億美元收購了 DeepMind。Suleyman因被多名員工指控欺凌而于 2019 年從 DeepMind 離職,但后來短暫返回公司,然后加入谷歌擔任負責人工智能產(chǎn)品管理和政策的副總裁。隨后他于 2022 年離開谷歌,加入風(fēng)險投資公司Greylock Partners,Inflection AI 的孵化地。Greylock 合伙人 Reid Hoffman 是PayPal和LinkedIn的聯(lián)合創(chuàng)始人,也是 OpenAI 的早期支持者,也是 Inflection 的聯(lián)合創(chuàng)始人。
許多風(fēng)險投資家預(yù)測人工智能個人助理將融入日常生活。Andreessen Horowitz 的億萬富翁創(chuàng)始人馬克·安德森 (Marc Andreessen) 在一份 7000 字的宣言中寫道,像 Pi 這樣的聊天機器人有一天會普及到從創(chuàng)意藝術(shù)到政府的各個領(lǐng)域。
安德森在 6 月份寫道:“每個人都會有一位人工智能助理/教練/導(dǎo)師/培訓(xùn)師/顧問/治療師,他們具有無限的耐心、無限的同情心、無限的知識和無限的幫助。” “人工智能助手將伴隨生活中所有的機遇和挑戰(zhàn),最大限度地提高每個人的成果。”
Inflection 的第一個產(chǎn)品是一個名為 Pi 的聊天機器人,它比這種精靈般的personal agent受到的限制要大得多。事實上,它比許多競爭的聊天機器人(例如 OpenAI 的 ChatGPT 和 Google 的 Bard)更加有限。Suleyman告訴《財富》雜志, Pi 的設(shè)計目的只是成為一個有同理心的傾聽者和良好的對話者,而不是一個用于撰寫研究報告、集思廣益營銷想法或編寫軟件代碼的工具——所有這些任務(wù)都是聊天機器人可以執(zhí)行的。
Suleyman在Collision 直播中表示:“我認為每個人的口袋里都會有一位知識淵博、友善、樂于助人且非常務(wù)實的參謀長。” “沒有任何人可以在一次經(jīng)歷和一個人中同時完成所有這些技能......它將是參謀,它將是紅顏知己,它將是參謀長,它將是教練,它將是教育家和教師,合二為一。”
“個人人工智能將成為我們一生中最具變革性的工具。這確實是一個拐點,”Suleyman指出。“我們很高興能與 Nvidia、Microsoft 和 CoreWeave 以及 Eric、Bill 和其他許多人合作,將這一愿景變?yōu)楝F(xiàn)實。”
Inflection 表示,Pi 是“老師、教練、知己、創(chuàng)意合作伙伴和參謀”,其主要作用在于隨時準備好與用戶進行現(xiàn)場對話。
三位著名的創(chuàng)始人
Inflection AI 擁有三位著名的創(chuàng)始人,至少根據(jù) Crunchbase 上的資料顯示,還有第四位聯(lián)合創(chuàng)始人,他似乎在人工智能領(lǐng)域的重要公司工作,但其網(wǎng)站上沒有透露他的身份,就像他沒有被確定為 OpenAI 的聯(lián)合創(chuàng)始人成員之一一樣。這個人—— Carlos Virella——沒有太多的痕跡,據(jù)我們所知,可能是阿甘正傳式的諷刺。但 Inflection AI 的其他三位創(chuàng)始人——其中一位也是 OpenAI 的聯(lián)合創(chuàng)始人——被曝光。這三者都與 Web 2.0 初創(chuàng)社區(qū)息息相關(guān),是十年前開始的人工智能革命的重要組成部分,兩者的結(jié)合是 Inflection AI 推出名為 Pi 的個人人工智能服務(wù)的原因。
里德·霍夫曼 (Reid Hoffman) 是眾所周知的 LinkedIn 企業(yè)網(wǎng)絡(luò)聯(lián)合創(chuàng)始人之一,當在線拍賣商 eBay 于 2002 年 8 月斥資 15 億美元收購在線支付處理商 PayPal 時,他開始成為硅谷的一員。1998 年 12 月,一家名為 Confinity 的公司成立時,他擔任該公司的董事,并于 2000 年 1 月被任命為執(zhí)行副總裁,負責該公司的所有對外關(guān)系。三個月后,Confinity 與另一家名為 X.com 的公司合并。埃隆·馬斯克 (Elon Musk) 是后者的聯(lián)合創(chuàng)始人,彼得·蒂爾 (Peter Thiel) 是前者的聯(lián)合創(chuàng)始人,2002 年 2 月,PayPal 上市,籌集了 6100 萬美元,成為互聯(lián)網(wǎng)泡沫破滅期間為數(shù)不多的亮點之一。因此,僅僅六個月后,eBay 就完成了收購。
2003 年 1 月,霍夫曼與他人共同創(chuàng)立了 LinkedIn,并擔任董事長兼首席執(zhí)行官,并開始運營其產(chǎn)品,并于 2009 年秋季成為 Greylock Partners 的合伙人。2016 年 6 月,微軟斥資 262 億美元收購 LinkedIn,霍夫曼是控股股東,他自己在這筆交易中賺取了 28.4 億美元。霍夫曼現(xiàn)在仍在 Greylock,但他的個人資金以及微軟聯(lián)合創(chuàng)始人比爾·蓋茨、前 Sun Microsystems 和谷歌高管埃里克·施密特、Nvidia 和微軟以及小型 GPU 計算云構(gòu)建專家CoreWeave的投資正在幫助資助 Inflection AI。霍夫曼是 OpenAI 和微軟的董事會成員,由于與 Inflection AI 存在利益沖突,他于 3 月份辭去了 OpenAI 的職務(wù)。鑒于這家軟件巨頭與 OpenAI 的緊密合作關(guān)系,很難相信霍夫曼會在微軟董事會任職更長時間,但話又說回來,微軟正在投資 Inflection AI,作為一種對沖。因此,也許存在太多的利益沖突,它們就像雙重否定一樣相互抵消。
Inflection AI 首席科學(xué)家 Karén Simonyan 和首席執(zhí)行官 Mustafa Suleyman 都是人工智能領(lǐng)域的長期研究人員,他們創(chuàng)建并出售了成功的公司。
Simonyan 于 2013 年在牛津大學(xué)創(chuàng)建了 VGGNet 圖像處理框架,該框架通過一家名為 Vision Factory AI 的公司進行了商業(yè)化,并很快被一家名為 DeepMind Technologies 的神秘人工智能初創(chuàng)公司收購,Simonyan 成為該公司的首席研究科學(xué)家。DeepMind 成立于 2010 年 6 月,Suleyman 擔任首席產(chǎn)品官,隨后 Google 進入該領(lǐng)域,并在 DeepMind 收購 Vision Factory 后不久收購了 DeepMind。Facebook(當時還不叫 Meta Platforms)曾在 2013 年試圖收購 DeepMind,谷歌為 DeepMind 的強化學(xué)習(xí)人工智能技術(shù)支付了 4 億到 6.5 億美元之間的費用。
如果你想追蹤其中的聯(lián)系,Suleyman 自 2022 年 1 月以來一直是 Greylock 的合作伙伴,很容易看出 Hoffman 和 Suleyman 在走廊里炮制了 Inflection AI。2022 年 5 月,當微軟、霍夫曼、蓋茨和施密特以及 Mike Schroepfer、Demis Hassabis、Will.i.am、Horizons Ventures 和 Dragoneer 共同投資時,Greylock 是 Inflection AI 籌集 2.25 億美元資金時的主要投資者。6 月底,Inflection AI 籌集了第二筆 13 億美元的資金,Nvidia 和 CoreWeave 成為新投資者。
人工智能正處于拐點
Inflection AI 的目標是讓地球上的每個人都可以使用其 Pi(personal intelligence 的縮寫)人工智能助手。考慮到運行LLM來回答愚蠢問題的高昂成本,計算這樣的努力需要多少計算能力以及如何負擔得起,這將是很有趣的。但暫時把它放在一邊。
為了實現(xiàn)這一目標,Inflection AI 做了三件事:擁有懂得如何做人工智能的聯(lián)合創(chuàng)始人、擁有大筆資金的聯(lián)合創(chuàng)始人、擁有大筆資金的朋友以及有通過人工智能致富的雄心的聯(lián)合創(chuàng)始人。因此,Inflection AI 建立了自己的 LLM(第一個迭代稱為 Inflection-1),并且像 OpenAI 一樣,將在必要的硬件上投入大量資金,以提高該模型的準確性并將其擴展到更大的數(shù)量。Pi 服務(wù)的用戶數(shù)量。
考慮到用于訓(xùn)練LLM的計算引擎的高昂成本,這將需要大量資金。因此他們六月份大幅提升指出。
Inflection AI 與 Nvidia 和 CoreWeave 合作,在其 Inflection-1 LLM 上(跨越 3,500 個 Hopper GPU)在 11 分鐘內(nèi)運行了 MLPerf 參考訓(xùn)練基準。我們不知道有多少 GPU 用于訓(xùn)練支撐 Pi 服務(wù)的 Inflection-1 模型,但它的數(shù)量可能比這個還要多,而且如果我們不得不猜測的話,它可能使用 Nvidia“Ampere”A100 GPU 加速器。
我們所知道的是,Nvidia 和 CoreWeave 正在合作在云中創(chuàng)建一個 AI 集群,該集群將擁有超過 22,000 個 H100 GPU 加速器,用于訓(xùn)練我們認為將是 Inflection-2 LLM 的人員。Inflection AI 宣稱,這 22,000 個 H100 GPU 將“在 16 位精度調(diào)制解調(diào)器中提供驚人的 22 exaflops,如果使用較低的精度,甚至?xí)摺保⒔又f,如果完成了高性能 Linpack (HPL) 矩陣數(shù)學(xué)測試放在上面,就像一臺HPC超級計算機一樣,它會在當前的Top500排行榜上排名第二,但在El Capitan和Aurora全面上線后可能會跌至第四。
如果您使用 Hopper PCI-Express 卡對 22,000 個 GOPU 加速器進行計算,超大規(guī)模提供商和云構(gòu)建者通常使用這些卡來創(chuàng)建集群,而不是在四個或八個 GPU 的集群之間使用 NVLink Switch 互連的 HGX 式板并使用 Hopper GPU 的 SXM5 變體,然后在 Tensor Core 矩陣數(shù)學(xué)引擎上以 FP16 精度,在沒有稀疏性支持的情況下獲得 16.9 exaflops,在打開稀疏性支持的情況下獲得 33.8 exaflops。您還可以使用 H100 上的 FP64 雙精度矢量數(shù)學(xué)單元獲得額定為 572 petaflops 的集群。這與 Inflection AI 在其公告中談?wù)摰?FP16 精度的 22 exaflops 不符。
這就是有趣的地方。如果您對服務(wù)器機箱內(nèi)將使用 NVLink Switch 互連的 22,000 個 H100 SXM5 GPU 加速器進行計算,那么您將得到一個集群,在 FP16 精度下,在未激活稀疏性的情況下,聚合峰值性能為 21.8 exaflops。(這可能會告訴您有關(guān) Inflection-1 LLM 的一些信息,因為它可能不會使用大量稀疏數(shù)據(jù)。)這四舍五入為 Inflection AI 所說的 22 exaflops,這也產(chǎn)生了一臺峰值為 748 petaflops 的超級計算機FP64 矢量性能和 1.47 exaflops(FP64 在 Tensor Cores 矩陣引擎上運行)。(據(jù)我們所知,沒有很多 HPC 應(yīng)用程序已移植到 Tensor Core。)
假設(shè) Linpack 基準測試的計算效率為 65%,則該集群在 Top500 排名中的評級為 486 petaflops 左右,這將使其略高于日本 RIKEN 實驗室“Fugaku”超級計算機的 442 petaflops 評級,后者在 2017 年排名第二。遠低于目前排名第一的美國橡樹嶺國家實驗室“Frontier”超級計算機 1.19 exaflops 的性能。阿貢國家實驗室的“Aurora A21”系統(tǒng)預(yù)計將在今年晚些時候使用英特爾 CPU 和 GPU 交付時達到 2 exaflops 峰值,勞倫斯利弗莫爾國家實驗室的“El Capitan”系統(tǒng)也將在今年晚些時候推出將遠高于 2 exaflops 峰值。
這提出了一個重要的觀點。對于要考慮將云計算機與本地計算機進行比較的情況,您必須讓它始終為單個客戶運行。我們認為 Inflection AI 機器也會出現(xiàn)這種情況,甚至有可能該公司會在其上運行 Linpack,只是為了表明自己的觀點,并在 11 月份真正進入 Top500 榜單。但是,如果 Inflection AI 沒有幾乎連續(xù)地使用機器——我們想說的是絕對連續(xù)地使用機器,就像世界 HPC 實驗室的機器一樣,但也許說 75% 或 80% 的時間就足夠了——那么它不應(yīng)該被算作本身就是一臺獨特的機器。
這將我們引向下一點。如此大量的容量需要花費多少錢?讓我們從使用 H100 PCI-Express 卡的集群開始嘗試一下。假設(shè)這些 H100 PCI-Express 卡的價格約為 20,000 美元,按我們認為接近當前市場價格計算,即 4.4 億美元。需要 2,750 個節(jié)點來容納所有這些 GPU,每個機箱有 8 個。配備一對強大的 CPU、2 TB 內(nèi)存和用于數(shù)據(jù)和操作系統(tǒng)存儲的 34.5 TB NVM-Express 閃存(總共十個驅(qū)動器,兩個用于操作系統(tǒng)的skinny驅(qū)動器),每個驅(qū)動器的運行成本可能約為 150,000 美元。另外還有 4.125 億美元。正如 Nvidia 喜歡說的那樣,InfiniBand 網(wǎng)絡(luò)是另外 20%,即 2.13 億美元,這使其達到 10.7 億美元。
現(xiàn)在,讓我們看看 SXM 設(shè)置。同樣是 2,750 個節(jié)點,但這次 GPU 的成本可能約為 30,000 美元,因此 22,000 個節(jié)點的成本為 6.6 億美元。這些節(jié)點在機箱內(nèi)的 NVLink Switch 成本還有 25,000 美元左右,機箱外的 InfiniBand 成本也有 2.13 億美元左右。現(xiàn)在您的資產(chǎn)達到 13.5 億美元。這看起來就像 Inflection AI 正在討論的使用 CoreWeave 和 Nvidia 構(gòu)建的集群的場景。
這比美國政府為其百億億級超級計算機投入的資金要多得多,美國政府按標價計算的成本約為 5 億至 6 億美元,加上一次性工程 (NRE) 成本。
云開銷(包括系統(tǒng)管理、房地產(chǎn)和電力成本)很容易再增加 2 億美元,加上 CoreWeave 約 5% 的利潤率,成本將增加至 16.3 億美元。這略高于 Inflection AI 迄今為止從投資者那里籌集的 15.3 億美元。幸運的是,有了云,它不必像巨大的預(yù)留實例那樣一次性全部支付。或者,也許確實如此,這就是為什么價格不會高于這個。(你能想象為這樣一個集群按需付費嗎?)
Pi 訂閱的價格是多少?需要有多少用戶以及多快才能支付費用?比爾蓋茨有足夠的錢,不必關(guān)心,英偉達和微軟也是如此。也許里德·霍夫曼也是。但您可以放心,所有這些數(shù)學(xué)計算都已完成。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238266 -
語言模型
+關(guān)注
關(guān)注
0文章
520瀏覽量
10268 -
英偉達
+關(guān)注
關(guān)注
22文章
3770瀏覽量
90991
原文標題:用22000個英偉達H100入局AI,初創(chuàng)企業(yè)的豪賭
文章出處:【微信號:semiwebs,微信公眾號:芯通社】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論