電子發燒友網報道(文/李彎彎)7月30日消息,蘋果公司周一在一篇技術論文中表示,支撐其人工智能系統Apple Intelligence的兩個人工智能模型是在谷歌設計的云端芯片上進行預訓練的。這表明,在訓練尖端人工智能方面,大型科技公司正在尋找英偉達以外的替代品。
不斷迭代的谷歌TPU芯片
隨著機器學習算法,特別是深度學習算法在各個領域的廣泛應用,對于高效、低功耗的AI計算硬件需求日益增長。傳統的CPU和GPU在處理這些算法時存在效率較低的問題,促使谷歌等科技巨頭開始探索專用AI加速芯片的研發。
谷歌在2015年左右開始規劃開發新的專用架構處理器,旨在優化機器學習算法中的張量運算執行過程。經過快速迭代和研發,谷歌于2016年發布了首個TPU版本(TPU v1),專門用于大規模機器學習加速。
TPU v1部署于數據中心,用于加速神經網絡的推理階段。擁有65536個8-bit MAC(矩陣乘單元),峰值性能為92 TOPS(每秒萬億次操作),以及28 MiB的片上內存空間。相比于CPU和GPU,TPU v1在響應時間和能效比上表現出色,能夠顯著提升神經網絡的推理速度。
隨著技術的不斷進步,谷歌相繼推出了多個TPU版本,不斷提升性能和功能。例如,TPU v2和TPU v3被設計為服務端AI推理和訓練芯片,支持更復雜的AI任務。TPU v4則進一步增強了擴展性和靈活性,支持大規模AI計算集群的構建。
在面對爭議和質疑后,谷歌推出了TPU v5e版本。TPU v5e在架構上進行了調整,采用單TensorCore架構,并在INT8峰值算力上有所提升。盡管在BF16峰值算力上略低于前代版本,但TPU v5e更適用于推理任務,并體現了谷歌在AI算力服務市場的戰略選擇。
在今年5月的I/O開發者大會上,谷歌又發布了第六代張量處理單元 (TPU) ,稱為Trillium。Trillium TPU 可以更快地訓練下一波基礎模型,并以更少的延遲和更低的成本為這些模型提供服務。至關重要的是,Trillium TPU 的能效比 TPU v5e 高出 67% 以上。
值得一提的是,Trillium 可以在單個高帶寬、低延遲 Pod 中擴展到多達 256 個 TPU。除了這種 Pod 級可擴展性之外,借助多切片技術和Titanium 智能處理單元 (IPU ),Trillium TPU 還可以擴展到數百個 Pod,從而連接建筑物級超級計算機中的數萬個芯片,這些芯片通過每秒數 PB 的速度互連數據中心網絡。
谷歌表示,Trillium TPU 將為下一波 AI 模型和代理提供動力,包括自動駕駛汽車公司Nuro、藥物發現公司Deep Genomics、德勤等企業也采用其TPU產品進行應用。
越來越多企業使用谷歌TPU芯片滿足AI計算
據谷歌官方信息,其最新TPU的運行成本每小時不足2美元,但客戶需提前三年預訂以確保使用。自2015年專為內部工作負載設計的TPU問世以來,谷歌于2017年將其向公眾開放,如今,TPU已成為人工智能領域最為成熟和先進的定制芯片之一。
谷歌在其多個設施中使用了自研的TPU(Tensor Processing Unit)芯片。谷歌云平臺廣泛使用了TPU芯片來支持其AI基礎設施。這些芯片被用于加速機器學習模型的訓練和推理過程,提供高性能和高效的計算能力。通過谷歌云平臺,用戶可以訪問到基于TPU芯片的虛擬機實例(VM),用于訓練和部署自己的機器學習模型。
除此之外,已經有多家公司使用谷歌的TPU芯片,如蘋果,蘋果在最新發表的技術論文中承認,公司采用了谷歌張量處理單元(TPU)訓練其人工智能模型。
在周一發布的技術論文中,蘋果詳細介紹為支持蘋果個人智能化系統Apple Intelligence而開發了一些基礎語言模型,包括一個用于在設備上高效運行的約30億參數模型——端側“蘋果基礎模型”(AFM),以及一個為蘋果云端AI架構“私有云計算”(Private Cloud Compute)而設計的大型服務器語言模型——服務器AFM。
蘋果披露,訓練模型采用了谷歌研發的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。蘋果在8192塊TPUv4 芯片上從無到有訓練服務器AFM,使用4096的序列長度和4096個序列的批量大小,進行6.3萬億token訓練。端側AFM在2048塊TPUv5p芯片上進行訓練。
此外,Anthropic這家被譽為“OpenAI勁敵”的人工智能初創公司,據悉是谷歌TPU芯片的早期用戶之一。Anthropic使用谷歌Cloud TPU v5e芯片為其大語言模型(LLM)Claude提供硬件支持,以加速模型的訓練和推理過程。Hugging Face和AssemblyAI這兩家同樣在人工智能領域備受矚目的初創公司也在大規模使用谷歌TPU芯片來支持其AI應用。
另外,許多科研機構也在使用谷歌TPU芯片來支持其AI相關的研究項目。這些機構可以利用TPU芯片的高性能計算能力來加速實驗過程,推動科研進展。一些教育機構也將谷歌TPU芯片用于教學和培訓目的,幫助學生和研究人員學習和掌握機器學習技術。
寫在最后
長期以來,英偉達的高性能GPU在高端人工智能模型訓練市場占據主導地位,包括OpenAI、微軟、Anthropic在內的多家科技公司紛紛采用其GPU來加速模型訓練。但在過去幾年里,英偉達GPU始終供不應求,為此谷歌、Meta、甲骨文及特斯拉等企業都在自研芯片,以滿足各自人工智能系統與產品開發的需求。
不僅如此,如谷歌,雖然TPU最初是為內部工作負載而創建,而其憑借著諸多優勢,現在正得到更廣泛的應用。隨著人工智能技術的不斷發展和市場的不斷擴大,未來可能會有更多的企業選擇使用谷歌TPU芯片來滿足其AI計算需求。
-
谷歌
+關注
關注
27文章
6161瀏覽量
105299 -
蘋果
+關注
關注
61文章
24395瀏覽量
198551 -
TPU
+關注
關注
0文章
140瀏覽量
20720
發布評論請先 登錄
相關推薦
評論