英特爾7大算力神器助力極致算力。
“請代替基金經理寫一段年終總結”,“如何評價春節檔電影大混戰”,“請寫出一段爬取網頁內容的程序”……諸如此類問題,OpenAI開發的ChatGPT都可以給出一段“中肯”的回答。
2023年開年,全球AI領域最“出圈”的成果莫過于ChatGPT了。作為一個具備問答、文章撰寫等多重能力的對話式機器人,ChatGPT的強大“超能力”背后,是天量的訓練數據與龐大的模型。
ChatGPT的前一代基礎模型——GPT-3的參數就高達1750億,訓練數據高達45TB,訓練設備包括超過28.5萬個CPU和1萬個GPU,僅訓練成本就超過了1200萬美元。ChatGPT基于GPT3.5架構的模型參數在此基礎上至少提升了2個量級,對強算力的需求就更高。
事實上,不止是人工智能領域,數字經濟發展潮流中的每一次技術和應用的飛躍,都離不開強勁算力的支持,作為該領域的頭部企業之一,英特爾仍在不斷挑戰更強算力。1月11日,英特爾正式發布第四代至強可擴展處理器和至強 CPU Max系列產品,通過內置面向AI、科學計算、安全、網絡、數據分析和存儲的加速器,在提升工作負載的性能和能效上更進一步。
01
破題新思路,四代至強新添七大算力神器
一想到算力提升,最容易想到的解決方案就是“堆核”,即通過增加核心頻率和核心數量來提升整體數據處理速度。
但想要面向云計算、物聯網、人工智能、5G等真實、多樣應用場景下的工作負載提升CPU性能,充分利用CPU資源并且節約成本,“堆核”顯然不是最優解。
正如英特爾數據中心與人工智能集團副總裁兼中國區總經理陳葆立所說,“我們更關注客戶如何使用我們的產品,并不是越多核就一定越好,今天的許多用戶在使用數據中心處理器時,也并非一味執著于多核,而是具體工作具體分析。”1
基于在各個行業與場景實踐中積累的豐富經驗,英特爾重塑破題思路,發布了全新的第四代英特爾至強,引入針對實際工作負載優化加速的設計理念,采用系統級設計方法,在CPU中內置針對各種工作負載的專用加速器,與上一代相比,實現了通用計算平均性能提升53%,并且能夠將目標工作負載的平均每瓦性能提升2.9倍。而在優化電源模式下,每個CPU節能高達70瓦,并對性能只產生極低的影響,將總體擁有成本降低52%到66%,做到帶來領先性能的同時實現可持續發展。2
全新的英特爾至強平臺提供了七大算力神器——
面向深度學習場景的英特爾高級矩陣擴展(英特爾AMX),能將人工智能實時推理和訓練性能提升至10倍;
面向網絡數據系統的英特爾動態負載均衡器(英特爾DLB),可將網絡工作負載的系統級處理性能時延降低96%;
增強數據移動效率的英特爾數據流加速器(英特爾DSA),幫助數據密集型工作負載數據移動和轉換性能提升至1.7倍;
面向內存數據庫和大數據分析工作負載的英特爾存內分析加速器(英特爾IAA),能顯著優化數據分析工作負載內存占用和查詢吞吐量,性能可提升至3倍;
面向數據流壓縮及數據加解密的英特爾數據保護與壓縮加速技術(英特爾 QAT),使第四代英特爾至強可擴展處理器成為單一數據流壓縮并加密數據性能最高的CPU;
增強工作負載安全性的英特爾安全技術(英特爾Security)策略組合,能夠對工作負載進行保護,加速加密運算,實現預測性安全保護;
首款集成高帶寬內存(HBM)的英特爾至強CPU Max系列,能夠在無需變更代碼的情況下為科學計算工作負載加速。
值得一提的是,第四代英特爾至強不僅具備卓越的加速性能,亦體現了重大的制造進展。其能夠在一個封裝上集成多達4個采用Intel 7制程工藝制造的單元,這些區塊通過英特爾嵌入式多芯片互連橋接(EMIB)封裝技術連接。第四代英特爾至強可擴展處理器還具備新特性,包括通過DDR5增加了內存帶寬、通過PCIe5.0和Compute Express Link (CXL) 1.1互連增加了I/O帶寬。
有了算力的升級與加持,紛繁復雜的場景和應用將會展開更多可能。
02
AI將社會發展導向新階段
AI作畫、ChatGPT對話機器人……隨著深度殘差網絡(ResNet)、Transformer算法、Diffusion算法等技術進入應用階段,2022年以來,AI領域不斷迎來發展的“小高潮”,AI強大的能力成功吸引了大眾目光,也帶動了新一波數字技術的觀念普及。
相比GPU提升訓練效率的能力,擁有極佳性價比的CPU在AI應用的規模化部署和實踐上同樣發揮著重要作用。可以說,AI走入工程化階段,面向大眾提供服務,迫切需要不斷提升CPU的性能,以實現高算力、強性能和低成本。
有數據顯示,預計到2025年,超過60%的中國企業將通過人工智能、機器學習、自然語言處理(Natural Language Processing,NLP)和模式識別等技術實施智能預測與決策,提升員工工作效率和企業生產力。而面向推薦系統、自然語言處理、圖像識別、媒體處理和交付,以及媒體分析等AI應用場景,用戶需要更精準化地分析和快速地推理。
這其中,作為AI領域的重要分支,自然語言處理(NLP)正獲得前所未有的市場關注與技術追蹤,將大幅緩解金融、醫療、法律等行業中人力密集型工作環節帶來的效率和成本壓力。
作為國內擁有強大互聯網基礎的領先AI公司,得益于近十年來在自有“飛槳”人工智能框架上的前瞻布局和大力投入,百度已在NLP領域構建起了完整的產品體系與技術組合。而隨著技術與產業結合的深入、商業化應用落地的加快,用戶對百度飛槳文心 · NLP大模型的重要組成部分——ERNIE 3.0提出了更多細分需求,如更高的處理效率和更廣泛的部署場景等。
為此,百度不僅借助其創新技術優勢,推出了更適合落地應用的輕量版ERNIE-Tiny,同時與英特爾攜手,引入了全新第四代英特爾至強可擴展處理器,其內置的英特爾AMX在實際工作負載中,能同時支持BF16和INT8數據類型,其每個物理核在每個時鐘周期可實現2,048次INT8運算和1,024次BF16運算,這無疑大幅提升了AI工作負載的效率。ERNIE-Tiny在升級使用內置英特爾AMX的第四代至強可擴展處理器后,整體性能對比上一代提升高達2.66倍3,推理性能大大提升。
“全新第四代英特爾至強可擴展處理器及英特爾AMX技術的引入,使得輕量版ERNIE 3.0在通用CPU平臺上也能獲得令人滿意的推理效能,從而能幫助更多用戶在其既有IT設施中更為方便地部署ERNIE 3.0,從而進一步普及其應用范圍。”百度自然語言處理部架構師孫宇即如此評價英特爾AMX的杰出表現。
除此之外,由AI賦能的計算機視覺也已經成為企業獲取數據洞察、推動業務智能化轉型的重要途徑。視覺AI解決方案能夠利用增強型深度學習神經網絡,以更精密的方式獲取數據,將分析能力提升到全新水平,從而幫助企業提升工作效率、降低成本、增加收入并提高客戶滿意度。隨著業務的發展與視覺數據的爆發式增長,企業希望能夠在加速計算視覺AI模型訓練和提高推理性能的同時,獲得更高的投資收益。
美團作為與人們日常生活關系密切的科技零售公司,在其自身發展過程中,高度重視以視覺AI技術創新,賦能餐飲、出行、旅游、購物、娛樂等多種業務,充分踐行“零售+科技”的戰略。
為了加速視覺AI推理,美團利用第四代英特爾至強可擴展處理器及其內置的英特爾AMX等高級硬件能力,將模型從FP32轉化為BF16等方式,并結合了英特爾PyTorch擴展(英特爾IPEX)加速PyTorch,更有效地提升了深度學習推理和訓練的計算性能,將主流視覺模型的推理性能提升了3.38-4.13倍左右。同時,結合動態擴縮容等頭部服務優化策略,美團將線上資源效率整體提升3倍以上,節省70%的服務成本4,實現了資源的敏捷調度,支持了視覺AI服務的高效創新,并賦能了業務智能化升級。
03
在高性能的基礎上需要更快、更安全
除了復雜應用場景下對高算力、高性能和低成本的需求外,對于企業用戶而言,面向更多更豐富的場景,高可靠和高安全的數據處理和分析能力則是更為基礎和底層的需求。
隨著大數據時代數據量的指數級增長,在保障數據安全性的前提下,更高效地處理大量動態數據與靜態數據,如今面臨著巨大的挑戰。
將大數據分析的全流程拆解來看,預處理階段即需要面對多個技術難題。以加密和壓縮環節為例,作為批量數據預處理的必然流程,只有優先完成數據處理之后才能進行分析。而這個過程需要消耗大量的CPU時鐘周期,從而大大限制了計算密集型工作負載的運行效率。
針對這個難題,第四代英特爾至強可擴展處理器“點對點”突破,內置了數據保護和壓縮加速技術(英特爾QAT),通過卸載加密、解密和壓縮釋放處理器內核,從而讓系統能夠支持更多客戶端運行或實現降低能耗的目的,可將內核用量減少高達95%;另外,QAT能夠幫助加速數據庫備份和聯機事務處理(OLTP)操作,實現了2倍的吞吐量提升(針對一級壓縮),從而助力提升網絡和存儲應用的整體性能。
解決了數據處理流程中的安全挑戰,面向實際的工作負載,數據在應用過程中的安全又該如何保障呢?英特爾軟件防護擴展(英特爾SGX)可以解決這個難題。英特爾SGX提供硬件級的安全“屏障”,能通過應用程序隔離技術,保護選定的代碼和數據免遭修改,只要將應用程序分隔到強化的安全區或受信任的執行模塊,即可以啟用身份和記錄隱私、安全瀏覽和數字管理保護(DRM),或者任何需要安全存儲機密或者保護數據的高保障安全應用場景中,幫助企業在安全可信的基礎上更好地進行數據價值發掘。
由此可見,對于未來數字經濟而言,算力等基礎設施的舞臺才是核心的角力場。正如全球著名投資機構a16z評價ChatGPT時所說,“基礎設施服務商可能才是最大贏家,獲得最多的財富。”
包括AI在內的新技術在取得突破后,要想走入“尋常百姓家”,實現大規模的部署和應用,算力的安全、高速、高可靠、高性能等能力缺一不可。甚至可以說,算力的增強真正驅動了數字經濟的增長。
因此,不斷突破算力瓶頸,以創新引領應用實踐才是當代數字經濟的“主旋律”。而毫無疑問的是,作為處理器領域的生態構建者,英特爾已經做好了準備,以技術創新力和卓越的產品力不斷“乘風破浪”,助力滾滾數字化大潮。
審核編輯 :李倩
-
cpu
+關注
關注
68文章
10898瀏覽量
212535 -
數字經濟
+關注
關注
2文章
1059瀏覽量
18319 -
ChatGPT
+關注
關注
29文章
1566瀏覽量
7890
原文標題:ChatGPT爆火后,怎樣跳脫算力困局?
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論