2023年的春天,稱得上一句AI之春。大模型成為技術力量新的爆發點,生成式AI(AIGC)應用風起云涌。
產業界爭先恐后訓大模型之際,廣大用戶最大的困惑是——發布了,但就是玩不到啊!
OpenAI有地域限制且不去說它,各種國產大模型也很少有大大方方讓大家隨便用的,排隊等邀請碼、群里求測試賬號、不開放API、只定向邀請企業客戶、上線沒幾天停止訪問……
過去幾個月,想用AIGC的人,沒少受這些折磨。
當然,這種局面也不能怪大模型的開發運營團隊,實在是“心有余而力不足”——AI算力太緊缺了。
想開發大模型的高校和研究機構,搶不到、買不起GPU卡;已經發布的大模型,用戶暴漲,導致算力需求的指數級增長和巨大的成本壓力,撐不住訪問。
就像保爾·芒圖在《十八世紀產業革命》中說的那樣:“經濟演變是比較混亂的,好像撒在大地上的種子那樣慢慢生長。無數模糊不明的事實,在細節上幾乎是微不足道的,但彼此無限地相互改變著”。
新型AI算力基礎設施,就是那個至關重要的細節,直接影響到這次智能產業革命的進程。
在諸多解決方案中,新華三的破題思路,別具特色,一言以蔽之——精耕務實。
首先讓我們先從算力本身出發,去看看大模型時代的AI奮鋤者,究竟需要什么?又能得到什么?
晨興理荒穢:算力土壤,為何貧瘠?
AIGC的價值潛力已經十分明晰,讓大模型成了各大科技企業爭相搶奪的那顆“好苗子”。
陶淵明描寫古人耕種要“晨興理荒穢,帶月荷鋤歸”,先摘除阻礙作物生長的雜草,才能保障后續的收成。
所以,首先要搞清楚一個問題,為什么AI算力顯得如此貧瘠?
第一,供給不足。受摩爾定律達到天花板的影響,計算硬件的性能提升越來越有限,AI算力短缺問題長期存在,大模型又進一步加劇了算力焦渴。以176B參數規模的大模型為例,FP16精度下,訓練過程內存峰值會達到2800G+,需要35張以上80G顯存的GPU才能容納。很多國內高校,有AI人才、技術積累,想要探索大模型,卻買不到、買不起GPU卡,止步于昂貴的AI算力門檻,是非常可惜的。
第二,需求溢出。大模型和生成式AI(AIGC)的出現,微軟、谷歌、百度等科技巨頭,都在用AI重新構想所有的核心產品。技術的快速溢出,算力基礎設施沒有來得及跟上,造成了AI算力供需的不匹配。隨著AIGC擴展到每個領域,越來越多的智力勞動逐步被AI化、自動化,算力供需的“剪刀差”,還會繼續拉大。
第三,效率低下。企業/科研機構對模型開發和AI全域應用的不了解、不高效,會直接導致準備不充足,比如訓練數據質量低、AI應用開發經驗不足、資源損耗大;研發周期長,比如大模型研發慢、推理效果差,不得不反復迭代試錯,也就消耗了更多的時間成本、算力成本。
第四,安全隱患。數據是模型核心的原材料,企業私域數據更是企業的核心資產。企業的大模型如果使用不當,會存在企業私域數據泄露的風險,造成企業即便擁有大量算力也不敢放心使用。
第五,可持續顧慮。“焚藪而田,豈不獲得,而明年無獸”,這個道理同樣適用于大模型時代。大模型的數據處理量巨大,帶動數據中心耗電量快速增加。GPT-3大模型每次訓練,碳排放量高達552噸。中國大模型和AIGC的發展,必須建立在綠色節能的算力基礎設施上,“東數西算”工程就為各地新建數據中心PUE,提出了嚴格的要求。
面對AI算力貧瘠的局面,干著急是沒有用的,唯有靠勞作者揮鋤挖地,為行業理清荒穢,釋放算力這一新生產力。
迎著大模型和AIGC的晨光,新華三已經開始培育AI的土壤。
精耕細作:新華三蘊育全棧AI
“算力不足,那就增加供給,堆GPU卡,上服務器,建數據中心集群”——這是常規思路。
新華三的AI蘊育之路沒這么簡單,在剛剛落幕的2023 NAVIGATE 領航者峰會上,新華三正式發布了“百業靈犀LinSeer”私域大模型和支持AIGC大算力調度的“傲飛算力平臺”,可與業務深度結合提升工作效率,持續優化算法和積累公域數據,為客戶提供最新知識能力。同時推出了“AIGC開放戰略”,既支持“百業靈犀+新華三ICT基礎架構”的模式保障數據安全,實現最優配合,同時也支持“客戶自選大模型+新華三ICT基礎架構”的模式滿足多種需求。
新華三如此用心耕耘,這么多的復合能力,究竟能為這一波AI浪潮帶來什么?
第一步,培土,讓大模型“用有其算”。
解決算力瓶頸,提供充足、普惠且安全的AI算力,支持高校、科研機構和廣大企業的充分探索,大模型和AIGC才有茁壯生長的可能性,靠的就是新華三智算解決方案的“算力基礎設施”,有三個顯著特點:
充足。新華三對基礎設施進行優化,讓硬件發揮出極致性能。打造了超高性能AI服務器,強勢推出H3C UniServer R5500 G6,可以提供8卡H800 OAM訓練能力,內部互聯400Gb/s極速網絡,支撐大模型的高效訓練。CX8000高性能分布式并行文件存儲,專為AI訓練研發,單節點IOPS可達20萬+,可以滿足AI超大規模數據對存力的需求。Seerfabric軟硬一體方案,通過跟AI深度融合,實現流量零丟包,發揮RoCE網絡最大性能,大模型訓練時間縮短10%,配合主動安全全面防護,為上層平臺和應用提供安全、高效的算力支撐。
普惠。模型開發部署的過程中,通過傲飛算力平臺共享AI算力,降低算力空閑時間,可以將算力利用率提高至70%以上,智算中心成本大幅下降,提供普惠AI算力。
安全。避免大模型服務使用時造成的數據外泄是企業放心使用大模型的重要前提。新華三智算解決方案通過4大安全體系:傳輸安全+數據安全+訪問安全+安全審計,保障用戶使用私域大模型的同時,全方位保障私域數據安全,避免企業私域數據出域。
綠色。新華三的零碳數據中心,將各綠色單元組合起來,降低高算力帶來的碳排放問題;新一代液冷解決方案,可以將數據中心的PUE降到1.1及以下,滿足國家對數據中心的低碳要求,帶來綠色算力。
第二步,護苗,讓大模型“算有其法”。
從來沒有下過地的新手,很容易就糟蹋了種苗,浪費了土地,更重要的是,錯過了農時。
大模型作為新技術,很多參與者都是剛開始接觸,要抓住寶貴的產業機會,必須有章法。新華三不僅提供“土壤”,還精心“護苗”,為大模型的成長、應用,帶來了全鏈路的平臺和服務。
平臺層面,統一的數據平臺“綠洲”,可有效進行數據全生命周期管理;支持AIGC的大算力調度平臺“傲飛”,提供包含智能標注、智能訓練、智能調優、智能部署、智能推理的全流程算力智能調度,支持8000節點的算力調度,并發訓練時間縮短至50%,斷點自動接續無感知訓練更穩定,全方面提升大模型訓練性能。
服務層面,針對大模型預訓練/微調、強化學習、提示學習等特點,新華三根據自身大模型實踐經驗,封裝了推理、微調、訓練這三種大模型服務能力,降低大模型使用門檻。
比如基座大模型推理,對推理架構/執行/過程進行優化,并提供配套基礎設施,可以為科研工作者構建AI科研環境,滿足數據挖掘分析、模式識別等需求。新華三的“傳輸安全+數據安全+訪問安全+安全審計”4大安全體系,可以在私域大模型的訓練推理過程中,保障企業數據資產的安全不外流。
私域大模型微調,新華三的10+種基座大模型,結合微調優化,可以助力企業快速打造垂直領域私域大模型,實現小時級生成。
自主大模型訓練,提供100多個評估維度與評估指標,如BLEU、ROUGE、METEOR等,有效縮短模型的研發周期。
接下來,孕蕾,讓大模型“算有所值”。
大模型和AIGC要通過產業落地,來完成技術的價值轉換。要結出更多的應用果實,前提是與百行百業開始連接、探索落地業務場景、孕育應用的花蕾。
這個“傳花授粉”的過程,僅靠單一的產業角色是無法完成的。新華三構建了一個開放的產業生態,吸引合作伙伴參與到大模型建設中,共同蘊育全棧AI的無限潛力。
全棧AI的生態繁榮,才有大模型的碩果累累,技術紅利的價值落地。
可以看到,正是新華三的精耕細作、用心栽培,大大降低了大模型和AIGC的發育難度。
借助新華三的智算解決方案,越來越多的研究者/企業,可以從算力焦灼中解放出來,抓住寶貴的增長窗口期,培育屬于自己的大模型。
由此,可以引出下一個話題:與時代同步,培育大模型“土壤”,為什么是新華三?
實地立身:新華三的根深,大模型的葉茂
大模型和新型智能基礎設施,是第四次產業革命的關鍵,也是數字經濟的大勢所趨,坦率地說,這個產業趨勢是顯而易見的。
但是,看到趨勢,并不一定能抓住趨勢。
大模型和AIGC等新技術的發展與應用,相當于在一片晨霧和產業荒原中摸索。算力基礎設施服務商,不可能“以其昏昏,使人昭昭”,自己都沒搞懂大模型和AIGC,自然沒法賦能研究者和高科技企業。
能構建一套清晰可行的智算解決方案,新華三的優勢就是“腳踏實地”。
首先,新華三的技術根深,可以構筑新價值。
深耕ICT領域,承擔AI領域科研課題的新華三,技術能力與產品積累非常深厚,布局廣泛,能夠為全棧AI技術、軟硬件和服務,提供持續創新的動能。
此外,新華三的創新務實,可以解決真問題。
大模型時代的技術變化和產業應用日新月異,各行業的落地條件和能力稟賦也有所不同,這就要求基礎設施服務商對變化有深刻且快速的洞察,才能確保每個行業/產學研各類用戶的需求都得到滿足。
作為數字化解決方案領導者,新華三有豐富的服務實體產業經驗,可以及時洞察產業客戶的需求,進行技術和產品的更新迭代,讓每一個創新都能切實解決用戶在意的真問題。
智算解決方案中,普惠算力,高效易用的平臺,軟硬拉通的服務等,都來自產業用戶在業務場景中成本敏感、效率優化等實際痛點。
回頭對比一下幾年前的生活,會發現AI技術已經在切實影響、改變我們的社會經濟。大模型的到來,讓智能變革繼續加速,最終每個人、每個行業乃至每一個國家,都會是人工智能的參與者和受益人。
產業智能革命的土壤,從未像今天一樣肥沃。在新華三的基礎設施底座上,大模型這顆種子,正在茁壯生長。接下來,就看百行百業如何釋放大模型的無限想象,將AIGC的碩果垂滿中華。
審核編輯黃宇
-
服務器
+關注
關注
12文章
9124瀏覽量
85332 -
算力
+關注
關注
1文章
965瀏覽量
14794 -
AIGC
+關注
關注
1文章
361瀏覽量
1539 -
大模型
+關注
關注
2文章
2425瀏覽量
2645
發布評論請先 登錄
相關推薦
評論