【Gemini 大模型主打多模態,性能對標 GPT-4】
當地時間12月6日, 谷歌公司宣布推出其規模最大、功能最強的多模態大模型 Gemini, 其最強大的 TPU (張量處理單元)系統 “Cloud TPU v5p”, 以及來自谷歌云的人工智能超級計算機。
本次谷歌推出的多模態大模型Gemini 依然采用Transformer架構,采用高效Attention機制,支持32k 的上下文長度。Gemini 主打在多模態領域的突出能力,在輸入端, Gemin 可以適應文本與音視頻交叉的輸入序列,比如自然圖像、圖表、截圖、pdf 和視頻等。在輸出端,Gemini 兼具文本和圖像兩種輸出形式。與市面上大模型不同的地方在于,Gemini 從設計之初開始就是多模態的,并不像 OpenAI 構建 DALL·E和 Whisper 單獨訓練圖像和語音模型。
Gemini 1.0家族涵蓋三類模型,各有定位:
1)Gemini Ultra: 用于高度復雜的任務,為規模最大、功能最強的類別,定位為GPT-4的競爭對手;
2)Gemini Pro: 是一款中端型號, 用于增強性能和大規模部署能力,根據谷歌技術報告,其性能優于GPT-3.5;
3)Gemini Nano: 主要用于特定任務和移動設備。
模型能力方面, Gemini 系列在文本、多模態、模態組合等領域均實現了較大進展,在絕大多數基準測試中性能領先于GPT-4。
我們認為,此次AI 模型Gemini 的推出對AI 產業鏈上下游均有不同程度的帶動作用。上游層面,受益于AI 巨頭在大模型領域的競爭白熱化, AI 算力需求持續增進;下游層面AIGC產業可借助大模型應用變革內容生產方式,擴大發展空間。
【國內AI 大模型加速布局,推動下游AIGC 業務發展】
AIGC 相關應用方面的創新主要包括兩種大模型的應用分支:
生成對抗網絡 (GAN)/ 擴散模型 (Diffusion);
Transformer 預訓練大模型。在國外AIGC 應用大規模運用大模型技術的同 時,我國企業也在加快對大模型產品的布局。云廠商、AI 大廠、創企、各行業 公司及技術服務商等產業各領域玩家也在陸續推出大模型或基于大模型的應用產品及各類技術服務。
AIGC 產業擁有巨大的發展潛力與成長空間,可借助大模型變革內容生產方式,提升生產效率和創意。
根據艾瑞咨詢預測, 2028年我國AIGC 產業預計規模將達到7202億元,將完成在重點領域、關鍵場景的技術價值兌現,并逐步建立完善的模型即服務產業 生態,預計2030年中國AIGC 產業規模將突破至11441億元。大模型對內容理解 和內容生成的雙向能力使其既能以極低門檻實現多模態內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介。
未來,全行業將借助大模型能力衍生出的大量AI 生產工具,實現內容生產效率的飛躍,并進一步降低數字生態的人機交互門檻!
【多模態大模型呼喚更多算力,開啟上游服務器新發展】
Gemini1.0 號稱具有原生多模態能力,能夠處理視頻、音頻、圖像、文本和代碼等多種形式的內容,且性能優于現有的“拼接型”多模態大模型。從谷歌官方公布的技術文檔中的示例來看,Gemini 不僅能夠進行雙模態之間的轉換(如文生圖或文生視頻),亦能處理需要進行多模態轉換的復雜任務。
多模態大模型的算力需求遠高于純文本模態。 以 Gemini 為例,其強大的多模態能力背后,是龐大的算力需求。雖然沒有正式公布,但根據內部消息,Gemini 有萬億參數,訓練所用的算力甚至達到GPT-4的五倍。有別于傳統大模型對英偉達硬件及生態的依賴,Gemini 訓練所需的算力基于谷歌自研的 TPUv4 和 v5e等硬件。
在推出新模型的同時,谷歌順勢宣布推出迄今為止功能最強大、最高效、可擴展性最強的 TPU 系統 Cloud TPU v5p,將用于開發更高層次的AI 大模型。其 TPU v5p的訓練性能是上一代 TPU v4的2.8倍,內存帶寬提升3倍,芯片間互聯帶寬翻倍,達到4.8Tbps, 同時,v5p 單個 POD 中的芯片數量翻倍,達到8960顆。
受到人工智能大模型的發展熱潮影響,AI服務器的需求量將大幅度增加。 數量方面,根據TrendForce 預測,2023 年全球 AI 服務器出貨量將接近120萬臺,年增長率接近38.4%,占整體服務器的9%。預計到2025年整體出貨量將增加至190萬臺,2022-2025年年復合增長率將達到30.4%。
價格方面,通用服務器價格一般為幾千美金/臺,而主流AI 服務器價格多在 10-15萬美金/臺,單價呈現指數型提升。 根據中商情報網預計,2022年全球 AI 服務器市場規模約為183億美元,預計2023年將達到211億美元,同比增長率高達15.3%。
我們篩選出以下潛力標的
紫光股份(000938)公司發布了全新一代自研八路關鍵業務服務器H3C UniServer R8900 G3,可支持高達8顆高端處理器,224個計算核心,具備96個內存插槽, 滿足核心數據庫,虛擬化,高性能計算,人工智能,內存計算等多種關鍵業務場景運算需求。
中科曙光(603019)公司通用服務器產品、存儲產品在國內市場上處于領先地位。具有完整的產品線,能夠滿足各類細分市場的需求。
浪潮信息(000977) 目前,公司已成為百度、阿里巴巴、騰訊等客戶最主要的AI 服務器供應商。
參考資料:
平安證券-計算機行業動態跟蹤報告:多模態能力表現亮眼,谷歌攜Gemini 王者歸來-231208.pdf
上海證券-通信行業周報:最強AI 模型Gemini 正式發布,多模態應用前景廣闊-231215.pdf
審核編輯 黃宇
-
驅動
+關注
關注
12文章
1841瀏覽量
85328 -
計算機
+關注
關注
19文章
7508瀏覽量
88070 -
算力
+關注
關注
1文章
985瀏覽量
14838
發布評論請先 登錄
相關推薦
評論