時至今日,隨著算法、計算等的突破,生成式AI技術取得了令人驚嘆的進展,大大提高人類的創造力和效率,為各種創作和應用提供了無限的可能。
生成式AI技術的發展為各行各業插上了想象的翅膀。微軟(MSFT.US)、英偉達(NVDA .US)等科技大廠以及初創企業紛紛“跑步入場”生成式AI,已經覆蓋芯片制造、云計算、數據服務、自然語言處理、文本數據分析、計算機視覺及智能安防、交通、金融、物聯網等終端應用。
生成式 AI 在2023年發展迅猛,2024年這一勢頭還將持續。生成式AI工具已經被集成到文字處理器和軟件開發人員的工具中,而在2024年,這些工具將變得更有效、更有用。
AI多模態時代來臨
值得注意的是,雖然各類大模型層出不窮,但不斷優化升級,推動行業進步仍是各大科技公司的主攻方向。業內專家分析,大模型由單模態向多模態升級已成為行業熱點,多家公司在開發多模態的模型、計算機視覺技術,這些技術未來可以用來發現設計芯片等。
事實上,多模態是實現通用人工智能的必經之路。多模態數據輸入可幫助模型能力和用戶體驗提高,允許多模態數據輸出也更符合真實世界需要,在數據、算法及算力上的要求都要高于單模態,這一波自然語言大模型發展為其他模態提供了技術參考,行業有望加速發展。
正如谷歌(GOOG.US)Gemini橫空出世,讓大家的目光重新聚焦在了多模態大模型上。Gemini1.0號稱具有原生多模態能力,能夠處理視頻、音頻、圖像、文本和代碼等多種形式的內容,且性能優于現有的“拼接型”多模態大模型。
從谷歌官方公布的技術文檔中的示例來看,Gemini不僅能夠進行雙模態之間的轉換,亦能處理需要進行多模態轉換的復雜任務。從這個角度來看,Gemini上線是AI產業發展的里程碑事件,其代表的原生多模態大模型有望拓展大模型的應用場景和邊界。
如今AI浪潮進入多模態時代,市場潛力巨大。開源證券表示,科技巨頭之間多模態大模型的競爭日益激烈,同時驅動著底層多模態大模型的能力不斷突破,疊加GPT等AI應用形式的出現,新一輪人工智能應用熱潮正在掀起。
微美全息步入下半場,向多模態時代進發
在如今的AI時代,全新的技術范式正在重新定義企業 AI 應用的落地方式,加速企業全面智能化升級,企業更要勇于探索,產業更要直面競爭。據了解,作為領先的AI視覺服務商微美全息(WIMI.US)隨著以大模型技術為核心的 AIGC 技術的快速發展,帶來諸多AI創新應用開發和運維的新變化,積極賦能生成式AI 運用邁向多模態時代。
截止目前,微美全息已經在生成式Al+數字廣告、生成式Al+數字教育、生成式AI+數字文化傳媒、生成式Al+數字健康、生成式AI+出行等領域,讓生成式AI賦能到百行百業的方方面面。而在面向多模態時代,微美全息多模態大模型融合AI視覺、語音和數據處理技術,極大豐富了生成式認知和決策層面,有望使大模型在復雜人機交互、自然語言理解等領域取得重大進步。
另一方面,考慮到眾多大模型及多模態時代應用催生出更多算力需求,因此布署端側算力是生成式AI規模化擴展多模態時代至關重要的一步。微美全息對于端側算力研發十分重視,成立微美全息研發中心自研AI算力,邊緣算法、5G/6G網絡算力等,有望激化算力市場良性競爭,進而降低算力使用成本。顯而易見,未來,微美全息在多模態軍備競賽下算力基建產業鏈將持續受益。
結語
精彩紛呈的2023年被普遍視為生成式AI的元年,科技產業的圖景已經被深刻改變。毫無疑問,2024年,AI行業必將迎來巨大的變革。在這新的一年里,以ChatGPT為首的生成式AI技術在全球點燃研發浪潮,同時多模態會是推動本輪AI熱點繼續前進的下一個增長點。預計下一代多模態將會快速拓展目前大語言模型有限的應用場景,顯著提高語言模型的泛化能力,并吸引各大科技公司競相入局,加快讓這樣的想象來到現實世界中。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30996瀏覽量
269283 -
算力
+關注
關注
1文章
985瀏覽量
14838 -
大模型
+關注
關注
2文章
2476瀏覽量
2788
發布評論請先 登錄
相關推薦
評論