隨著時間來到2023年第三季度,國產大模型已經達到100多個,“百模大戰”正式開啟。
大模型,我們有了很多選擇,也開始呈現出某種同質化。除了拼參數、比背景、看榜單,有沒有其他方法,讓我們更好地判斷一個大模型的價值呢?
亞里士多德認為,任何一個系統都有自己的第一性原理,它是一個根基性命題或假設,不能缺省,也不能被違背。
透過表象,追尋本質,會發現各家大模型的 “第一性原理”,有很大的不同。而這個核心的不同,也會帶動大模型走向不同的發展模式。
比如OpenAI的內核是AGI,大語言模型以“通用人工智能”的目標,作為出發點,最近才開始走向行業。
一些通用大模型,內核是“科研”,在榜單上有不俗的成績,而行業應用所需要的配套工具、算力基礎設施等,則不在研發者的考量中,逐漸淡出主流視野。
一些產業大模型,內核是“應用”,要快速勝任某一些具體的任務場景,加入了行業知識和專有數據“特訓”,可基礎模型能力一般,遇到“常識性問題”就掉鏈子。
工具可以開發,算力可以買,一個大模型的內在價值核心,卻不會輕易替換。
我們一層層剝開京東大模型,看到了一個核心,就是——“產業”。
最近恰逢WAIC和JDD大會,我們跟京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬博士,進行了多次交流,他深入分享了很多京東對于大模型的思考。
將“產業價值”作為大模型的“第一性原理”,會讓大模型走出怎樣一條差異化的發展之路呢?我們不妨以京東為例,來展望一下產業大模型的未來。
大模型的價值起點
巴菲特曾說過,投資是滾雪球,找到“長長的坡”和“很濕的雪”,雪球一旦啟動,堅持下去,就能越滾越大。
從產業的視角出發,會發現大模型這顆“雪球”的核心價值自證,確實還存在著很多問題,比如:
1.技術的可用性存疑。
產業化最后一公里的問題,看起來好像不大,卻是決定大模型能用不能用的邊界。
京東從2017年開始關注大模型,就很注重行業落地,也碰到了一些經驗教訓。
何博士直言,“拿著刷榜的技術給業務部門去秀,用起來碰到各種各樣的小問題,對使用者來說不可用,后來人家就不信你了,你再怎么說也覺得你技術不行”。
2.行業的連接不夠充沛。
大模型落地,需要解決一個一個具體問題。這些問題不可能在實驗室里“涌現”,行業到底需求什么,有哪些限制條件,都要從產業實踐和應用中找到答案。
何曉冬博士認為,大模型是不能自己坐在辦公室拍腦袋想出來的,一定是行業凝練出來的。
但向上觸碰學術、向下扎根行業,這樣的AI研究機構本身就很稀缺。
3.價值回報還很朦朧。
引入大模型,意味著企業要增加各種成本,消耗大量的資源。企業引入大模型,也希望得到經過反復嘗試被證明沒有問題的產品。目前很多大模型的價值自證,還不夠有力。
何博士就提到,一般的生成式語言模型,內容正確率是83%、85%左右,to C用戶覺得還可以,但嚴肅商用的時候,模型正確率要達到95%以上,才能達到企業的要求。“明明這個活動打的是八折,大模型生成的營銷文案說是五折,這個事情商業上是不可接受的”。
事非躬行不知難,大模型急需一場產業價值的自證與他證。
破解方式其實也很簡單,就是一步一個腳印,把該踩的坑都踩了,把遇到的問題都一一解決。
所以年初,大語言模型高歌猛進的時候,京東沒有跟風,它在忙什么?忙著解決問題。
京東的長坡
以“產業價值”作為 “第一性原理”,京東做大模型最先關注的,不是簽了多少單,什么時候開發布會,而是夯實基礎設施。
AI三要素:數據、算力、算法,都需要升級,才能撐住大模型時代,如同一個“長坡”,讓大模型的“價值雪球”可以向前滾動。
先說數據。產業大模型,一般是先用公域數據訓練基礎模型,再用行業專有數據進行“特訓”,相當于先在中學上通識課,再到大學里去學專業技能。京東的思路很不一樣,言犀大模型訓練時融合70%的通用數據與30%數智供應鏈原生數據,把零售、金融、健康、物流的know-how和數據,也放到基座模型中,相當于既做了通識教育,又上了很多門專業課,有更多的行業理解。
所以京東的大模型一推出來,面向知識密集型、任務型產業場景,已經可以解決真實產業問題。
再說算法。算法是大模型的核心能力,也是拉開產品體驗差距的關鍵。目前,單點算法已經不足以撐起大模型了,大語言模型就包含了強化學習、提示學習、預訓練等一系列優化。成體系的技術體系和算法創新,也更容易形成護城河。
然后是算力。很多大模型推出后不久便停止開放、限制互動次數,就是因為算力不足或成本昂貴,企業想用也用不起。所以,大模型后續能否持續為產業所用,算力不能成為短板。
京東在2021年就建立了最先進的DGX集群,在重慶落地了全國首個基于SuperPOD架構的超大規模計算集群——天琴α,推理提速6.2倍,推理成本節省90%,為基礎大模型的訓練和迭代提供保障,保持競爭力。
一路深耕AI三要素,京東為大模型從技術走向產業,構筑了一條“長坡”。至此,大模型的價值底座,已經非常堅實。
產業的厚雪
回顧上一階段的產業智能化,很多技術能力都停留在表面,難以深入行業或規模化復制。大模型的價值變得飽滿,要卷起產業的“厚雪”,將雪球越滾越大。
在何曉冬博士分享的一系列京東大模型技術和實踐里,我們可以看到,大模型黏住產業“厚雪”的多種姿勢:
一是技術黏著。
產業AI落地難的很多問題,其實都源于技術瓶頸,比如深度學習的不可解釋性、泛化能力不足、模型精度不夠等。京東通過基礎技術的體系化突破,讓大模型變得高可用,形成端到端的產品價值。
比如數字人,基于10余年智能對話經驗與多模態交互技術積淀,京東云多模態數字人只需要極少量樣本素材,5分鐘簡易拍攝,就可以自動生成聲情并茂的數字人,讓中小商家與個人能夠用得起、用得上數字人服務,算力、開發周期、人才等高門檻不再成為問題。
二是工具黏著。
目前,很多大模型廠商都開放了API調用的MaaS服務,但一個容易忽略的問題是,調API也是需要一定能力和開發工作的,很多傳統行業的用戶,連AI基礎調用API的能力都不一定有。
豐富、極簡、開箱即用的工具,是產業落地必不可少的條件。京東的目標是,讓對AI完全沒有認知的用戶,也可以直接使用大模型,提供從數據模型到應用服務的全周期管理,從基礎層、模型層、MaaS,延伸到了應用層的SaaS服務。
言犀大模型開放計算平臺的行業知識庫,就沉淀了100多種訓練和推理優化工具,不到一周時間,即可完成從數據準備、模型訓練、到模型部署的全流程。
三是實踐黏著。
比起某個榜單上的書面效果,企業應用大模型,更希望看到實際應用中的真實效果,對技術能力和價值收益有一個更清晰的感知。京東已經進行了大量的產業實踐,優勢格外明顯。
目前,大模型在零售、金融、健康、物流等京東內部高復雜場景大規模錘煉,并融合行業解決方案對外輸出,可以減少大模型落地的顧慮和成本。
比如文本生成,零售領域的文案,每個品類的敏感信息審核門檻都不一樣,基于京東全品類豐富的商品數據積累和大模型,京東云AIGC內容營銷平臺,已經可以通過一張商品圖片,生成電商運營需要的商品主圖,營銷海報圖和商詳圖等,每套圖成本降低90%,周期從7天縮短到半天,而且不用擔心內容有風險,因為大模型的安全可信,在京東零售內部已經錘煉過了。
再比如健康診療,是一個對內容專業性和可靠性要求非常高的場景,京東健康應用大模型,進行健康助手及輔助診療,已涵蓋超千種疾病專業性服務,目前累計超3千萬高質量醫患對話,百萬級規模醫學知識圖譜。這些積累。
黏住產業的“厚雪”,做實大模型的技術紅利,是這一輪AI熱潮,帶給科技企業的真正機遇。
在京東,產業大模型已經從一種技術設想,逐漸變為清晰的發展方向,以及可執行的行動方案,正在撬動產業AI的下一個可能。
抱一而為天下式,大模型的價值探索
在年初的熱鬧中保持冷靜,在“百模大戰”來臨之際,京東卻率先給出了大模型的價值公式:大模型的價值=算法×算力×數據×產業厚度的平方。
當下階段,大模型的野蠻生長,已經告一段落,走向新的應用紀元。推動大模型“從參數為中心”向“以應用為中心”轉變,是目前的核心問題。京東憑什么后發先至?或許是很多讀者心中的“未解之謎”。
但透過 “第一性原理”,我們卻可以看到,京東大模型差異化,是一種“必然”。
京東技術的“第一性原理”,就是“產業價值”。
如京東CEO許冉所說,京東研發每一項技術,都將產業屬性作為出發點、產業價值作為目標:技術源于產業需求,歷練于產業場景,創造產業價值。
這個“第一性原理”,造就了京東大模型的路線分野——產學研用的高度結合。
不同的出發點:不同于科研類大模型的“兩耳不聞窗外事”,也不同于行業大模型的“一心只掃門前雪”,京東從產業端切入大模型,既需要錘煉基座模型的先進技術,又需要考慮為整個產業和社會創造價值,這條路如同“從北坡等珠峰”,更難也更有價值。
不同的行路人:看到了路,就需要有攀登的人。以何曉冬博士為代表的京東技術人,眼中有人間煙火,聚焦產業場景,服務京東自己的業務需要,技術在真實場景中被實踐打磨,被驗證,再解耦賦能其他合作伙伴;眼中也有星辰大海,京東探索研究院當技術剛剛在地平線上露出來的時候,就看到五年后可能會發生一些革命性的改變,開始前瞻性的布局,大模型就是其中之一,具身智能、多模態大模型、AGI等,都是京東正在關注的方向。
不同的路線圖:京東做大模型,不是“無的放矢”,對于大模型的應用實踐,已經有了明確的“三步走”規劃,第一步,基于內部實踐構建通用大模型;第二步,在零售、金融、健康、物流等京東內部高復雜場景大規模錘煉,融合行業解決方案對外輸出;第三步,針對嚴肅商業場景將大模型能力對外開放。目前,京東云已經基于內部實踐構建了通用大模型。到今年年底,京東將經由高復雜場景大規模錘煉,迭代出扎實的產業服務,預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。目前,京東已經走到第二步,并在內部取得了豐富的實踐成果。
以“產業價值”作為大模型的“第一性原理”,驅動著京東在大模型領域,走上了差異化的發展模式,率先完成了產業價值的創生和積累,更早進入應用紀元。
京東大模型的“價值雪球”,正以“馬太效應”越滾越大,加速駛向千行百業、人間煙火。抱一而為天下式,大模型的產業價值,最終會凝結在萬千眾生的微笑里。
-
算法
+關注
關注
23文章
4607瀏覽量
92840 -
AI
+關注
關注
87文章
30728瀏覽量
268887 -
京東
+關注
關注
2文章
998瀏覽量
48473 -
OpenAI
+關注
關注
9文章
1079瀏覽量
6482 -
大模型
+關注
關注
2文章
2423瀏覽量
2641
發布評論請先 登錄
相關推薦
評論