落地方能檢驗(yàn)技術(shù)真章。
9月7日,在一年一度的騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊自研的通用大語言模型混元大模型正式亮相,并宣布正式通過騰訊云對(duì)外開放。企業(yè)用戶可以直接在騰訊云上調(diào)用混元API,或者將混元作為基底模型構(gòu)建上層應(yīng)用。
與市場上很多廠商都在爭先恐后的優(yōu)先推進(jìn)對(duì)話式大語言模型不同,騰訊在大模型落地探索上有著明顯不一樣的節(jié)奏和堅(jiān)持。
最直接的節(jié)奏體感是騰訊的“不著急”——在廠商紛紛搶占今年三、四月份的第一波大模型時(shí)間卡位時(shí),馬化騰直言“騰訊不急于做半成品”。所以直到6月,大眾才第一次正式看到騰訊的行業(yè)大模型,彼時(shí),市場上已經(jīng)在風(fēng)風(fēng)火火的上演著“百模大戰(zhàn)”。
細(xì)究這種“不著急”背后,也許并非是因?yàn)轵v訊在戰(zhàn)略上“輕視”大模型的機(jī)會(huì),而是他們認(rèn)為大模型的價(jià)值核心不在時(shí)間窗口上,而在落地實(shí)踐中。畢竟,在馬化騰看來“大模型是互聯(lián)網(wǎng)百年不遇的機(jī)會(huì),是類似發(fā)明電的工業(yè)革命一樣的機(jī)遇。”
這種更倡導(dǎo)落地的價(jià)值觀在當(dāng)下正逐步成為行業(yè)共識(shí)——隨著更多大語言模型對(duì)外開放,科技公司除了在不斷打磨模型能力之外,也相繼走進(jìn)了各行各業(yè),踏上了場景落地探索的新征程。目前,云廠商在大模型的產(chǎn)業(yè)落地思路上基本已達(dá)成共識(shí):MaaS(Model-as-a-Service)模式,落地行業(yè),走在場景中,和客戶一起合作做垂類大模型。
如果大模型的價(jià)值核心在場景落地上,騰訊的解題思路是什么?
1.騰訊的選擇:實(shí)用主義
不同公司在發(fā)展大模型技術(shù)上思路不同,選擇的優(yōu)先級(jí)也不同。有的公司更關(guān)心技術(shù)、參數(shù),把追趕ChatGPT定為首要目標(biāo)。有的公司更關(guān)心場景閉環(huán),在早期階段就選擇把場景驗(yàn)證納入技術(shù)探索的必經(jīng)之路上。
騰訊的答案明顯是后者。從6月19日發(fā)布行業(yè)大模型之初,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就強(qiáng)調(diào)了騰訊的大模型價(jià)值觀:“通用大模型不一定是滿足行業(yè)場景需求的最優(yōu)解。企業(yè)需要有針對(duì)性的行業(yè)大模型,結(jié)合自己的數(shù)據(jù)做訓(xùn)練或精調(diào),在合理的成本下,打造實(shí)用性更高的智能服務(wù)。”
騰訊的這種價(jià)值可以用四個(gè)字來概括——實(shí)用主義。這也是騰訊做大模型貫穿始終的一條暗藏的主線。
一方面,實(shí)用主義意味著,騰訊云更關(guān)注大模型如何解決場景問題而不僅僅是參數(shù)大小。騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲曾直言:“幾億、幾十億、幾百億還是一千多億,我們并不關(guān)心模型參數(shù)的那個(gè)數(shù)字,我們更關(guān)注的怎么解決客戶的問題,希望用最有效,最低成本的手段去解決客戶的問題。”
另一方面,實(shí)用主義意味著,要更關(guān)心應(yīng)該用什么技術(shù)組合?如何更有效率的解決問題?吳運(yùn)聲提到:“就像舉重運(yùn)動(dòng)員要舉200斤的杠鈴,但作為游泳運(yùn)動(dòng)員舉100斤就夠了,作為體育室,我們提供200斤的杠鈴,但對(duì)于不同類型的運(yùn)動(dòng)員或者更多普通人,他們沒有必要都要用200斤的杠鈴練習(xí)。”
在他看來,在一些行業(yè)和具體的領(lǐng)域,數(shù)據(jù)量本身就沒那么大,用小參數(shù)成本低,效果也會(huì)更好。“我們希望以最低的成本,最合適的模型,最好的服務(wù)去讓客戶真正把技術(shù)用起來,解決它在場景中的問題。”吳運(yùn)聲說。
他認(rèn)為這是騰訊云一直在貫徹的技術(shù)實(shí)用主義:“從大模型整體思路來看,我們并不特別關(guān)注形式,而是注重技術(shù)產(chǎn)生的實(shí)際價(jià)值,以及在客戶業(yè)務(wù)中的價(jià)值體現(xiàn)。我們的核心出發(fā)點(diǎn)都是基于此。”
這種經(jīng)驗(yàn)和判斷來源于騰訊云在to B領(lǐng)域的多年深耕——大模型技術(shù)需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價(jià)值,“智能化的后半場,騰訊云智能在堅(jiān)持投入AI技術(shù)研發(fā)的同時(shí),一直專注于產(chǎn)業(yè)實(shí)踐,強(qiáng)調(diào)技術(shù)的務(wù)實(shí)可行和產(chǎn)品的安全可靠。”吳運(yùn)聲提到。
對(duì)外,所有的技術(shù)最終都要面對(duì)場景的發(fā)問。深度學(xué)習(xí)之后,上一波AI熱潮的歸向也是如此。過去幾年中,更多AI公司在已經(jīng)放下“標(biāo)榜自身有多牛”的身段,轉(zhuǎn)而走向更落地的方向,尋找真正可規(guī)模化的場景。
對(duì)內(nèi),騰訊云也一直在踐行落實(shí)這種技術(shù)實(shí)用主義。作為騰訊云承擔(dān)大量前沿探索工作的關(guān)鍵部門,騰訊優(yōu)圖實(shí)驗(yàn)室也一直在堅(jiān)持“研究和落地并重”的方針:一方面需要站在科技前沿探索更多的可能性,另一方面需要考慮技術(shù)能解決的實(shí)際問題,而非純粹的技術(shù)至上和論文至上。“研究、落地兩條腿走路,這是優(yōu)圖從成立的第一天開始就在強(qiáng)調(diào)的重點(diǎn)方向。”吳運(yùn)聲說道。
他認(rèn)為,關(guān)心落地并不意味著不關(guān)注前沿研究。“我們的研究恰恰是以解決在落地中遇到的實(shí)際問題為前提,每年我們也會(huì)發(fā)布很多論文,但和其他家不同的地方在于,優(yōu)圖幾乎70%、80%論文原點(diǎn)都是我們?cè)趯?shí)際場景中遇到的問題。基于問題,我們進(jìn)行探索研究,最終抽象成學(xué)術(shù)層面的東西。”
技術(shù)要更實(shí)用也能顯現(xiàn)出價(jià)值,并不是一句空話。
2.實(shí)用主義的源頭:一線用戶的需求
實(shí)用主義并非是騰訊云的一家之言,騰訊依靠的是來自一線企業(yè)需求的真實(shí)反饋。正如湯道生所言:“企業(yè)需要的是在實(shí)際場景中真正解決了某個(gè)問題,而不是在100個(gè)場景中解決了70%-80%的問題。”
今年以來,騰訊云一直泡在一線和用戶溝通具體的需求。騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人吳永堅(jiān)告訴「甲子光年」,當(dāng)前,企業(yè)客戶對(duì)于大模型的技術(shù)需求正在逐步變得更理性。“客戶在張開懷抱擁抱技術(shù)的同時(shí)提出了更多實(shí)用性的需求:有人關(guān)心大模型技術(shù)能夠結(jié)合產(chǎn)品上做更定制化;有人希望拓寬大模型更多元的知識(shí)來源,也有人希望生成精準(zhǔn)的行業(yè)知識(shí),準(zhǔn)確率要有保障。”他認(rèn)為,技術(shù)需要結(jié)合多種因素組合考量:“安全性、部署、成本等多重因素交織下,再去考慮技術(shù)的可達(dá)性。”
這些多樣化的需求意味著,單一模型很難滿足所有需求。“我們不會(huì)去強(qiáng)調(diào)技術(shù)有多強(qiáng),而更側(cè)重于產(chǎn)品如何去解決客戶的實(shí)際問題。”
基于此,騰訊云打造了支撐實(shí)用主義落地的全套MaaS服務(wù)體系,并持續(xù)根據(jù)用戶需求進(jìn)行迭代:基于自研的騰訊混元大模型,同時(shí)支持業(yè)內(nèi)主流的開源模型應(yīng)用,從技術(shù)底座、平臺(tái)能力和智能應(yīng)用三個(gè)維度,助力客戶構(gòu)建專屬大模型和智能應(yīng)用,推動(dòng)大模型在產(chǎn)業(yè)中的落地應(yīng)用。
騰訊云MaaS解決方案,圖片來自騰訊
技術(shù)底座層包含算力工具和行業(yè)模型。算力方面,包含騰訊云今年4月發(fā)布的專為大模型訓(xùn)練設(shè)計(jì)的新一代HCC高性能計(jì)算集群;依托自用的向量引擎(OLAMA)騰訊云也已經(jīng)推出向量數(shù)據(jù)庫(Tencent Cloud VectorDB);以及自研的星脈計(jì)算網(wǎng)絡(luò)架構(gòu)。“通過存儲(chǔ)、計(jì)算、網(wǎng)絡(luò)整體的升級(jí),我們今天實(shí)現(xiàn)了訓(xùn)練一輪萬億參數(shù)的模型在4天之內(nèi)就可以完成,并讓訓(xùn)練效率得到大幅提升,訓(xùn)練時(shí)間得到保障,訓(xùn)練成本下降很多。”騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲提到。
平臺(tái)方面,騰訊云TI平臺(tái)是騰訊云大模型能力在行業(yè)落地的技術(shù)“殺手锏”:不僅包含此前就有的數(shù)據(jù)標(biāo)注、訓(xùn)練、評(píng)估、測試和部署等工具,還有可以進(jìn)行更優(yōu)訓(xùn)練和推理加速“太極Angel”,以及從“業(yè)務(wù)分析、數(shù)據(jù)處理、大模型選擇”到“模型評(píng)測”的一體化完整方法論。吳運(yùn)聲稱:“我們對(duì)企業(yè)在做模型精調(diào)過程中的精調(diào)、部署等方面的工具做了全棧式打造,可以讓每個(gè)想做自己模型的企業(yè),基于TI平臺(tái),用騰訊云的加速框架、基礎(chǔ)算力、開源工具,讓構(gòu)筑行業(yè)模型變得更簡單。”
在2023年騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊云對(duì)這套技術(shù)底座進(jìn)行了新的升級(jí):
平臺(tái)層,一方面,TI平臺(tái)也全面接入了Llama 2、Falcon、Dolly等主流開源模型,支持系列模型的直接部署調(diào)用、應(yīng)用流程簡單。
工具鏈層,騰訊云為客戶提供了多款即插即用的產(chǎn)品,客戶只需加入自己獨(dú)有的場景數(shù)據(jù)進(jìn)行精調(diào)訓(xùn)練,就可快速嘗試多種大模型,并根據(jù)自身業(yè)務(wù)場景需求,就可以在短時(shí)間內(nèi)精調(diào)出專屬的模型方案。
加速方面,升級(jí)后太極Angel大模型加速框架,通過異步調(diào)度優(yōu)化、顯存優(yōu)化、計(jì)算優(yōu)化等方式,相比行業(yè)常用方案性能提升30%以上。
應(yīng)用層,騰訊企點(diǎn)繼續(xù)升級(jí)了全新一代智能客服,提升了管理端配置能力、知識(shí)構(gòu)建效率,優(yōu)化C端用戶體驗(yàn);同時(shí)騰訊企點(diǎn)分析AI助手,覆蓋對(duì)話式分析,輔助數(shù)據(jù)配置、提取智能結(jié)論、一鍵生成報(bào)告四大場景,該功能正式在9月向大客戶開放內(nèi)測申請(qǐng)。
這些多樣的技術(shù)組合支撐著騰訊云將大模型落實(shí)到千行百業(yè)。
3.踐行實(shí)用主義,把大模型落地實(shí)體經(jīng)濟(jì)
對(duì)于眼下的騰訊云而言,究竟如何真正將實(shí)用主義落地真實(shí)的場景中?
從戰(zhàn)略優(yōu)先級(jí)上來看,當(dāng)前騰訊云已經(jīng)有一套清晰的思考:第一步,錨定標(biāo)桿客戶。第二步,輻射整個(gè)上下游產(chǎn)業(yè)鏈的腰部企業(yè)。“眼下,我們會(huì)挑選若干個(gè)關(guān)鍵場景,結(jié)合客戶需求做深做透,形成標(biāo)桿,之后就能夠往腰部覆蓋,開展規(guī)模化。”騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人吳永堅(jiān)告訴「甲子光年」。
其次是重要行業(yè)和領(lǐng)域。這個(gè)答案從騰訊云此前的大戰(zhàn)略就可以得出——實(shí)體經(jīng)濟(jì)。
實(shí)體經(jīng)濟(jì)是大模型必爭之地。工信部提出,到2025年,70%的規(guī)模以上制造業(yè)企業(yè)基本實(shí)現(xiàn)數(shù)字化網(wǎng)絡(luò)化。騰訊云也在2021年進(jìn)行了全面的調(diào)整來持續(xù)開拓實(shí)體經(jīng)濟(jì)市場。騰訊對(duì)自己的角色定位一直是——實(shí)體經(jīng)濟(jì)的數(shù)字化助手。工業(yè)、制造、能源、零售等都是騰訊云的核心陣地,目前三一重工、富馳高科、國家電網(wǎng)都是其客戶。
騰訊集團(tuán)副總裁、政企業(yè)務(wù)總裁李強(qiáng)在分享中稱:“騰訊會(huì)堅(jiān)定的推動(dòng)大模型走入產(chǎn)業(yè)全鏈條。比起聊天、答題、內(nèi)容生產(chǎn)等,大模型在產(chǎn)業(yè)的具體場景應(yīng)用,對(duì)實(shí)體經(jīng)濟(jì)將帶來更大價(jià)值。”在他看來,機(jī)會(huì)巨大:“中國擁有智能化落地的豐沃土壤和場景,我國的制造業(yè)規(guī)模已經(jīng)連續(xù)13年居世界首位。中國信通院預(yù)測,到2030年,中國產(chǎn)業(yè)智能化的規(guī)模會(huì)超過10萬億元,智能化還將推動(dòng)勞動(dòng)生產(chǎn)率提升20%。”
目前,騰訊云已經(jīng)攜手政務(wù)等行業(yè)的頭部企業(yè),在二十余個(gè)行業(yè)探索了超50個(gè)行業(yè)大模型的應(yīng)用解決方案。以騰訊云數(shù)智人工廠為例,騰訊云MaaS能力可以讓數(shù)智人分身復(fù)刻縮短至24小時(shí),大幅降低成本。在文旅領(lǐng)域推出的文旅大模型,金融領(lǐng)域打造的OCR大模型都是已經(jīng)在落地的案例。
比如,騰訊云OCR大模型可以提升非結(jié)構(gòu)化內(nèi)容識(shí)別、理解能力,企業(yè)可以通過TI平臺(tái)對(duì)OCR大模型進(jìn)行精調(diào)。這是一種極大的能力躍遷。此前傳統(tǒng)的OCR深度學(xué)習(xí)模型需要經(jīng)過檢測、識(shí)別、結(jié)構(gòu)化等多個(gè)階段,很難突破監(jiān)測識(shí)別難點(diǎn),且不具備閱讀理解和推理能力,更難以進(jìn)行標(biāo)準(zhǔn)化,企業(yè)的定制成本高昂。新的大模型技術(shù)讓這些難題不再是障礙,能夠讓圖像到文字直接生成,使得任務(wù)間能力互補(bǔ),泛化性更強(qiáng),場景更豐富。
OCR大模型提升了很多場景的工作效率,比如工業(yè)質(zhì)檢場景下,工廠可以讓大模型識(shí)別電線規(guī)格、零部件規(guī)格說明書,物流快遞場景下,物流公司可以讓大模型識(shí)別集裝箱規(guī)格、電子顯示屏讀數(shù),這種端到端理解圖片的能力,極大的提高了流程效率。
這只是騰訊云推動(dòng)大模型在實(shí)體經(jīng)濟(jì)的一小步。
更多關(guān)于實(shí)用主義的探索正在路上。騰訊正持續(xù)推動(dòng)大模型走入產(chǎn)業(yè)全鏈條。隨著技術(shù)在千行百業(yè)的扎根,從田間到產(chǎn)線,從實(shí)驗(yàn)室到便利店,大模型將無處不在。
-
智能化
+關(guān)注
關(guān)注
15文章
4869瀏覽量
55343 -
騰訊
+關(guān)注
關(guān)注
7文章
1652瀏覽量
49423 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2643
原文標(biāo)題:騰訊的大模型價(jià)值觀:實(shí)用主義|甲子光年
文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論