這段時間,ChatGPT成了全球科技企業(yè)“群起而攻之”的風口,幾乎打開每一個社交媒體平臺、每一個微信群,都在激情討論ChatGPT。
不過我發(fā)現,經過一段時間的發(fā)酵,大家的情緒不再只是獵奇和興奮,一部分AI業(yè)內人士,已經率先進入了ChatGPT冷靜期。
一位長期從事NLP/AI的研究人士告訴我,NLP本來屬于長期坐冷板凳的領域,ChatGPT對話中錯誤隨處可見,LLM大語言模型的商業(yè)模式還不清晰,認知智能剛剛劃過了冰山一角,對目前ChatGPT的一波波信息轟炸已經審美疲勞了,是時候給ChatGPT降降溫了。
降溫是不可能降溫的,但找回常識和理性是必須的。
大膽預測,今年會是一個ChatGPT大年。
國產化的必然選擇,股市與投資者的熱捧,大量中國科技企業(yè)已經切實在跟進類ChatGPT,而且“chat”問答天然的低門檻和娛樂性,確實會吸引大量原本不關心技術的人開始玩AI。所以,盡管圍繞ChatGPT,有很多瘋狂炒作和無稽之談,但熱度勢必還會持續(xù)一段時間。
當然,如果你已經對ChatGPT資訊有點審美疲勞了,好消息是,大部分人在“調戲”ChatGPT之后,獵奇心理也會消失。加上ChatGPT在應用和體驗上還需要迭代,個人關注度會下降,而能夠用ChatGPT帶來業(yè)務價值的產業(yè)關注度,還會持續(xù)保溫。
所以,ChatGPT接下來的發(fā)展,不是“要么火要么涼”那么兩極分化,而是會經歷一個恒溫培育孵化的發(fā)展期。
擔心中國做不好ChatGPT的,不用急,一切才只是剛剛開始;認為中國ChatGPT可以彎道超車的,不用嗨,新技術還是要按照規(guī)律按部就班地發(fā)展進步。
從第一代生成式預訓練模型GPT-1到GPT-4,這條路OpenAI走了五年??梢哉f,沒有對大模型的長期投入與探索,是不可能一步登天,做出ChatGPT這樣的產品的。
那么,中國有沒有類似的AI企業(yè),擁有支撐起類 ChatGPT的綜合實力呢?
通過國際權威咨詢機構IDC新近發(fā)布的《2022 中國大模型發(fā)展白皮書》,我們可以一窺國內大模型實力分布。
評估結果顯示,百度旗下的文心大模型表現非常突出,在市場格局中處于第一梯隊,產品能力、生態(tài)能力、應用能力全面領先,給百度即將發(fā)布的生成式對話產品文心一言,提供了強大的技術支持。
讓我們暫時排除“支持國貨”的民族情緒,帶著理性和常識去探究一下,文心大模型的水平到底怎么樣?文心一言等類ChatGPT產品,究竟能為用戶和市場提供什么樣的價值?
拆解ChatGPT:一匹以大模型為骨架的“特洛伊木馬”
ChatGPT的出現,代表了大語言模型的突破,將對話式AI與NLP技術帶到了一個全新的高度,展現了AI的更多可能性和商用潛力。
上個世紀,信息哲學領軍人盧西亞諾?弗洛里迪就說過,“人工智能就像特洛伊木馬, 把一種更具包容性的計算/信息的范式引入哲學的城堡?!倍鳦hatGPT就是一匹看起來極其神奇的特洛伊木馬,令人類嘖嘖稱奇,擔心自己不再是城堡中唯一的萬物之靈。
當然,歸根結底,AI也好,ChatGPT也好,都是一匹人造的木馬,由人類創(chuàng)造,也為人類所驅使。
ChatGPT這匹“特洛伊木馬”的出現,更大的意義在于,它代表了一個標志——通過大模型這種方式,人工智能的知識瓶頸,是可以被打破的。
我們知道,算力、算法、數據,這AI三要素在當下基本得到了滿足,帶來了AI技術應用化的突破。但許多自然語言處理NLP任務,如機器翻譯、情感分析、問答系統(tǒng)、語言生成等,需要模型具有一定的語言知識和理解能力。張鈸院士曾提出:AI最重要的能力是知識。但知識,始終是AI的一個瓶頸。
ChatGPT的出現,標志著知識瓶頸是可以被打破的。通過大模型,學習海量的語料庫,可以獲取豐富的語言知識,對語言中的復雜結構、語義和邏輯,進行識別和處理。
大家感覺ChatGPT特別神奇,好像真的有自主思維一樣,正是源自知識能力融入大模型后,在泛化性、通用性、遷移性上的強大表現。
它是一個標志,也只是一個標志。
因為ChatGPT也并沒有徹底解決知識瓶頸,還存在一些局限性。比如由于中文語料不夠多,獲取的深度中文知識少,所以對中文的理解和問答效果都不如英文,經常出現常識性錯誤。
那么,問題來了。OpenAI又不向中國大陸開放服務,對于優(yōu)化ChatGPT的中文能力顯然不會投入太多資源。同時,AI又廣泛應用在安防、識別、智慧城市等重要領域,安全性和可靠性也決定了,發(fā)展國產化ChatGPT,成為了必然的選擇。
好消息是,機會總是留給有準備的人,中國AI過去多年間不斷積累升級,并沒有在大模型時代令我們失望。
自2018年預訓練大模型成為風潮后,中國AI領域快速跟進,已經積累了大模型所需要的全產業(yè)鏈要素,包括算力基礎設施、數據集、算子庫、深度學習開發(fā)框架、AI開發(fā)工具,以及多個領域的大模型產品。
人家牽出了盤亮條順的“特洛伊木馬”,中國科技企業(yè)將自家拉磨的驢包裝成汗血寶馬,顯然就不太合適了。國產大模型必須足夠優(yōu)秀,才能讓國人和企業(yè)放心支持。
IDC此時發(fā)布《2022中國大模型發(fā)展白皮書—— 元能力引擎筑基智能底座》,首提大模型評估框架,是一個大模型比武的好契機,讓我們可以綜合評估國產大模型的實力。
從文心的三輪驅動,稱稱國產大模型的重量
投資市場有句話,“在短期,市場是個投票器;在長期,市場是個稱重器?!庇龅蕉唐陲L口“豬也能在天上飛”,但長期來看,任何公司和概念都要靠扎扎實實的核心能力,長出翅膀,才能穿越風雨,持續(xù)騰飛。
放到ChatGPT概念上也一樣,各種國產類ChatGPT產品出現,到底是騾子是馬,得拉出來遛遛。
此次《白皮書》中,IDC搭建了大模型評估框架V1.0,選取國內主流廠商(N=9),從模型能力、工具平臺能力、開放性、應用廣度、應用深度、應用生態(tài)共6大維度的11項指標,進行打分評估。結果顯示,百度文心大模型的產品能力、生態(tài)能力達到L4水平,應用能力達到L3水平,處于第一梯隊。IDC中國副總裁兼首席分析師武連峰認為,百度文心大模型是其打造文心一言的堅實基礎。
現實進展來看,百度率先打開局面,即將推出類ChatGPT的生成式對話產品文心一言。
《白皮書》中提到,“模型+工具平臺+生態(tài)” 三級協同,是OpenAI在開發(fā)GPT大模型過程中的核心思路,經過長期的積累,也更容易形成競爭壁壘。
我們不妨從這三個角度出發(fā),去稱稱百度文心大模型的重量,究竟與OpenAI有何差距?
第一,大模型的產品能力。
模型層,是大模型的核心引擎,也是相關產品的主要優(yōu)勢和競爭賽點。
ChatGPT的成功,得益于大規(guī)模的數據集,較強的模型開發(fā)和算法調優(yōu)能力,在NLP領域的長期積累,以及來自微軟的計算資源支撐等??偟膩碚f,打造一個像ChatGPT這樣的大模型產品,需要對算法和技術有深入的理解,以及數據、算力等支持。
這方面,我們可以看到,百度要打造類ChatGPT產品,不是從零開始,而是有著長期積累和綜合優(yōu)勢。
百度自2019年開始深入研發(fā)預訓練模型,發(fā)布了知識增強的產業(yè)級大模型文心ERNIE1.0。在深度學習的基礎上融入知識,將海量的知識積淀和自研的多源異構知識圖譜,投入到文心大模型的預訓練中,在知識的指導下,文心大模型的效率更高、效果更好,可解釋性更強。用于訓練的數據量級也有顯著優(yōu)勢,模型參數達到萬億級別。2020年開始將文心大模型應用到搜索業(yè)務,可以說,百度在破解AI知識瓶頸這一問題上的探索,并不比OpenAI落后,更比國內很多科技企業(yè)要早得多。
目前,困擾國產ChatGPT的算力資源和成本問題,百度也在開發(fā)文心大模型的過程當中,與國內外硬件伙伴合作尋找解決方案,百度飛槳深度學習平臺向下適配各種硬件,以支持文心大模型的開發(fā)、高性能訓練、模型壓縮、服務部署的各種能力。
可以說,百度在大模型方面有著貫通全產業(yè)鏈的積累,能夠滿足類ChatGPT產品的開發(fā)需求,具有較強的先發(fā)優(yōu)勢。
第二,應用工具平臺。
大模型的落地應用,是海外AI研究機構很少提及,卻是產業(yè)智能化不可規(guī)避的問題。真實的產業(yè)應用場景中,企業(yè)和開發(fā)者接入大模型的方式多種多樣,有的需要產品級的API接口,有的希望能夠開放深度定制,有的則對成本非常敏感。
所以,要讓大模型廣泛應用,就必須平臺提供完善的成體系的全棧工具鏈,包括深度學習框架、基礎模型庫、數據集、端到端開發(fā)套件、API接口等,才能讓更多行業(yè)人員或開發(fā)者,能夠低門檻甚至零門檻的將大模型應用于自己的業(yè)務中。
目前,ChatGPT還是沒有開源的,想要基于ChatGPT打造集成化的行業(yè)應用產品,還不現實。這一點上,和飛槳深度學習平臺生態(tài)共享的文心大模型,可以借助飛槳龐大且豐富的工具平臺,以及AI開發(fā)社區(qū),加速大模型的產業(yè)化應用,更快建立起商業(yè)閉環(huán)。
第三,行業(yè)生態(tài)。
正如OpenAI的首席執(zhí)行官山姆·奧特曼所說,ChatGPT的技術不應該被保留在科技行業(yè)的狹小范圍內,而應該擁抱真實世界。
但是,大模型與千行百業(yè)的融合,充滿了未知的領域,要一個行業(yè)、一個行業(yè)去探索,與開發(fā)者、行業(yè)用戶、上下游產業(yè)共創(chuàng),這是一個苦活重活,確實大模型走向產業(yè)、擁抱真實世界的更優(yōu)解。
生態(tài)建設上,百度文心大模型與飛槳深度學習平臺生態(tài)共享,前期已經做了大量的工作?!栋灼凤@示,百度飛槳生態(tài)已經凝聚了535萬開發(fā)者、服務20萬家企事業(yè)單位,與12家硬件伙伴聯合發(fā)布飛槳生態(tài)發(fā)行版、推動深度學習平臺與更多硬件適配,還與國內科研院所、實驗室以及高校強強聯手,一同攻克AI技術難關,目前賦能了389所高校,服務747名教師,學分課培養(yǎng)10萬余名AI學子 。
在此基礎上,文心大模型與眾多頭部企業(yè)合作,融合了通用數據和行業(yè)特有知識,推出行業(yè)大模型系列,比如能源行業(yè)NLP大模型國網-百度·文心、金融行業(yè)NLP大模型浦發(fā)-百度·文心等,顯著提升了大模型在行業(yè)任務上的應用效果,也在重點行業(yè)形成了大模型落地應用的參考路徑,給全球大模型走向商業(yè)化,起到一定的示范作用。
“模型+工具平臺+生態(tài)”,三輪驅動下,一點點將大模型推向廣闊的產業(yè)天地。
化解中國AI焦慮的另一種思路:大模型的產業(yè)突圍
ChatGPT火爆之后,大家可能聽到了類似的聲音,認為中國科技企業(yè)不像OpenAI這樣長期投入,中國AI缺乏元創(chuàng)新、底層創(chuàng)新,中國在ChatGPT上已經落后了追趕要花很多錢……
其實梳理百度文心大模型的進化史會發(fā)現,這些都是一種科技自立焦慮心理的“暈輪效應”,即因為某個細分領域、垂直領域的短板,而放大到對中國AI整體能力的質疑和虛無論,這顯然是不客觀的。至少在大模型這個領域,中國技術自信是很真實的。
ChatGPT熱潮也體現出,大模型成為發(fā)展AI技術的必然選擇。這也為化解中國AI焦慮,提供了另一種思路,那就是大模型的產業(yè)突圍。
IDC認為,大模型將會助推數字經濟,為智能化升級帶來新范式。對行業(yè)用戶而言,大模型已表現出巨大的潛力,企業(yè)應該盡早關注,在業(yè)務中布局。
但ChatGPT雖好,這類新技術在與行業(yè)融合時,實際中還會面對一系列適配問題,比如:
1.原始模型太大,難以在產線、礦山、園區(qū)等終端側部署。
2.需要與行業(yè)專精知識相結合,開發(fā)定制程度更高、更安全可靠的垂直應用。
3.服務商自行開發(fā)類ChatGPT成本太高,難度很大,商業(yè)效益難保障。
所以,要打通ChatGPT等新AI技術向產業(yè)釋放的一系列關節(jié),真是“尋龍分金看纏山,一重山是一重關”,有著千山萬水要過。這時候,圍繞文心大模型這樣的產業(yè)級平臺,去撬動新技術的可能,或許才是真正的機遇所在。
在這個過程中,百度這樣的AI頭部玩家,接下來還需要做好三件事:
1.夯實AI基礎設施。通過文心大模型與飛槳深度學習平臺,夯實AI基礎設施底座,加速類ChatGPT產品的開發(fā),持續(xù)技術創(chuàng)新的同時,提供基礎模型、豐富工具棧、API接口等必要資源,成為各行業(yè)都可以低門檻引入AI的創(chuàng)新底座。
2.進一步加強生態(tài)開放。有活力的創(chuàng)新開發(fā)環(huán)境,才有中國AI應用的百花齊放,頭部企業(yè)有責任為生態(tài)賦能,不斷向開發(fā)者釋放資源和支持。近日來,愛奇藝、集度汽車(通過Apollo)、小度、宇信科技、漢得信息、金蝶軟件、寶寶巴士、智聯招聘、太平洋汽車網等知名企業(yè),都已經加入了百度文心一言生態(tài)圈,獲得該AI技術的“加持”。據說,文心一言還將會推出生態(tài)伙伴計劃,全面支持伙伴,共同發(fā)展商業(yè)市場。
3.探索無人區(qū),不斷推動新技術與行業(yè)問題的結合。盡管每次AI領域的技術突破都會引發(fā)很大的輿論關注,但AI在行業(yè)當中的滲透率只有10%左右,還有大量空白地帶是可以與AI相結合的,需要頭部企業(yè)去引導和探索,形成示范案例。
總之,中美AI或許在頂級科研、底層技術上有差距,但中國科技企業(yè)、從業(yè)者、開發(fā)者以及無數行業(yè)和企業(yè),從來沒有“躺平”過,一直在追逐著新技術的腳步。這些要素疊加在一起,是文心大模型的重量,也是中國AI的重量。
審核編輯黃宇
-
IDC
+關注
關注
4文章
391瀏覽量
37243 -
AI
+關注
關注
87文章
31000瀏覽量
269336 -
人工智能
+關注
關注
1792文章
47354瀏覽量
238833 -
nlp
+關注
關注
1文章
489瀏覽量
22052 -
OpenAI
+關注
關注
9文章
1096瀏覽量
6561 -
ChatGPT
+關注
關注
29文章
1563瀏覽量
7776
發(fā)布評論請先 登錄
相關推薦
評論