大模型只是中間狀態(tài),開源的大模型技術生態(tài)才是未來。
一代人的時間里總會有幾次這樣的時刻:一種產品的出現將一項技術從昏暗的工程系地下室、臭氣熏天的書呆子們的臥室和業(yè)余愛好者們孤獨的洞穴中彈射出來,變成了連你的祖母都知道如何使用的東西。
《財富》雜志的這段話,捕捉了1994年網景瀏覽器和2007年iPhone的歷史意義,也描述了今天ChatGPT為人工智能領域帶來的變化。
它們都是一個生態(tài)體系的開端。ChatGPT的背后是AI大模型,但智能時代的未來不會僅僅是大模型本身,而將是大模型生態(tài)體系。
北京智源人工智能研究院院長黃鐵軍認為,過去的「煉」大模型并非一種正常的狀態(tài),AI一定是通過作為公共產品的智力而非個別的大模型來提供服務的。在未來,大模型會有很多,但大模型生態(tài)體系不會超過3個。
而要建立提供數據、訓練、治理等全套服務的大模型生態(tài)體系,并非哪一家企業(yè)能為之,需要更多機構一起合作。在黃鐵軍看來,智能時代需要真開源,不是某一家企業(yè)控制下的開源,而是像Linux和RISC-V 那樣的開源。
如果不想在這一波AI大模型熱潮中被卡脖子,我們只有開源一條路。
為了加快這一步伐,智源研究院在2月28日發(fā)布了FlagOpen(飛智)大模型技術開源體系,大模型領域的「Linux」正在誕生。
1
ChatGPT 水面之下:回歸技術理性
愛迪生曾在曼哈頓的一個街區(qū)鋪設電網,點亮了那個街區(qū),OpenAI推出ChatGPT也具有同樣的局部驗證性作用。在大呼驚奇過后,國內各家紛紛趕制中國版ChatGPT,相當于各自建立一個小型電網、為一部分用戶服務。
但這距離大模型作為一種產品服務進入到千家萬戶還有很長一段距離。
我們亟需從ChatGPT的商業(yè)化狂潮中回歸到技術理性。要看到的是,ChatGPT作為一個產品只是水面上的冰山一角,水面之下是大模型的底層技術體系。
一方面,商業(yè)模式尚未清晰,大模型的戰(zhàn)略“占位”意圖更加明顯,僅少數玩家具備技術基礎的相對充分累積。而總資源有限,算力稀缺,資本驅動的模式可能會導致重復性浪費,影響潛在的技術進步可能性。
另一方面,如今的大模型雖然已經足夠大,但將來要走什么樣的技術路線還是一個開放的問題,有許多問題尚待解決,比如是否會有新的架構和算法、如何解釋大模型的涌現能力、怎么提高大模型的高級認知能力等等。
不僅僅是科學問題,在大模型的產業(yè)化過程中,如何用更少的計算成本、智能水平更高的大模型去提供AI服務,也需要長期考慮。就像有了發(fā)電廠之后,仍要繼續(xù)鉆研提高發(fā)電效率的技術,研究家庭用電接口的方式等等。
所以,中國是否也要做一個ChatGPT出來?基于當前匆匆回應,也許不如進一步面向未來看問題—— 如何驅動整個大模型產業(yè)及生態(tài)產生越來越多令人驚喜的AI現象?
「大模型只是冰山一角,我們要在大模型磅礴的大生態(tài)中找準自己的歷史性位置。」黃鐵軍認為,大模型是一種中間狀態(tài),它不是最終的服務形態(tài),而是現階段用特定技術、特定算法訓練出來的結果。未來的形態(tài)應當是以大模型為技術手段、向所有人提供24×7服務的智能運營系統(tǒng)。
如同今天的通信網絡運營商僅有幾家巨頭,將來大模型的服務運營體系也會屈指可數——但龐大的產業(yè)群帶來的商業(yè)機遇會更多。
從技術出發(fā)建立生態(tài),需要一個協(xié)作的方式。研究人員提出不同的大模型技術創(chuàng)新,并匯聚到一個開源開放的技術體系下,去展示能力、評估和比較。而且,不是止步于造一個大模型出來,而是持續(xù)地進行技術迭代。
智源聯(lián)合多家產學研單位建立大模型技術開源體系FlagOpen,正是面向這樣一個長遠的命題:在智能時代以大模型為代表的產業(yè)體系中,我們應該做些什么?
而無論是從對前沿技術的重視程度還是組織的中立性來看,智源作為非營利研究機構做大模型開源這件事是再合適不過。
2從大模型引領者到開源先鋒
「某種意義上,我們是后退一步,而不是去趕一個熱點。」黃鐵軍說道。
在各路勢力一個接一個宣稱入局ChatGPT的熱潮中,智源推出國內首個大模型開源體系,也更加希望保持冷靜的理性思考,探索還能為人工智能前沿研發(fā)底層環(huán)境做些什么。
作為非營利機構,智源一直聚焦打造有重大技術挑戰(zhàn)、需要緊密工程協(xié)作、長期攻關的重大系統(tǒng)級成果。相較于近期的商業(yè)化熱潮,智源顯然更關心技術本身,與大模型領域的長期發(fā)展。
大模型在中國起飛之初,智源是當之無愧的引領者。過去幾年,已經積累了冰山之下大模型的技術棧。這是智源做大模型開源這件事的底氣。
坐落在「宇宙中心」五道口,智源匯聚了來自北大、清華、人大、中科院等學術高地的AI人才。作為中立非營利創(chuàng)新科研機構,相比高校與企業(yè),一方面可以更好地匯集企業(yè)、學界資源集中力量做大事;另一方面非商業(yè)不逐利,愿意尊重科研創(chuàng)新規(guī)律,讓科研人員在自由的環(huán)境中充分進行創(chuàng)造力探索。
對有價值問題的聚焦,使得其成為上一波大模型熱潮中的頭雁。
2020年OpenAI發(fā)布GPT-3,智源立即喊出“大模型時代即將到來”的AI未來圖景,堅定奔走推動大模型研究路線,并迅速組織了“悟道”大模型攻關團隊,訓練出了中文預訓練語言模型CPM。“悟道”團隊的成員,目前已成為國內大模型研究的中堅力量。
之后,智源繼續(xù)加大對大模型的投入,在2021年3月發(fā)布了大模型項目“悟道1.0”,包含中文語言、圖文多模態(tài)、認知和蛋白質序列預測四個方向的模型。3個月后,智源又推出創(chuàng)造當時“全球最大”紀錄的“悟道2.0”大模型項目。
如今,大模型無限堆參數的熱潮已經冷卻,如何在大模型的封閉生態(tài)形成前,推動建立大模型開源體系,擁抱開源開放,鼓勵人工智能的底層技術創(chuàng)新集體熱情?
黃鐵軍斷言:「不可能、也不應該有任何一家企業(yè)來完全封閉地主導大模型這么一個重要的方向。」
大模型的重要性在于,它通過一個通用模型來完成多場景任務,作為底座能夠誕生無數AI應用,因而是AI時代的基礎設施。而從技術層面來講,當前的大模型仍具有諸多難以透徹理解的黑箱特性,因此更加需要以開源開放的方式讓大模型更安全地提供服務。
而開源本身也已經成為必然趨勢。以操作系統(tǒng)為例,為何大家都愿意用開源的操作系統(tǒng)?對于商業(yè)公司而言,使用開源產品帶來的并非僅僅是成本的降低,更重要的是風險的降低和質量的提高。由一家企業(yè)維護的閉源項目一旦終止,用戶就要遷移全部技術棧,但開源不會出現這種風險,而且技術問題在開源的情況下也能更快得到解決。
對于研發(fā)成本極大的大模型而言,開源更是能夠集約資源、匯聚人類智慧,避免重復造輪子。智源已經在大模型開源這條路上走了一段距離。「悟道」系列模型已經在持續(xù)開源,包括「悟道2.0」通用語言大模型GLM、「悟道3.0」視覺預訓練大模型EVA、視覺通用多任務模型Painter、文生圖大模型AltDiffusion等等。
過去,智源匯集承載產學研各界力量推動大模型研究事業(yè);現在,智源正在推進更艱巨的大模型開源開放生態(tài)建設——推出了FlagOpen(飛智)大模型技術開源體系。
3FlagOpen:大模型時代的「Linux」
大模型的技術創(chuàng)新涉及算法、模型、數據、工具、評測等各個層面,因此FlagOpen開源體系也全面涵蓋了這些模塊,能夠讓開發(fā)者和企業(yè)更快、更低門檻地上手大模型的研發(fā)。
智源之所以選擇在當下發(fā)布FlagOpen開源體系,其中一個考慮也是因為看到在這一波ChatGPT熱潮中,許多以往沒有大模型研發(fā)經驗的初創(chuàng)團隊,也開始嘗試自研大模型,對他們而言,FlagOpen來得非常及時。
FlagOpen開源體系中的重頭戲,是一個大模型算法、模型及工具一站式開源項目FlagAI。該項目已經涵蓋了各領域的一些明星大模型,如語言大模型OPT、T5,視覺大模型ViT、Swin Transformer,多模態(tài)大模型CLIP等,以及智源自家的大模型。
這些大模型在實際調用和復現過程中的技術門檻很高,為此FlagAI集成了很多主流大模型算法技術,以及多種大模型并行處理和訓練加速技術,并且支持微調,開箱即用的方式對開發(fā)者非常友好。
大模型生態(tài)的另一要素是AI硬件評測,AI軟硬件技術棧異構程度高、兼容性差,應用場景復雜多變,都給評測帶來了很多挑戰(zhàn)。
FlagPerf搭建的AI硬件評測體系,提供了可直接下載且適配各家芯片的整套評測軟件,能大大降低用戶企業(yè)和芯片企業(yè)的人力成本。
FlagPerf的推出,也體現了智源開源開放的決心。一方面,不同于目前知名的AI基準評測MLperf,FlagPerf不搞排名榜單,且及時跟進最新的大模型基準;另一方面,其他大廠企業(yè)做的評測本身有其商業(yè)訴求,不夠開放,而智源作為中立機構,建立評測體系的目的是為了讓大模型產業(yè)更加成熟,所以評測涵蓋各種芯片,而非僅僅某一款,并且支持多種深度學習框架,對用戶企業(yè)的選擇不加限制。
也正因如此,智源第一時間就把多個廠商和團隊拉了進來,包括天數智芯、百度PaddlePaddle、昆侖芯科技、中國移動等,一同推進AI硬件評測建設。林詠華談道,「我們首先希望它先變成一個事實的基準。所謂事實基準是大家評測硬件的時候都愛用它,至于未來要不要發(fā)展成產業(yè)的標準,我們順其自然。」
科學、公開的大模型評測基準及工具,同樣是大模型取得技術進步的重要條件。尤其是當下AIGC的應用越發(fā)火熱,行業(yè)亟需對模型在AI生成任務上的評估。基礎大模型評測開源項目FlagEval為此提供了覆蓋多種模態(tài)和測評維度的評測工具,其中就包括多模態(tài)領域的CLIP系列模型。
在數據方面,智源構建了支撐大模型訓練的WuDaoCorpora語料庫,包含文本、對話、圖文對、視頻文本對四類數據。FlagData還集成了包含清洗、標注、壓縮、統(tǒng)計分析等功能在內的多個數據處理工具與算法。
在AI走向工程化的趨勢下,大型數據集的構建正在成為中國的巨大機會,這個過程需要更大、更開放的協(xié)作。智源此次發(fā)布的OpenLabel是中文世界首個開放數據標注平臺,它轉動了數據飛輪,正持續(xù)為大模型提供訓數據源。
除了以上四大模塊,FlagOpen開源體系中還涵蓋了文生圖開源項目集合FlagStudio,以及AI應用微服務框架開源項目FlagBoot,為大模型的研發(fā)和應用開放了全方位的能力。
FlagOpen專門圍繞大模型而搭建的開源體系,這也是它與其它開源平臺的區(qū)別所在。國外有HuggingFace、國內有魔搭社區(qū)(Model Scope),而關于FlagOpen的定位,林詠華解釋:
「我們不只是想構建一個很多人參與的繁華社區(qū),更是希望推動大模型技術的發(fā)展。」
從產品的角度講,FlagOpen為用戶在研發(fā)大模型的需求上提供了一個更合適的選擇。針對“開源的不如閉源”說法,黃鐵軍認為,開源開放是一個大趨勢,開源形式的產品將會占據比較大的份額,而在一個特定方向上某個閉源產品做得更好,這一點并不奇怪。
「這不等于誰打敗誰了,而是大家在滿足自己需求時所做的不同選擇。」就像Linux成功在市場競爭中占據主要份額,但它不是把所有操作系統(tǒng)都打敗了。
FlagOpen剛剛邁出了開源第一步。智源開源的策略并非等一切都足夠完備再開源,而是把種子點做了之后就開源,這樣可以更快地推動企業(yè)和團隊在非商業(yè)合作協(xié)議下互相合作。比如,AI 硬件評測開源項目是先從最難也最短缺的訓練端做起,這一塊做好了推理端便不是難點。
類比13年前云計算開源平臺OpenStack的起家,Rackspace和NASA合伙做了Nova并將其作為種子開源,同時成立了OpenStack基金會,讓更多企業(yè)一起參與貢獻,這才有了國內今天所有的云計算廠商。
這也是智源做大模型開源的初心。而對于FlagOpen的未來,智源的期待是將其打造成大模型時代的「Linux」。
「什么叫一個開源項目成功了?就是大多數做產品和服務的企業(yè)都用這樣的開源體系,就像Linux和Risc-V的開源開放帶來了廣泛采用,希望FlagOpen在智能時代也能發(fā)揮類似的作用。」
審核編輯 :李倩
-
人工智能
+關注
關注
1792文章
47354瀏覽量
238811 -
模型
+關注
關注
1文章
3254瀏覽量
48894 -
ChatGPT
+關注
關注
29文章
1563瀏覽量
7775 -
大模型
+關注
關注
2文章
2476瀏覽量
2814
原文標題:做大模型時代的「Linux」, ChatGPT 僅是開端
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論