從去年ChatGPT重磅發布到今年的“百模大戰”,大模型賽道可謂熱鬧非凡。
今年8月31日,國內首批8家大模型公司通過《生成式人工智能服務管理暫行辦法》備案,獲批面向公眾開放服務,這些大模型包括上海人工智能實驗室的書生通用大模型、商湯科技“商量”,以及百度“文心一言”等。
ChatGPT從源頭來看是自然語言理解、自然語言處理兩個技術,之所以引起關注,在于它是一個大模型,對應大數據、強計算、好算法。有人說,原理是這么個原理,就像踢足球都是盤帶、射門,但是做到梅西那么好也不容易。
今天,就讓我們來看看,趕上大模型這個風口的“張江版大模型”都有哪些?各自的優勢又有何不同?
達觀數據:“曹植”大語言模型
3月,基于多年文本智能技術積累和垂直領域場景業務經驗,達觀數據研發團隊積極探索大語言模型(LLM)的實踐,研發國產版GPT模型——“曹植”大語言模型。
7月,在 2023 世界人工智能大會上,達觀數據正式發布了名為“曹植”的大模型。這是國內首個垂直行業專用的自主可控的國產GPT大語言模型,可準確完成多類型、復雜結構的長文本寫作,自動起草多種類型的文檔,未來將實現多模態內容生成,如長文檔中的表格、圖表、圖片等。
作為垂直、專用、自主可控的國產版ChatGPT模型,“曹植”是如何誕生的?
達觀數據成立于2015年,一直在NLP(自然語言處理)領域深耕,積累了大量金融、政務、制造等垂直領域的大量數據。2017年,谷歌在發表的論文中提出NLP關于“理解”和“生成”的兩個技術路線?;谶_觀數據當時的優勢資源和未來發展,他們從一開始就選擇了“理解”這條技術路線。這一年,運用知識圖譜、文字識別等技術開發的IDP智能文檔審閱系統進入市場。
隨著人工智能的不斷發展,機器智能處理長文本的需求日益緊迫。隨后,達觀數據便投入到大語言模型的開發工作中,而這正是如今的“曹植”大模型誕生的起點。
“長文本”是“曹植”大模型的目標任務。區別于一問一答的簡單短文本生成,“曹植”大模型可準確完成多類型、復雜結構的長文本寫作。
以金融信貸報告為例,銀行的金融信貸報告經常以40頁起步,60多頁的報告也是家常便飯,靠員工“埋頭苦干”效率太低,而大模型就會自動起草多種類型的文檔,同時具有自動排版、智能糾錯、文本潤色、自動生成摘要等特色功能;支持中文、英文、法語、德語、日語、韓語等數十種語言的寫作,輔助人工大幅提高辦公效率;在長文檔翻譯方面,對原文的標題、段落等內容實現1:1版式還原,提供實時的翻譯體驗,廣泛應用于多語言文檔密集處理的場景。“未來員工需要做的就是寫提示詞、寫大綱、核實數字,剩下的都能交給大模型來完成?!边_觀數據創始人兼CEO陳運文表示。
這也是國內大規模語言模型中首批可落地的產業應用級模型,目前除了在金融領域應用之外,“曹植”還掌握了撰寫白皮書、技術報告以及品牌故事的智能協作本領。
與此同時,為促使“曹植”大模型在各垂直領域中可以更低成本高效能地落地與應用,達觀數據正式推出私有化大模型一體機。私有化“曹植”大模型一體機,內置達觀數據全棧自主研發的“曹植”大模型,支持三方開源模型庫,可在企業內部一鍵部署大模型應用,能同時為多種垂直大模型業務提供文檔智能審閱、智能知識管理、知識搜索與問答、文檔智能寫作、智能推薦等智能化服務,支持和具備安全便捷的AI訓練、推理、長文檔寫作、機器翻譯、語義分析審核、知識問答、text-to-sql等場景功能應用。“曹植 ”的強大功能讓它甫一出世就大獲好評。
云從科技:從容大模型
5月18日,由云從科技研發的從容大模型正式亮相,展現了在智能問答、城市管理、智能制造、智慧金融、游戲文創等領域的超級本領。云從科技董事長兼總經理周曦指出,從容大模型將以問答、伴隨、托管三種遞進的形式顛覆傳統交互方式。其中,“問答”即類似于當前的GPT;“伴隨”指AI會像一個朋友伴隨你執行很多事情;“托管”則意味著一件事主要交給AI來做,類似在網游中的‘掛機訓練’。能走到托管這一步,人就可以‘解放’出來,做更多有意義、有興趣的事?!薄?/p>
從算法、算力、數據這三個大模型重要維度看,云從科技的先天優勢幫助其建立了技術門檻。
算法上,云從科技從2020年開始就已經陸續在NLP(自然語言處理)、OCR(光學字符識別)、機器視覺、語音等多個領域開展預訓練大模型的實踐,不僅進一步提升了公司各項核心算法的性能效果,同時也大幅提升了公司的算法生產效率,已經在城市治理、金融、智能制造等行業應用中體現價值。
算力上,云從科技擁有強大的算力資源儲備,預計未來將擴展到上萬張卡的規模,并計劃聯合各行頭部企業打造不同的行業大模型,推動行業數智化建設。
數據上,云從科技有行業專業數據的先發優勢。行業大模型需要的是專業領域的知識,如果不是一直耕耘的行業資深選手,基本很難有相關的數據積累。云從科技恰恰擁有這方面的稀缺優勢,其多年來在多個領域實踐“預訓練大模型+下游任務遷移”的技術范式,產出多個百億參數以內規模的模型。歷經長期與各垂直領域企業的緊密合作,云從通過大量場景數據訓練不斷優化算法平臺,培育出針對不同行業特有的數據分析和應用能力。
8月21日,云從發布從容大模型1.5版本,該版本包含十億級、百億級、千億級多種模型規格,實測性能在全球大模型綜合性考試評測(C-Eval)中位居百億級第1,總榜單第4。為解決大模型落地難題,從容1.5版本的重點是參數量為130億的行業大模型,該模型從千億大模型中蒸餾產生,在52類測試指標中有44類超過ChatGPT、29類超過GPT-4,這距離從容大模型正式發布僅過去3個月,可謂是進步神速。
百度:文心一言
8月31日,百度生成式人工智能產品“文心一言”正式向公眾開放服務,這也意味著該應用已通過《生成式人工智能服務管理暫行辦法》備案,成為國內首個合規上線的生成式人工智能產品。
據悉,百度還將開放一批經過全新重構的AI原生應用,讓用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。
文心一言在今年3月16日上線測試,隨即引發廣泛關注,截至5月,有超過300家生態伙伴參與內測,在400多個企業內部場景取得測試成效。8月31日開放當天,百度的一系列AI原生應用也“閃電”上線,并取得不錯的戰績:
百度文心一言首日回答用戶3342萬問題,“文心一言App”迅速登上Apple store免費應用排行榜榜首,首日用戶量破百萬;文心一言開放首日,百度搜索就有超3億次需求由生成式智能引擎解決,百度搜索“AI伙伴”當日訪問用戶數突破400萬;百度文庫“AI做PPT”等文檔創作功能超200萬人次體驗。這距離5月百度萬象大會上“用AI原生思維重構百度移動生態”的表態,才過去不過百余天,大模型時代的技術進展可以說是日新月異。
實際上,從多年前的“All in AI”開始,百度就開始了在AI領域的全棧布局。近十年,百度累計研發投入超1400億元,2022年百度核心研發費用214.16億元,占百度核心收入比例達到22.4%。壓強式研發投入讓百度實現厚積薄發,成為全球為數不多的、有著應用、模型、框架、芯片四層全棧布局的AI公司,實現端到端優化,并在各個層面都有行業領先的關鍵自研技術。
文心一言的基礎模型文心大模型早在2019年就在國內率先發布,近期升級的文心大模型3.5也持續在十余個國內外權威測評中位居首位。百度透露,文心大模型4.0預計將在年底推出。
編輯:黃飛
-
人工智能
+關注
關注
1792文章
47409瀏覽量
238924 -
ChatGPT
+關注
關注
29文章
1564瀏覽量
7807 -
文心一言
+關注
關注
0文章
124瀏覽量
1294 -
大模型
+關注
關注
2文章
2482瀏覽量
2850
原文標題:都有誰站在了大模型的風口上?
文章出處:【微信號:zjpark,微信公眾號:你好張江】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論