8月31日,第一批國產大模型通過了“生成式人工智能備案”,可以開放公眾服務。
一石激起千層浪,對AIGC強烈好奇,為國產應用瘋狂打call,文心一言對話刷屏朋友圈,普通人和科技圈都嗨翻了。
不到24小時,文心一言APP就飆升蘋果商店免費榜首,成為首個登頂的中文AI原生應用。
這兩天的狂歡也說明了:生成式AI的黃金時代,正在迎來真正的破曉。
很多人可能會說,我不懂什么大模型,也不會開發應用程序,這波生成式AI的熱度跟我沒關系。
中國有句古話“女怕嫁錯郎,男怕入錯行”,今天,男女都怕入錯行,都希望掌握一場技術革命中最有價值的核心資源,獲得發展。
就像汽車司機不用精通動力學和熱力學,卻受益于工業革命和蒸汽機。KOL和電商主播大都不會寫程序,卻受益于信息時代和互聯網。同樣,AI時代的大部分受益者,也并非都來自核心技術領域,而是能夠運用好新技術、新資源的人。
在文心一言APP重新喚起大眾應用熱情的時候,本文希望冷靜剖析一下,普通人究竟有什么機會,如何搭上生成式AI這趟“時代順風車”。
人人都能適應AI,這可能嗎?
大眾對生成式AI的熱情,已經點燃。我們團隊的小伙伴們也都第一時間成了“自來水”,開始“調戲”文心一言。不過,和前幾個月不同的是,我們拷問AIGC的角度,也變了。
我們不想用幾個零散的的問題,來籠統地評價一個大模型的基本能力。
現在,已經有許多專業機構,通過規范的測量基準benchmark,對大模型進行更為全面、科學的考察,這些權威報告更值得讀者參考。比如IDC最新發布的《AI大模型技術能力評估報告,2023》顯示,文心大模型3.5拿下12項指標的7個滿分,得到“綜合評分第一,算法模型第一,行業覆蓋第一”三個絕對第一。
我們也不想用一些腦筋急轉彎、抖機靈式的問題,“為難”一下大模型,大家看完了樂子,還是不知道除了有限的展示案例之外,大模型究竟能怎么跟自己的日常和工作結合。
所以,我們決定從三種具體的任務場景出發,通過文心一言和ChatGPT的實際效果,來考察一下,生成式AI在不同應用場景下的能力究竟如何?每一個人都能在這些場景中,找到大模型與自身的關聯,或者帶來一些靈感。
第一個場景:容錯率高,人工參與度低。
娛樂、聊天、創意文案、設計草稿等等的生成,對大模型的幻覺和胡說八道,有一定的包容度,交給AI可以大大解放生產力。
比如在文旅領域,通過生成式AI來生成數字人導游,與觀眾進行交流互動,提供導覽服務,增強沉浸式旅游體驗,設計文創產品,是一個對ToC和ToB都非常有價值的應用場景。
我們考察的首要能力,就是理解。
如果大模型都無法準確理解用戶所說的話、傳達的情緒和意圖,那生成效果當然也不會理想。這方面,我們發現文心一言的理解能力,進步真的飛快。
坦率地說,三月的時候,我們曾讓文心一言和ChatGPT,判斷句子中表達的情緒時,文心一言的理解是不如ChatGPT的。而現在再測,最新版的文心一言,已經能很好地理解圖文中所隱含的情緒了。
第二個測試,是中國文化理解。
與中國用戶互動,生成式AI對中國文化和語言的理解,是基本要求。文心一言的中文能力,當然一如既往的穩,我們也對ChatGPT的回答比較寬松。這一次測試的關注點,不在于比拼ChatGPT的中文有多強,而在于進步有多大?
結果有點失望。當我們詢問:“柔情似水,佳期如夢”,這句話是什么意思?
文心一言三月份就給出了正確答案,這次的回答也很不錯。而ChatGPT無論是幾個月前還是現在,回答都是編造的。上一次說,這句話出白唐代詩人李清照的《如夢令》,最新的回答是出自唐代杜牧的《秋夕》。
這個問題也說明,ChatGPT的中文水平,不僅有大模型的幻覺問題,會胡說八道,而且對中文的優化和重視,并不太夠,才會進步緩慢。
當然,大家對大模型和生成式AI的期待,不僅是“閑聊”,更希望作為“生產力工具”,在辦公、金融、咨詢等多個領域提高工作效率。
我們測試的第二個場景:容錯率中等,需要一定的人工參與。
比如辦公領域,使用AIGC來生成PPT、寫文案、咨詢報告、讀論文等,AI可以作為“副駕”大大減少人的工作量,人只需要判斷、糾偏、決策就好。要求生成式 AI 擁有較強的語言邏輯、事實準確等基本能力,同時有豐富的插件來輔助提高效率。
試想一下,如果寫一個報告還有邏輯錯誤,輕則被罵,重則走人,大模型的邏輯能力,對打工人來說可太重要了。這方面,文心一言和ChatGPT的能力已經基本一致了。
比如詢問:香蕉的平方根是多少?二者都能夠準確地識別出邏輯陷阱。
再換個角度,跨語言的國際交流,是很多行業和企業日常工作中都會涉及到的。如果你是一個外貿辦事員,想要將產品上架到海外平臺,文心一言能行嗎?
我們測試了一下,文心一言APP一鍵翻譯四國語言,多語言類任務的工作效率會大幅提高,成本也會下降。
當然了,這些都是短語。對于打工人來說,處理商業報告、論文、撰寫長文章,才是特別花費時間精力的地方。
百度智能工作平臺如流,就基于文心一言的能力發布了「超級助手」,通過各類插件完成指令任務,包括查詢日程、創建會議、設置待辦、申請休假等。
插件的好處,是不需要很高的學習門檻和成本,就能輕松調用AIGC相關能力,輕松搞定。
而由于OpenAI的訪問限制,我們目前還沒能上手體驗ChatGPT的插件能力。這也說明,ChatGPT的可及性和便捷性,是遠不如文心一言的,給很多企業和個人使用AIGC設置了障礙,增加了額外的成本。
第三個場景,則是低容錯率、人工參與度高的嚴肅領域。
比如金融投資、科學任務、醫療診療、自動駕駛等,這些領域應用AIGC進行分析和預測,對于內容的準確性、可靠性、專業性、嚴謹性,要求很高。要求大模型擁有極高的安全可靠可信,因此目前AIGC落地的進展相對較慢。
生成式AI必須要掌握專業的知識點,給出詳細、準確、具體的解釋,才能在一些嚴肅專業場景中,協助完成各項任務。
那么,文心一言和ChatGPT有沒有潛力,進入這些嚴肅復雜的領域知識呢?
讓它們介紹一下量子力學,都答對了:
說了這么多,不難看出,基于國產大模型的生成式AI,基礎能力已經可以滿足“人人皆可適應AI”的需求了。
既可以陪人閑聊,也可以幫助人們方便快捷的做專業的工作,總有一款應用場景適合你。
目前,以文心一言為代表的國產大模型,綜合能力已經可以媲美ChatGPT,部分能力甚至超越GPT 4。這一點究竟是怎么做到的呢?
AIGC黃金時代,“四有青年”帶來的禮物
文心一言全面開放服務之后的火爆景象,說明大家都不希望錯過AI這趟時代列車。加速推進智能革命,真正讓每一個人和企業都用上AI,是今天擺在大模型面前的必答題,而誰是這次變革的擔當者呢?答案是敢為先鋒的“四有青年。”
如果我們冷靜客觀地看待這個熱度,會發現即將爆發的AI原生應用熱潮,也伴隨一系列挑戰,比如模型能力加速迭代、算力昂貴稀缺,國產大模型面臨的競爭是前所未有的激烈。這樣的背景下,國產大模型必須加速成長,保持技術先進性的同時,支撐產業落地。
這恰好是百度這些年一步步沉淀的能力,能給用戶和開發者掏出的“時代禮物”。
百度CTO王海峰分享過,“做文心一言不是頭腦發熱,是十余年的技術積累和產業實踐的水到渠成,我們在人工智能四層的技術架構上都有很深的積累,尤其是框架層和模型層聯合優化發揮了非常大的作用。”
應對接下來AIGC應用大爆發的機會和挑戰,文心一言已經做好了準備:
有技術,依托百度NLP強大算法基礎,自研深度學習平臺飛槳最先進的大模型訓練和推理部署技術,讓文心大模型得以快速迭代,為接下來更多AI原生應用的創新和涌現,打下了能力底座。
有知識,百度是最大的中文搜索引擎,并且花十余年時間積累了世界上最大的多源異構知識圖譜,為大模型提供數萬億數據和數千億知識,可以讓生成式AI與更多行業和場景任務,更加有針對性的結合。
有算力,兩代通用 AI芯片“昆侖”的量產及應用,為大模型落地提供強大算力支持。百度智能云千帆大模型平臺,提供了靈活高效的智能計算基礎設施。通過文心與飛槳聯合優化,提升模型的訓練吞吐速度,從而全面實現了以更小資源消耗達到大模型訓練目標。為基于文心一言的應用大規模創新,提供了算力保障。
有生態,助力各行業的生成式 AI 應用需求落地,文心一言的生態優勢非常明顯。以最新的插件機制為例,插件是開發者進入某項新技術的最短路徑,也是開發者急切期待的。在剛剛過去的WAVE SUMMIT上,王海峰表示,未來百度將與開發者共建插件生態,共享技術創新成果。
新一輪的黃金時代,普通人對AI的熱情和渴望,比以往任何時候都更加強烈。“四有青年”百度的選擇,是給予用戶更多禮物,讓更多人可以用文心一言來觸摸AI、解決問題、創造價值,搭上“時代順風車”。
中國科技的歷史機會,真的來了嗎?
作家格拉德威爾(Gradwell)在《異類》(Outliers)一書中,介紹了這樣一個事實:人類歷史上最富有的75人中,有1/5出生在1830—1840年的美國,其中包括大家熟知的鋼鐵大王卡內基和石油大王洛克菲勒。因為他們趕上了美國內戰后的工業革命浪潮。第二個高峰年代就是上世紀末,比爾蓋茨、喬布斯、拉里佩奇等人趕上了信息革命的大潮。
對于這個國家和人民來說,AI是數百年來一遇的機會。這一次,中國終于能夠把握住影響全人類的新科技,在人工智能領域與世界同步,甚至更快。
而文心一言等大模型的開放,會給這場智能革命,帶來前所未有的加速度:
首先,是能力自證。只有讓大家真用真體驗,都用上國產大模型,親身感受大語言模型的理解、生成、邏輯、記憶等核心能力,才能真正建立起產品信心和市場信賴度。這是國產大模型的當務之急,而文心一言作為第一批全面開放服務的國產大模型,也確實向大眾證明了中國AI技術的硬實力。
接下來,是技術領先。
大模型的能力提升,非常依賴于用戶反饋的強化學習,用戶越多、反饋越多,就學的越多、表現越好。此前沒備案通過之前,只能以內測、邀測等形式,向部分個人用戶、企業行業用戶有限開放。 “反饋飛輪”一定程度上影響了大模型的體驗迭代。
文心一言全面開放服務后,用戶猛增。從這個節點開始,國產大模型可以在龐大的用戶規模和反饋基礎上,加速迭代進化,未來有望趕超GPT-4等海外大模型,讓中國在人工智能領域保持領先位置。
更進一步,是產業繁榮。
備案上線后,面向大眾ToC場景的大模型更為積極地提供服務,用戶能直接檢驗AIGC的產品質量,愿意為之付費;AI受眾大幅增加,會吸引更多應用開發者來大顯身手,大量AI原生應用通過API調度資源……商業模式建立,促進國產大模型的良性發展,讓中國的AI產業化和產業AI化更加深入。
舉個例子,大模型的應用爆發,會帶動AI基礎設施建設,進而促進國產計算硬件、軟件生態的兼容、壯大,合力來解決算力卡脖子的問題。再比如,文心一言全面開放之后,開發者和行業企業會更加積極地擁抱大模型,探索生成式AI的落地可能性,帶動國內應用軟件和產業智能的新一波熱潮。
勒龐說:沒有傳統,就沒有文明;沒有對傳統的緩慢淘汰,就沒有進步。這就是科技產業最讓人振奮的地方。
每一次科技浪潮,都有代表性的企業和個人,幸運地站上了時代的浪潮之巔。而沒能投入到上一個技術大潮中的人,也不用擔心錯過,因為技術一直在進步,新的智能革命已經拉開了序幕,而這一次,中國科技沒有錯過。
生成式AI的黃金時代,剛剛被國產大模型拉開了一角,是你我即將親歷的又一個歷史機遇。無論你是普通用戶、應用開發者,還是行業觀察者和看客,都不妨給與它們更多期待。
-
百度
+關注
關注
9文章
2268瀏覽量
90364 -
ChatGPT
+關注
關注
29文章
1560瀏覽量
7604 -
文心一言
+關注
關注
0文章
124瀏覽量
1275 -
AIGC
+關注
關注
1文章
361瀏覽量
1540 -
大模型
+關注
關注
2文章
2427瀏覽量
2647
發布評論請先 登錄
相關推薦
評論