“AI 2.0時代,生成式AI被視為推動生產力進步的重要技術,如果能在知識、推理、執行三層能力上實現突破,將真正帶來整個社會生產力的跨越式發展。” 商湯科技董事長兼CEO徐立在2024 GDC上提出了這一前瞻性觀點。
3月23-24日,2024全球開發者先鋒大會(GDC)在上海隆重召開。商湯科技董事長兼CEO徐立受邀出席開幕式,并發表《AI 2.0時代的“新質生產力工具”》主旨演講,分享了對AI 2.0時代生產力工具“質”變背后的思考和突破路徑。
以下為徐立演講內容梳理。
▎新生產力工具仍需持續進化
最近,“新質生產力”成為熱議話題,尤其在開發者領域,生成式AI被視為引領生產力突破的技術,也標志著人工智能進入了一個新的發展階段,我們稱之為AI 2.0時代。
ChatGPT、Copilot、Blackwell是AI2.0時代的熱度代名詞。搜索數據顯示,中國對于這些詞的關注熱度位居世界榜首,這代表著中國近千萬的開發者以及普羅大眾對于AI能夠帶來的變化熱切關注。當然,這也是中國AI發展的非常好的基礎。
隨著AI 2.0時代的來臨,GitHub上的相關項目數量呈指數級增長。生成式AI項目、大模型項目以及輔助編程、輔助開發的工具項目層出不窮。但反過來看,中國數字人才缺口也在逐年增大,且短缺比例在快速擴大。
還有一組數據值得關注。盡管中國對AI 2.0的關注極高,但在實際應用方面排名卻落后于美國和印度等國家。這其中,語言是一個不容忽視的問題。以通過自然語言完成編程任務為例,英語與現有程序的匹配度相當高,而優秀的中文語言工具相對欠缺。
雖然我們已經開始使用AI 2.0時代的生產力工具,但這些工具帶來的生產效率提升效果并不明顯,所能解決的問題占比不足10%,給生產鏈路帶來的突破相對有限。
眾所周知,軟件開發全生命周期包括需求分析、設計、開發、測試、部署和維護諸多環節。雖然目前AI能夠帶來很多革新,或者擴展到很多場景,但目前僅能解決其中非常小眾的部分。
具體而言,AI目前能解決的是在過往基礎上抽象成比較標準化、甚至以知識庫的形式固化下來的內容,包括代碼補全、代碼增寫以及部分測試用例等。如果把它分攤到整個軟件或者產品設計的全流程當中,占比并不高。
當然,隨著擴展能力變強,很多工具會從前端的設計、測試用例再到維護的橫向拓展,一步步往前演進。
除了橫向能力的拓展,從縱向來看,當前,新生產力工具的準確率和完成度也普遍較低。
根據SWE-bench評估,Claude 2 和 GPT-4在特定任務上僅不到5%的任務完成度,即使是最新的Devin完成度也僅13%,雖然整個行業在往前走,但目前還是處于相對雛形。
另一個有意思的現象是,編程經驗越豐富,不代表就越能用好新的生產力工具。統計數據顯示是相反的:工作五年以下的程序員使用新生產力工具解決問題時長超過一小時,但五年以上的程序員反而更短。這意味著越是高階、復雜的任務,對于當前新生產力工具來說還有一定的挑戰。
▎大模型能力的三層架構
大模型能力可分為三層架構,而且這三層之間互有依賴,但又相對獨立。
第一層知識(Knowledge),世界知識的全面灌注。目前,許多生產力工具解決的都是知識層的問題,當用戶提出問題時,其底層的邏輯都來自于“世上無新事”——你所面臨的問題,前人可能已經遇到過并解決了,因此通過大模型可以很好地完成這些任務。
第二層推理(Reasoning),理性思維的質變提升。有了世界知識之后,再往前演進。即使不知道這件事實,也可通過AI逐步把這個事實推理出來,給出更多的可能性。
知識和推理是作為生產力工具——大模型最重要的兩層,但目前在推理層,成長還相對有限,這也是今后要集中突破的能力之一。
第三層執行(Execution),世界內容的互動變革,即如何跟這個世界互動反饋。某種意義上,如今火熱的具身智能,在執行上會有很大的突破。
總體來講,這三層可以組成一個完備的對于世界提供生產力工具模型的三層能力。
▎“KRE”三層架構實踐:商湯“小浣熊”快速進化
商湯結合“KRE”三層架構打造出一個辦公輔助軟件——“小浣熊”。
在一個已開發完成的基模型的基礎上,我們從需求分析到最終完成產品開發,共需投入100人天的工作量。
如果去年用“小浣熊”代碼補助工具,可節省30%的工作量。它在整個過程中主要解決的還是一些重復性的勞動,在一個很好的代碼庫基礎上,能夠做一些代碼的完成任務。 在此基礎上,我們進一步整合了從需求分析、需求設計到長尾應用等各個環節,推出了更為強大的“小浣熊”2.0版本。它真正意義上基于我們給出的海量數據篩選出需求,制定產品特征,在產品的特征之上完成產品的自主開發。
最終,我們期待它在獲得世界知識的基礎上,在真實的世界當中應用到更多的機器人場景當中。
再以“KRE”三層來理解“小浣熊”。知識層是代碼的補全,補全的代碼來自他人寫過的代碼;推理層則深入到軟件開發的全流程;執行層進入切分到垂直場景當中,以場景化的智能為依歸。
那么知識、推理,這兩層是不是相關?以GPT4為例,它擁有強大的代碼解釋器,能夠處理各種數學問題。在面對某些特定問題時,例如“請列出一百以內所有的兩個質數相乘”以及“一百以內兩個質數相乘加1”, 它能夠正確地列出前者,但在處理后者時卻出現了錯誤。兩個問題難度一樣,為什么會出錯?原因在于這類問題沒有見過,它的世界知識沒有辦法直接給出答案,需要調用代碼解釋器,但生成代碼正確率不可能是100%,所以會有出錯的概率。
可以說,知識層主要解決高頻、標準化問題,做別人做過的問題,顯然準確率高。推理主要解決長尾、碎片化的問題。
舉兩個“小浣熊”場景化的例子。
場景一:管理智能化。在交通分析的場景中,大屏上的數據往往是固定化的,比如某個路口的流量、某個時間的流量分析等等,是一個標準化的問題。然而,當要結合天氣因素、輿論因素、新聞因素,過去沒有此類的分析結果,可以用軟件強推理能力來完成一些長尾應用的分析。
場景二:辦公智能化。當需要為產品推廣制定預算時,把財務報表、賬戶信息、產品介紹等各類文檔資源全部輸入到商湯的“辦公小浣熊”當中,它能夠根據輸入的數據和需求,給出一個既合理又科學的預算方案,展現出強大的推理能力。
總之,生產力工具如果在知識能力、推理能力、執行能力三層能力上都有突破,首先受益的是廣大開發者以及場景化的核心應用,最終將真正帶來整個社會生產力的跨越式發展。
審核編輯:劉清
-
商湯科技
+關注
關注
8文章
527瀏覽量
36319 -
生成式AI
+關注
關注
0文章
521瀏覽量
601
原文標題:商湯科技董事長兼CEO徐立:AI 2.0時代的 “新質生產力工具”
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
鼎捷數智董事長葉子禎:用數據和智能技術創新生產力

英特爾分析新質生產力發展的趨勢和機遇
華為云徐峰:AI 賦能應用現代化,加速軟件生產力躍升

IBM加速AI規模化應用,解鎖企業新質生產力

IBM陳旭東:攜手IBM加速 AI 規模化應用,解鎖企業新質生產力

華為云尚海峰:以數智技術為核心,加速培育和形成新質生產力

評論