過去大半年里,很多人對大模型的前景寄予厚望。主流觀點認為,每個行業、每款產品都可以通過大模型“重做一遍”。
“重做一遍”聽起來想象空間很大,但實際上多數大模型產品需要漫長的訓練周期和海量資源投入,落地也就變得遙遙無期。
今年年初金山辦公宣布All in AI,將LLM能力全面引入產品,發布基于大語言模型的智能辦公助手WPS AI。
相較于大模型玩家普遍把“重做一遍”視為創新路徑時,WPS AI帶來了另一種大模型創新方法論——與其“重做一遍”,不如去“重新發現”。
據悉,金山辦公選擇在大模型應用側下功夫,WPS國內版與WPS海外版同時推進WPS AI研發落地,讓每個模型都能充分發揮自身的優勢。
正因如此,WPS AI甚至比微軟的Microsoft 365 Copilot還快了一步,成了國內第一個將大語言模型(LLM)應用在辦公軟件領域,并真正交付了可用產品的公司。
自今年4月18日首次亮相以來,WPS AI在短短50天里對多個核心辦公場景進行了賦能,用“金山速度”不斷刷新著生成式AI的應用邊界。
如此驚人的進化速度,WPS AI是如何實現的?
生成式AI的背后是大模型服務的支撐
如果你是WPS的用戶,最近可能會觀察到一些變化:金山文檔「智能文檔」的新功能已經能夠幫你提供新聞稿、廣告文案、教學教案、工作周報等種種文件的起草、改寫、總結、潤色、翻譯、續寫等功能。
除此之外,它還可以幫你一鍵生成幻燈片、一鍵分析Excel數據、翻譯總結文檔,自己寫日報等等。
通過AI大模型,WPS構建出一個更高效、快捷釋放場景能力的智能交互系統,去解決用戶多元且碎片化的辦公需求。
不可否認,生成式AI本身的能力非常驚艷,但是生成式AI遠遠不只是以模型和AI這么簡單。
基礎模型只是在海面上的冰山一角,為了支持好這個冰山一角,冰川的底部有多個服務來支撐,比如說加速芯片、存儲優化、數據庫、大數據分析、安全服務等等。
不僅如此,支撐生成式AI的每一種技術和基礎設施環境,都在發生著快速變化。
以基礎模型為例,其發展是按照月甚至按照天的速度來迭的。2019年,最大的預訓練模型是3.3億個參數,但到了2023年,大模型最大的參數已經超過了五千億個,也就是說短短四年,整個參數的迭代超過了1600倍。
同時,國內外都掀起了“百模大戰”,從最開始出現的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,還包括國內正在自研的基礎模型如百川、ChatGLM等,每個模型都具備著他們自己獨有的場景和優勢。
正如亞馬遜云科技的CEO Adam Selipsky所說,沒有一個基礎模型可以適用于所有的業務場景,用戶會根據自己的場景去選擇最適合自己的基礎模型。
這一點放在金山辦公身上同樣適用。
金山辦公AI研發總監劉強在采訪中表示,幾乎很少有一個模型能涵蓋全部的能力,通常一個功能需要多個模型協作,需要考慮不同模型之間的調用方式不一樣。
但Amazon Bedrock的模型管理,能把不同大模型底層的API做成透明統一的,這減輕了很大的工作量。
金山辦公AI研發總監 劉強
劉強提到的Amazon Bedrock,是亞馬遜云科技今年4月發布的一項生成式AI重要產品。
它支持來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等領先人工智能公司的高性能基礎模型,并可以輕松安全地進行自定義模型訓練。
作為國內第一批Amazon Bedrock的預覽版用戶,金山辦公可以在輕松使用這些高性能基礎模型的同時,也能夠使用自己的數據構建差異化的應用程序。
與此同時,金山辦公通過使用機器學習平臺Amazon SageMaker,正在幫助算法科學家快速進行場景實驗和算法迭代。
Amazon SageMaker不僅可以避免算法科學家從頭搭建模型,還可以通過Amazon SageMaker JumpStart功能幫助客戶快速構建和部署模型,從而嘗試多種開源模型。
可以說,有了這類大模型管理作為基礎服務作為支撐,生成式AI的應用創新事倍功半。
生成式AI要效率也要安全合規
隨著大模型的發展,數據的合規性和安全性成為亟待解決的問題。
在生成式AI領域中,數據的獲取、加工及利用的方式決定了模型的性能和準確性。數據的非法泄漏、被惡意篡改,可能導致訓練出的模型有誤導性;非法獲取或使用未經授權的數據,不僅違法,還可能使得模型偏離了其原本的目的。
前段時間,OpenAI被指控訓練ChatGPT時使用從互聯網上抓取的數據,大規模侵犯了無數人的版權和隱私。目前全球各國對于企業使用大模型的數據安全要求已日益提升。
不少企業在構建大模型時也普遍要求私有化部署,即在加密環境中使用私有數據訓練模型,以控制相關數據和模型的安全風險。
金山辦公AI研發總監劉強表示,WPS非常重視數據安全,有專業的團隊及合作伙伴共同打造完善的數據安全體系,在各個國家和地區可以有效的保障用戶隱私。
正因對安全合規的重視,金山辦公作為一家中國企業得以順利走向全球。截至2022年底,WPS在海外已擁有超過1億活躍用戶,WPS Office累計獲得近4億次安裝。
從與金山辦公合作的亞馬遜云科技大模型服務來看,Amazon Bedrock在安全合規方面也助力頗多。
據亞馬遜云科技解決方案架構師介紹,在開發之初就考慮到安全性和隱私保護,幫助客戶保護敏感數據:
首先,Amazon Bedrock從服務設計層面就確保了客戶的數據以及客戶相關的信息不會被用于進一步訓練模型。所有的客戶數據都是經過加密的,且只有客戶能夠訪問。
其次,客戶可以使用Amazon PrivateLink,在Amazon Bedrock與虛擬私有網絡(VPC)之間建立專門的安全連接,確保任何數據傳輸都不會暴露在公共網絡。
最后,對于存在高度監管需求的客戶,Amazon Bedrock符合 HIPAA(《健康保險流通與責任法案》)要求,并且可以在 GDPR(歐盟《通用數據保護條例》)合規標準下使用,讓更多的客戶從生成式AI中獲益。
不難發現,金山辦公也可以利用它有效提升安全合規工作的效率,并確保客戶數據的安全性,讓金山辦公的實力得以在海外充分釋放。
構建生成式AI需要高性價比的基礎設施
正如前文所說,開發生成式AI應用是一個充滿挑戰的系統工程,并不是單純的產品和服務拼接,需要各種技術和工具來解決挑戰,而高性價比的基礎設施正是其強有力的支撐。
早在生成式AI創新之前,金山辦公就在積極探尋如何利用AI/ML技術為業務賦能。在數據存儲、現代化應用開發、AI/ML、芯片等層面,金山辦公與亞馬遜云科技都有深度合作。
例如,WPS Office通過使用Amazon S3高效低成本地實現了PB級海量數據存儲。
通過Amazon S3的智能分層功能,在存儲方面獲得了40%以上的成本優化效果;利用亞馬遜云科技在美國、日本和印度的節點,將終端用戶的響應延遲從日常大于1秒減少穩定至500毫秒以下。
在構建精細化運營方面,金山辦公基于機器學習平臺Amazon SageMaker服務構建了從用戶識別、用戶轉換到流失用戶挽回的一整套用戶精細化運營路徑,通過人工智能預測用戶購買,增強用戶轉化率。
除此之外,金山辦公還在嘗試利用亞馬遜提供的GPU機型和為生成式AI而打造的專門構建的加速芯片(Amazon Inferentia和Amazon Trainium),為海外業務部署開源模型方案,并且嘗試利用加速芯片來降低成本。
總的來說,避免重復開發大模型,專注于模型的開發效率、調優以及對底層基礎設施的高效利用,金山辦公為AI應用帶來了新的研發方式,也為AI應用開發者值得借鑒的思路。
未來,金山辦公還將以AIGC(內容創作)、Copilot(智慧助理)和Insight(知識洞察)三個戰略方向為核心,掀起辦公交互方式的新一輪變革。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30807瀏覽量
268953 -
大模型
+關注
關注
2文章
2437瀏覽量
2668
發布評論請先 登錄
相關推薦
評論