大模型是“大算力+強算法”的產物,是人工智能發展的趨勢和未來。大模型助力AI實現從“手工作坊”到“工廠模式”的轉變,從而使得AI從實驗室走向規模化的產業應用。大模型通常基于大規模無標注數據進行訓練,掌握某種特征和規則;基于大模型進行應用開發時,將大模型進行微調,或者不進行微調,就可以完成多個應用場景的任務。與此同時,大模型具有自監督學習能力,不需要或很少需要通過人工標注的數據進行訓練,降低了訓練成本,因而能夠加快AI的產業化進程,降低AI應用的門檻。通過不斷迭代,大模型能夠具有更強的通用性以及更高的智能程度,從而使得AI更廣泛地賦能各行業應用。
ChatGPT掀起通用人工智能浪潮
2019年,OpenAI推出參數量高達15億的通用語言模型GPT-2,能夠生成連貫的文本段落,實現初步的閱讀理解、機器翻譯等。2020年,OpenAI推出超大規模語言訓練模型GPT-3,參數量達到了1750億,用兩年左右的時間實現了模型規模從億級到千億級的突破,并能夠實現作詩、聊天、生成代碼等功能。2021年1月,谷歌推出的Switch Transformer模型以高達1.6萬億的參數量成為史上首個萬億級語言模型。同年12月,谷歌還推出了1.2萬億參數量的通用稀疏語言模型GLaM??梢钥吹?,大型語言模型的參數量保持著指數級增長的勢頭。2022年,OpenAI推出的ChatGPT是由比GPT-3更強大的GPT-3.5系列模型提供支持,并且這些模型使用微軟AzureAI超級計算基礎設施上的文本和代碼數據進行訓練。
2022年,ChatGPT突然走紅,這是人工智能大規模展示通用應用場景的開始。在此基礎上,生成式人工智能(AIGC)成為了推動行業領域發展的重要力量。AIGC既是內容的分類方式和生產方式,又是用于內容自動生成的一類技術集合,AIGC帶動了LLM、GPT等大模型的發展應用,為人工智能產業帶來了新的變革機會。
大模型與AIGC為人工智能領域帶來了新變化。從當前大模型的發展趨勢看,大模型企業更傾向于搭建平臺,對傳統企業進行賦能。具體而言,大模型企業憑借對組織型用戶“痛點”的了解,搭建大模型平臺,而組織型用戶只需加入自己獨有的場景數據,即可快速生成解決自身問題的“專屬模型”。不過,這種提供定制解決方案的模式也面臨開源模式帶來的挑戰。
LLaMA2開源改變大模型游戲規則
ChatGPT發布后,Meta緊跟著推出了類GPT大語言模型LLaMA。模型公布后不久,LLaMA因為源碼泄露引來了大量開發者的關注,在ChatGPT熱度下降的情況下,LLaMA成為產業關注的“新寵”。
2023年前5個月,ChatGPT全球訪問量增長幅度明顯下降,6月的訪問量更是環比下滑9.7%,為其自推出以來首次大幅度下滑。7月,Meta發布首個開源人工智能模型LLaMA的商業版本LLaMA2,該商用大模型可為企業提供OpenAI和谷歌的替代方案,該模型也因此被視為“最強平替”。需要特別說明的是,LLaMA2運行在Windows操作系統之上,整合了Azure云,原本與OpenAI長期深入合作的微軟已成為LLaMA2的“首選合作伙伴”。
Meta針對LLaMA2的開源模式做了如下表述:“我們相信,開源的方法是當今人工智能模型發展的正確途徑,尤其是在技術進步日新月異的生成式人工智能領域?!蓖ㄟ^開源的方式吸引足夠的參與者,從而搭建一套完善的生態系統,是Meta這類互聯網企業的一貫作風,但對于已投入大量成本而期望采用定制化解決方案的玩家而言,卻不是什么好消息。
Meta的操作讓人聯想到Facebook的開源計算項目OCP,該項目被用于改變服務器硬件的制造方式,以更好地適應互聯網時代。OCP除了對應的機架規范Open Rack,還包括服務器、網絡、存儲,乃至數據中心的設計。OCP被視為Facebook最為重要的科技項目之一,旨在把“開源”概念引入數據中心硬件,為數據中心提供更快、更便宜、用材更少的硬件。
OCP的開放性體現在免費提供設計,任何企業都可以使用它,并對其進行調整,這意味著,惠普、戴爾和思科這類傳統硬件供應商將不再控制產品設計,取而代之是由用戶自己控制。這給思科等硬件制造市場的老玩家帶來了很大威脅,因為OCP很有可能為企業提供更便宜、更靈活的替代方案,從而淘汰傳統的昂貴方案。微軟、蘋果等科技巨頭都加入了OCP陣營,開始把OCP的一些概念整合到自身的數據中心,形成新的生態。Facebook也通過構建在OCP基礎上的各種技術,大大減少了對“思科們”的依賴。
LLaMA2的開源模式可能會影響OpenAI等公司在生成式人工智能軟件市場中取得的早期主導地位。因為Meta意在借助LLaMA2構建人工智能開源生態系統,快速擴大其市場規模并建立口碑,同時阻礙競爭對手從其專有技術中賺取收入。
Apple GPT入局,前路未知
在Meta、微軟、OpenAI等公司各出奇招的同時,以封閉系統作為競爭優勢的Apple等公司也在借助Siri等人機交互觸點的優勢向上游拓展。近期,業內傳出Apple秘密研發Apple GPT的消息。
據了解,Apple GPT是一款基于蘋果自研Ajax框架開發的人工智能工具,這一產品已在蘋果內部小范圍內投入使用。與其他解決方案不同的是,目前Apple尚未決定Apple GPT未來的開發方向,甚至嚴格規定了Apple GPT的使用場景,禁止將其輸出用于開發面向用戶的功能。這體現了不同企業對大模型市場發展的不同理解和判斷,同時也體現了“利用大模型做未來物聯網入口的可能性和交互能力的升級”這種定位和發展方向的選擇。
大模型時代的人工智能倫理風險
開源大模型將加速人工智能市場的應用拓展,但與此同時,人工智能哲學尤其是科技倫理方面的爭議甚囂塵上,大模型的可靠性、安全性、知識產權等也成為了產業亟待解決的新課題。大模型目前還面臨較大的挑戰,包括大模型“幻覺”、“一本正經地胡說八道”、政企私有數據的保密性要求、大模型存在封閉性等,同時信息壟斷、知識產權等問題也不容忽視。
知識可靠性及信息誤導等問題
ChatGPT不能保證回答問題的可靠性和準確性,對于“如果相同的問題在不同時間問你有不同的結果,我怎么知道哪一個比較可信,或者哪一個更為接近真相”這個問題時,ChatGPT給出了如下答復:“作為一種人工智能系統,我是基于一組固定的算法和數據運行的,并且在回答問題時會遵循程序化的邏輯。因此,如果對同一個問題多次詢問,答案應該是一致的,除非模型的數據或算法發生了更改。不過,即使我的回答是一致的,也不能完全保證答案的正確性和可靠性,因為我的訓練數據和算法可能存在偏見或錯誤,我并不能獨立判斷我回答的問題是否符合真實情況。”
ChatGPT要學習大量的文本數據,并以特定的算法處理數據,因此可通過提供誤導性訓練數據或者改變算法,操控處理結果。也就是說,我們不能準確理解作為“黑盒”的數據處理模型,以及信任ChatGPT采用的訓練數據集的“權威性”,即便在一個我們熟悉的領域,細微的差別也可能導致巨大的結論偏差。
從知識可靠性的角度看,知識應用的場景需要非常謹慎,尤其是在學術研究領域,必須嚴格限制ChatGPT信息的引用。
信息壟斷問題
如果模型的使用和控制都是不透明的,就有可能出現信息壟斷。信息壟斷是指一個或一些組織及個人控制著信息的生產、流通和使用,從而有效地排除競爭。因此,如果行業不采用透明公開的方式去評估和監督使用信息,那么就可能存在信息壟斷的風險。
知識產權問題
ChatGPT由OpenAI訓練,數據集是從互聯網上收集來的大量文本數據,包含新聞報道、維基百科條目、小說、博客、論壇帖子、技術文檔、社交媒體內容等信息,這些數據可能存在著作權侵權的風險。
具體而言,OpenAI嘗試遵循合法、道德的原則來獲取數據,但并不能保證所有數據的著作權擁有者都同意OpenAI將其數據用來訓練語言模型。風險在于數據的處理結果是構建在未經授權的第三方經驗之上,而通過這些經驗獲得的價值并沒有與第三方共享,或者說他們甚至都沒有意識到自己的數據被使用。在現實世界中肖像權被侵犯是比較明顯的,在數字世界中經過多重加工以后,這樣的侵權行為就不是那么明顯。
在現實世界中可能會出現這樣的情況:ChatGPT的回答可能無意之間引用了作者聲明需要分享商業收益的內容,在不知情的情況下侵犯了作者的知識產權。此外,經過復雜的模型處理之后,文本的所有者可能很難知道ChatGPT對他的資產進行了處理,也就是說,盡管理論上文本的所有者可以去維權,但實踐成本會非常高。
針對這個問題,ChatGPT是這樣回應的:“確實存在難以識別使用者行為的問題。不過我是一個由OpenAI制作并管理的計算機程序,并且OpenAI是一個認真對待知識產權和隱私的公司,他們遵循相關法律法規,努力確保這些法律法規在用戶使用我的過程中得到遵循。當然,如果您發現有任何違反知識產權的情況,建議您及時聯系OpenAI,以幫助他們解決問題?!?/p>
能否用于解決具有創造性的問題
這個問題看起來更像是一個人工智能的哲學問題。科學發展的傳統看法是:科學知識是不斷增加的,發展是一個直線的、知識積累的過程。這是為大多數人所接受的科學發展觀,也是ChatGPT體現出來的知識“歸納”,其文字編碼的概率讓結果體現出這樣的特征。波普證偽主義強調的不是知識的積累,而是科學理論的更替,舊理論不斷被推翻,新理論取而代之。
大模型帶來了強大的智能,能夠推動人工智能向更高級的智能應用邁進,例如AIGC、更智能的對話客服等。GPT-3等大模型在新聞文本生成、商業文本分析、法律文本分析等領域具有較高的產業應用價值。除問答以外,ChatGPT能夠完成編程、寫稿等眾多超出人們想象的任務。谷歌公司曾表示:“如果ChatGPT參加谷歌的面試,理論上會得到入門級程序員的聘任。因此,更為關鍵的是我們怎么理解‘創造性’這個詞的含義。”
結語
無論如何,大模型僅僅是生成式人工智能大規模商用的前奏,許多領域的企業都在嘗試將大模型能力與自身的優勢、定位和戰略發展方向結合起來。無論是從打造難以被模仿的技術優勢、大模型能力與復雜場景結合構建更強的解決方案能力、借助開源模式降低大模型使用門檻形成規模化壟斷,還是借助傳統的觸點優勢進一步提升終端用戶的體驗,市場上不同的玩家都在根據自身的理解嘗試定義大模型的未來。而在通向未來的道路上,大模型將比其他領域面臨更多的倫理、法律、道德方面的難題,這也是大模型企業在打造市場競爭力的同時,面臨的新課題。
-
人工智能
+關注
關注
1791文章
47232瀏覽量
238348 -
ChatGPT
+關注
關注
29文章
1560瀏覽量
7618 -
大模型
+關注
關注
2文章
2438瀏覽量
2668
原文標題:ChatGPT→LLaMA→Apple GPT:盤點國外大模型產業發展之路
文章出處:【微信號:txshj123,微信公眾號:通信世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論