電子發燒友網報道(文/吳子鵬)北京時間3月15日凌晨,人工智能研究公司OpenAI正式發布了其下一代大型語言模型GPT-4。目前,ChatGPT的Plus訂閱用戶已經可以使用GPT-4,其他用戶需要排隊申請內測。
對于GPT-4的性能,很多國外網友的描述都是“GPT-4,起飛!”
多模態大型語言模型GPT-4
GPT-4被定義為OpenAI發展的另一里程碑,其相較于上一代產品GPT-3.5所帶來的提升是巨大的。OpenAI工作人員表示,“我們還在為機器學習模型設計的傳統基準上對GPT-4進行了評估。GPT-4大大超過現有的大語言模型,與多數最先進的(SOTA)模型并駕齊驅。”
官方介紹稱,GPT-4作為一個多模態大模型(接受圖像和文本輸入,生成文本),主要在四個方面做了增強。
首先是可以更準確地解決難題,具有更廣泛的常識和解決問題的能力。在GPT-3.5時代,ChatGPT的精準度時常被吐槽。GPT-3.5根據從互聯網上搜羅的大量文章、網站和社交媒體帖子以及用戶與OpenAI雇用的人工雇員的實時英文對話進行訓練的,因此在輸出結果時,一些錯誤的源數據,也導致ChatGPT給出的答案看似合理,實際上有很大的漏洞。就以考試來衡量,上一代GPT-3.5在很多專業考試中的成績都是倒數10%,而GPT-4在已測試的考試中,基本都是高分通過,超越了“人類的水平”。
GPT-4在多項考試中優于GPT-3.5
其次是更具創造性和協作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多問題給出的回答都是很簡短的,雖然具備一定的邏輯性,不過在專業人士看來還略顯“幼稚”。到了GPT-4,該模型能夠處理超過25000個(GPT-3.5是3000個)單詞的文本,允許長文內容創建、擴展對話以及文檔搜索和分析等用例。在顯示過程中,GPT-4可以完成總結文章、寫詩這樣的創造性任務。
第三點是GPT-4的高級推理能力更強。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定義為“一本正經的胡說八道”,在計算方面的能力更是弱于十四五歲的孩子,約等于八九歲孩子。因此,很多人說如果將ChatGPT比作是一個學生,他在數理化方面是嚴重偏科的。在GPT-4中,這方面的能力得到了顯著的增強。在專業測試和學術基準測試中,GPT-4都表現出了不俗的實力。在官網上,OpenAI用會議預約展示了GPT-4的推理能力,GPT-4明顯更“擅長”做這個。
最后一點是安全性。針對基于GPT-3.5打造的ChatGPT,曾有內測人員通過引導的方式讓其表現出攻擊性。同時,有很多報道都指出,上一代ChatGPT曾出現辱罵用戶、表白用戶、誘導用戶離婚、監視開發人員等行為。有業內人士在推特上表示,微軟需要關閉必應中的類ChatGPT功能,因為系統有時表現得像精神病一樣,會給用戶錯誤答案。特斯拉馬斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6個月時間使GPT-4更安全、更具一致性。在內部評估中,與GPT-3.5相比,GPT-4對不允許內容做出回應的可能性降低82%,給出事實性回應的可能性高40% 。
當然,GPT-4也還存在自己的局限性,尤其是在事實性、社會偏見、幻覺和對抗性等方面,需要得到持續的優化。在內部的對抗性事實性評估中,GPT-4的得分比GPT-3.5高40%,很顯然這還是不夠的。
在發布會當晚,微軟表示GPT-4已在新必應搜索引擎上運行。
全行業追趕GPT-4
ChatGPT的火熱是有目共睹的,在去年11月30日發布后的5天時間里,收獲了100萬用戶;推出僅僅2個月,月活躍用戶就成功過億,成為歷史上增長最快的消費者應用程序。如今,GPT-4的發布進一步延續了這股熱潮,甚至是讓火燒的更旺了。
為了不讓微軟或者是OpenAI在該領域一騎絕塵,也為了自己能夠在AIGC方面得到更大份額的蛋糕。目前,全球科技巨頭都在抓緊時間追趕GPT-4。
為了提升旗下類ChatGPT模型的優化速度,谷歌在博文中宣布正式開放其PaLM大型語言模型API。谷歌表示,“我們看到新一輪的生成性人工智能應用正在改變人們與技術互動的方式。在谷歌,我們希望通過提供易于使用的API和工具,使所有開發人員能夠開始用生成性人工智能構建下一代應用程序,從而繼續使人工智能變得容易使用。”谷歌于2022年4月宣布PaLM,隨后一直在優化。北京時間2月8日晚,谷歌正式發布類ChatGPT應用Bard,不過由于演示中出現事實錯誤,谷歌因此股價大跌,一天市值蒸發近千億美元。
目前,谷歌正在全力優化PaLM。北京時間3月7日,谷歌和柏林工業大學的團隊重磅推出了史上最大的視覺語言模型——PaLM-E,參數量高達5620億,是GPT-3(參數量為1750億)參數規模的數倍。
除了谷歌,目前國內科技行業都在關注百度文心一言的發布。百度將于北京時間3月16日下午兩點發布自己的類ChatGPT應用文心一言。根據此前的爆料消息,文心一言是百度基于文心大模型技術推出的生成式對話產品,被外界譽為“中國版ChatGPT”。2021年12月,百度與鵬城實驗室聯合發布共同研發的全球首個知識增強千億大模型——文心,當時百度首席技術官(CTO)王海峰表示,該模型參數規模達到2600億,是目前全球最大中文單體模型。這段時間,百度在加班加點地調教文心一言,可能綜合實力會比更新的ChatGPT有差距,不過在中文能力上估計會是全球獨一檔的存在。
針對國內類ChatGPT應用的發展,360周鴻祎表示,ChatGPT比造芯更容易,在國家鼓勵性政策的支持下,中國用兩三年就能追上美國的水平。不過,在ChatGPT訓練必需的通用算力GPU方面,國內和英偉達的總體差距預計在10年左右。
總結
比爾蓋茨曾表示,以ChatGPT為代表的人工智能的進步是目前“最重要的”創新,重要性不亞于互聯網的發明。目前,全球科技迷對GPT-4趨之若鶩,國內馬上也要有自己的“中國版ChatGPT”——文心一言,AIGC掀起的顛覆浪潮已經一浪高過一浪了。
發布評論請先 登錄
相關推薦
評論