平地一聲雷,GPT-4 重磅來襲。
OpenAI 正式上線新一代人工智能大模型 GPT-4,它是一個大型多模態(tài)模型,可以接受圖像和文本輸入,同時返回文本輸出。就像這樣:
用戶:這幅畫有什么好笑的地方?逐一描述它的板塊。
GPT-4:圖片顯示的是一個 "Lightning Cable "適配器的包裝,有三個板塊:
板塊1:一部智能手機,VGA 連接器(通常用于電腦顯示器的大型藍色 15 針連接器)插在其充電端口。
板塊2:"Lightning Cable "適配器的包裝上有一張 VGA 接口的圖片。
板塊3:VGA 連接器的特寫,末端是一個小的 Lightning 連接器(用于為 iPhone 和其他蘋果設(shè)備充電)。
這張圖片的幽默感來自于將一個大的、過時的 VGA 連接器插入一個小的、現(xiàn)代的智能手機充電端口的荒謬性。
不得不說,一個示例足以證明了 GPT-4 與過往大模型的不同之處,是不是很強大?
與此同時,微軟宣布 Bing Chat 一直在 GPT-4 上運行。
當前,OpenAI 計劃通過 ChatGPT 及其商業(yè) API 發(fā)布 GPT-4 的文本功能,但是想要直接用上,還需要先加入一波等待名單(https://openai.com/waitlist/gpt-4-api)耐心等候。不過,ChatGPT Plus 用戶倒是可以直接上手 GPT-4 的體驗:https://chat.openai.com/chat
1、GPT-4 驚喜上線
雖然此前 OpenAI 首席技術(shù)官 Mira Murati 不斷給大家打預(yù)防針,希望外界能夠?qū)ο乱淮?GPT(即 GPT-4)的技術(shù)水平更加冷靜務(wù)實一些,少一些炒作會更好些,但是當 GPT-4 真正到來時,大家還是坐不住了。
“我們花了 6 個月的時間,利用對抗性測試項目以及 ChatGPT 的經(jīng)驗,反復(fù)調(diào)整 GPT-4,結(jié)果在真實性、可操作性以及拒絕超出道德等邊界方面取得了有史以來最好的結(jié)果(盡管遠非完美)”,OpenAI 分享道。
2、GPT-4:可以達到應(yīng)試者的前 10% 水平、一張草圖生成網(wǎng)站
為讓眾人更加清楚地了解GPT-4,OpenAI 官方不僅上線了介紹性的網(wǎng)頁(https://openai.com/research/gpt-4),還發(fā)布了一篇技術(shù)論文(https://cdn.openai.com/papers/gpt-4.pdf),詳細分享了 GPT-4 強大的功能,以及其存在的局限性。
從技術(shù)維度上來看,GPT-4 是一個基于 Transformer 的模型,經(jīng)過預(yù)訓練,可以預(yù)測文檔中的下一個 token。這個項目的一個核心部分是開發(fā)了基礎(chǔ)設(shè)施和優(yōu)化方法。這使 OpenAI 能夠根據(jù)不超過 GPT-4 的 1/1000 的計算量訓練的模型,準確地預(yù)測 GPT-4 的某些方面的性能。
也正如昨天 CSDN 報道的,微軟的 Azure 與 OpenAI 共同設(shè)計了一臺超級計算機,搭載了英偉達上萬顆 A100 芯片。基于這臺超算,OpenAI 在一年前將 GPT-3.5 作為系統(tǒng)的第一次“測試運行”進行了訓練,在修復(fù)一些 Bug 并提高理論基礎(chǔ)之上,OpenAI 基于此又訓練出了首個能夠提前準確預(yù)測其訓練性能的大模型 GPT-4。
更長的上下文,上限為2.5 萬個字
在性能上,GPT-4 超越了過往的模型,它可以遵循自然語言的復(fù)雜指令、生成技術(shù)或創(chuàng)意作品,支持生成和處理多達 32,768 個 token(約 25,000 字的文本),這使得 GPT-4 能有更長的上下文,允許長篇內(nèi)容創(chuàng)建、擴展對話以及文檔搜索和分析等用例。
GPT-4 可以直接上一個好大學
在分析 GPT-4 的能力時,OpenAI 還讓該模型參加了統(tǒng)一律師考試、法學院入學考試(LSAT)、研究生入學考試(GRE)的定量、口頭推理、分析寫作考試以及和各種 AP 科目考試等測試。
考試問題包括選擇題和自由解答題,OpenAI 為每種形式設(shè)計了單獨的提示,并在需要輸入的問題中加入了圖片。總分是通過結(jié)合選擇題和自由回答題的分數(shù)來確定的,使用的是每個考試的公開方法。
最終結(jié)果如下:
GPT-4 在大多數(shù)這些專業(yè)和學術(shù)考試中表現(xiàn)與人類水平相當。這意味著,如果 GPT-4 是一個僅憑應(yīng)試能力來判斷的人,它可以進入法學院,而且很可能也能進入許多大學。
多模態(tài)能力,通過視覺輸入看世界
正如文章開頭示例展現(xiàn)的一樣,GPT-4 可以接受圖像作為輸入并生成標題、分類和分析。
這意味著 GPT-4 實際上將看到現(xiàn)實世界,為此,OpenAI 也宣布正在和它的合作伙伴 Be My Eyes 一起測試 GPT-4 的圖像輸入能力,這是一款即將推出的智能手機應(yīng)用程序,可以直觀地解釋手機相機所看到的內(nèi)容。
不過,該功能目前仍限于研究預(yù)覽,沒有公開提供。
超越傳統(tǒng)的大模型
在一套傳統(tǒng)的 NLP 基準測試中,GPT-4 超過了以前的大型語言模型和大多數(shù)最先進的系統(tǒng)(這些系統(tǒng)通常有特定的基準訓練或手工工程)。
在 MMLU(多任務(wù)語言理解)基準測試中,GPT-4 不僅在英語中以相當大的優(yōu)勢勝過現(xiàn)有的模型,而且在其他語言中也表現(xiàn)出強大的性能。在 MMLU 的翻譯變體上,GPT-4 的性能優(yōu)于 GPT-3.5 和其他 LLM(Chinchilla,PaLM)的英語性能,包括低資源語言,如拉脫維亞語、威爾士語和斯瓦希里語。
生成代碼、改 Bug 的最佳小能手
除此之外,OpenAI 通過開源評估框架(Eval,https://github.com/openai/evals),用于自動評估 AI 模型性能的框架,允許任何人報告模型中的缺點,以幫助指導(dǎo)進一步改進。
與此同時,GPT-4 對代碼有超強的理解能力,可以幫助程序員生成代碼,遇上 Bug 時,甚至只要你把錯誤信息或者代碼異常的截圖發(fā)給 GPT-4,它就能幫你給出相應(yīng)的提示。
只需幾秒,一張手畫草圖,GPT-4 直接幫你生成網(wǎng)頁
更讓人驚奇的是,在官方演示的視頻中,手繪一張網(wǎng)站草圖:
把它拍照發(fā)給 GPT-4,GPT-4 甚至可以自動生成網(wǎng)站的原型圖。它從圖片中提取文字信息并輸出到 HTML,一個網(wǎng)站就有了,整個過程只有幾秒鐘的時間:
另外,GPT-4 也能處理復(fù)雜的稅務(wù)問題。
一系列操作下來,驚呆眾人。在上手體驗之后,不少網(wǎng)友現(xiàn)身說法:
我不在乎它不是 AGI,GPT-4 是一項令人難以置信的變革性技術(shù)。我在 60 秒內(nèi)重新創(chuàng)建了 Pong 游戲。這是我的第一次嘗試。
據(jù)悉,所有的代碼都是 HTML 實現(xiàn)的。
甚至有人看到了 GPT-4 的強大,開始暗戳戳地暗示起 GPT-5 的模樣:
3、不足之處
OpenAI 表示,他們的目標是開發(fā)能夠在任何智力任務(wù)方面取代人類的 AGI,盡管 GPT-4 還沒有達到這個目標。
盡管有這樣的能力,GPT-4 與早期的 GPT 模型有類似的局限性:它不是完全可靠的,比如,它也會對事實產(chǎn)生“幻覺”,推理出錯誤的結(jié)果。
對此,OpenAI 首席執(zhí)行官 Sam Altman 在推特上說:"它(GPT-4)仍然有缺陷,仍然有局限性,但它在首次使用時仍然能給你留下深刻印象。"
在使用 GPT-4 的輸出時,應(yīng)該小心謹慎,特別是在專業(yè)性要求非常高的重要場景中。
4、微軟:新 Bing 早用上了 GPT-4
這也是事實,GPT-4 遠非完美。不過根據(jù) OpenAI 的說法,研究人員納入了更多的人類反饋,包括 ChatGPT 用戶提交的反饋,用來改善 GPT-4 的行為。此外,OpenAI 公司還聘請了 50 名人類專家,在人工智能安全方面提供反饋。
如今微軟同時宣布自家產(chǎn)品早已第一時間用上了 GPT-4。"我們很高興地確認,新的 Bing 正在 GPT-4 上運行,為搜索而定制,"微軟在一篇博客文章中寫道。"如果你在過去六周的任何時候使用過預(yù)覽版的新 Bing,你已經(jīng)提前看到了 OpenAI 的最新模型的力量。隨著 OpenAI 對 GPT-4 及以后的更新,Bing 從這些改進中受益,以確保我們的用戶擁有最全面的副駕駛功能。"
5、壓力給到國外的 Google,國內(nèi)的百度
雖然上周 OpenAI 早已預(yù)告過 GPT-4 會在本周到來,但是真正到來時,還是讓很多人猝不及防。而之所以選擇此時發(fā)布,似乎也是為微軟將在 3 月 16 號的 AI 最新進展做一定的鋪墊,這樣微軟可以在明天輕松開上一場發(fā)布會了。不過,處于同賽道的其他玩家可能得連夜加班了。
這不,就在這一天,Google CEO 皮查伊親自下場官宣開放預(yù)訓練大模型(PaLM,https://www.datalearner.com/ai-models/pretrained-models/PaLM)的 API 商業(yè)接口,這是 Google 在 2022 年 4 月發(fā)布的自然語言預(yù)訓練大模型,最高參數(shù)為 5400 億。
與此同時,百度早在此前便宣布將會在 3 月 16 日帶來文心一言,最終成果不可避免地會與最新的 GPT-4 一較高下,究竟會如何,我們也將在明天揭曉。
審核編輯 :李倩
-
模型
+關(guān)注
關(guān)注
1文章
3263瀏覽量
48916 -
GPT
+關(guān)注
關(guān)注
0文章
354瀏覽量
15431 -
OpenAI
+關(guān)注
關(guān)注
9文章
1100瀏覽量
6575
原文標題:史上超強模型 GPT-4 :一張手繪草圖能生一個網(wǎng)站、60 秒搞定一個游戲開發(fā)!
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論