大模型之爭,又卷起來了。
據(jù)The information爆料稱,OpenAI即將推出多模態(tài)模型GPT-vision。
如果消息為真,這將是OpenAI在GPT-4之后推出的最大更新。
另一邊,谷歌的多模態(tài)模型進(jìn)展也在最近傳出,為的就是能和OpenAI抗衡。
目前為止,OpenAI還沒有對(duì)爆料中的傳聞做出回應(yīng),但此前發(fā)布過多模態(tài)模型測試。
CEO奧特曼在回應(yīng)有關(guān)GPT-5的傳聞時(shí),也暗示過GPT-4“正在增強(qiáng)”。
究竟誰能更勝一籌,還得讓子彈再飛一會(huì)兒。
不能讓Google搶了先
我們先回到OpenAI,被爆料的多模態(tài)模型將搭載什么樣的功能呢?
首先是圖像內(nèi)容識(shí)別,比如根據(jù)手繪草圖生成網(wǎng)頁代碼、輸出可視化圖表的文本分析等。
另一方面則是圖像生成,通過簡單的文本生成繪畫、logo或表情包。
雖然OpenAI沒有對(duì)這次的爆料做出回應(yīng),但做多模態(tài)模型這件事本身只是個(gè)時(shí)間問題。
3月份,OpenAI在發(fā)布GPT-4時(shí),就曾推出了一個(gè)多模態(tài)GPT的預(yù)覽版本。
當(dāng)時(shí),OpenAI把DEMO提供給了研究幫助視障群體的機(jī)構(gòu)Be My Eyes。
除了這家機(jī)構(gòu)之外,就再也沒有人見過OpenAI的多模態(tài)模型是什么樣子了。
在此之后,這個(gè)多模態(tài)模型更是杳無音訊。
唯一和圖像有點(diǎn)關(guān)系的,就是GPT-4的升級(jí)版代碼解釋器(后改名為高級(jí)數(shù)據(jù)分析)可以處理一些圖片任務(wù)。
但這是通過調(diào)用Python庫實(shí)現(xiàn)的,而且也達(dá)不到AI中圖像識(shí)別的程度,和多模態(tài)模型更是不沾邊了。
有說法稱GPT-vision遲遲沒有推出的原因可能是對(duì)安全的擔(dān)憂,擔(dān)心被用于破解驗(yàn)證碼和人臉識(shí)別系統(tǒng)。
直到這次Google多模態(tài)模型Gemini的消息傳出。
安全問題有沒有解決不得而知,但也許OpenAI是真的急了,不能任由谷歌超越,才有了模型發(fā)布的傳聞。
另據(jù)爆料,OpenAI還在準(zhǔn)備從頭開始開發(fā)一個(gè)名為Gobi的多模態(tài)模型,不過訓(xùn)練還未開始。
那么,谷歌這邊的情況又是怎樣的呢?
Gemini來勢洶洶
來勢洶洶的Gemini,讓網(wǎng)友直言其或?qū)⒊蔀橛螒蛞?guī)則的改變者。
甚至有媒體夸張一些地說將有機(jī)會(huì)取代GPT-4。
Gemini主要由谷歌DeepMind團(tuán)隊(duì)開發(fā)。谷歌CEO皮查伊介紹,Gemini集成了多種技術(shù),支持同時(shí)輸出文本和圖像,還可以使用工具和API。
據(jù)悉,Gemini吸取了很多來自AlphaGo的經(jīng)驗(yàn)教訓(xùn),包括強(qiáng)化學(xué)習(xí)和樹搜索技術(shù)。
而且,憑借著擁有YouTube這一得天獨(dú)厚的優(yōu)勢,海量的訓(xùn)練數(shù)據(jù)可以說是唾手可得。
實(shí)際上,Google也一直把OpenAI視為競爭對(duì)手。
為了和ChatGPT較量,Google此前已經(jīng)在Bard中加入過圖像識(shí)別功能,但并未改變ChatGPT的地位。
但這次推出的Gemini,OpenAI也感到害怕了。
盡管競爭激烈,有一點(diǎn)倒是讓谷歌和OpenAI不謀而合。
那就是,把模型的能力變成真金白銀。
谷歌計(jì)劃的Gemini提供方式是通過其Google Cloud Vertex AI云服務(wù)平臺(tái)進(jìn)行,預(yù)期價(jià)格為每個(gè)用戶每月30美元。
這一做法預(yù)計(jì)將成為谷歌新的收入來源,尤其是針對(duì)企業(yè)客戶。
而OpenAI這邊,也已經(jīng)開始通過金融服務(wù)等各種應(yīng)用程序?qū)PT-4變?yōu)楝F(xiàn)金。
此次多模態(tài)的角逐究竟鹿死誰手,我們拭目以待。
-
模型
+關(guān)注
關(guān)注
1文章
3229瀏覽量
48813 -
python
+關(guān)注
關(guān)注
56文章
4793瀏覽量
84634 -
OpenAI
+關(guān)注
關(guān)注
9文章
1082瀏覽量
6485
原文標(biāo)題:OpenAI最新大模型曝光!劍指多模態(tài),GPT-4之后最大升級(jí)!
文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論