據(jù)報(bào)道,2023年5月14日,OpenAI正式公布其最新人工智能模型GPT-4o,預(yù)計(jì)其將于數(shù)周內(nèi)在OpenAI的各類產(chǎn)品中逐步實(shí)現(xiàn)集成。尤其值得關(guān)注的是,GPT-4o將向所有用戶免費(fèi)開放。
OpenAI首席技術(shù)官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具備與GPT-4相同的智能水平,且在文本、圖像及語音處理方面有顯著進(jìn)步。他在OpenAI總部的主題演講中表示:“GPT-4o能整合語音、文本和視覺信息進(jìn)行推理。”GPT-4是OpenAI先前的旗艦?zāi)P停瞄L處理圖像和文本混合信息,如從圖像中提取文字或描述圖像內(nèi)容等任務(wù);而GPT-4o在此基礎(chǔ)上增加了語音處理功能。
GPT-4o的運(yùn)行速度將得到極大提高,其中最大亮點(diǎn)為其語音交互模式采用了創(chuàng)新技術(shù)。OpenAI一直致力于使用戶能以語音方式與ChatGPT進(jìn)行交流,如同與真人對話一樣。然而,早期版本因延遲問題影響了對話的沉浸感。GPT-4o采用全新技術(shù),使得聊天機(jī)器人的響應(yīng)速度大幅度提升。
IT之家觀察到,發(fā)布會(huì)現(xiàn)場OpenAI展示了GPT-4o進(jìn)行語音對話的實(shí)例。演示者提問后,GPT-4o幾乎能立即作出回應(yīng),并通過文本轉(zhuǎn)語音功能進(jìn)行朗讀,使對話更具真實(shí)感。
另一演示展示了GPT-4o根據(jù)需求調(diào)整語調(diào)的能力,GPT-4o能根據(jù)指令改變聲音,從夸張戲劇到冰冷機(jī)械,表現(xiàn)出卓越的可塑性。最后,演示還展示了GPT-4o的歌唱功能。
過去,OpenAI發(fā)布新版ChatGPT模型時(shí),往往將其設(shè)為付費(fèi)服務(wù)。此次GPT-4o將對所有用戶免費(fèi)開放,付費(fèi)用戶則享有五倍的調(diào)用額度。
此外,OpenAI還發(fā)布了桌面版ChatGPT和新的用戶界面。穆拉蒂表示:“我們意識(shí)到這些模型正在變得日益復(fù)雜,因此我們希望用戶與人工智能模型的交互體驗(yàn)更為自然、輕松,讓他們能專注于與模型的協(xié)作,而不必過多關(guān)注界面本身。”
-
圖像
+關(guān)注
關(guān)注
2文章
1083瀏覽量
40449 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238237 -
GPT
+關(guān)注
關(guān)注
0文章
352瀏覽量
15342 -
OpenAI
+關(guān)注
關(guān)注
9文章
1079瀏覽量
6480
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論