近日,美國著名人工智能研發機構OpenAI正式宣布,自本周二(2022年7月30日)起,面向部分ChatGPT Plus用戶推出嶄新的GPT-4o語音模式產品。
據OpenAI詳細闡述,這款高級語音模式具備高度的實時性和互動性,支持用戶隨時隨地打斷對話過程,并且能夠敏銳察覺并反應出用戶的情緒變化。實際上,實時交互及對話中斷兩大技術難題一直是語音助手領域面臨的挑戰。
早在今年五月份,OpenAI便成功推出了全新升級版的大型語言模型GPT-4o,并同步展示了其語音模式的強大功能。原本計劃在六月底逐步向廣大用戶開放此項服務,然而經過慎重考慮,OpenAI最終決定將其發布日期延至七月。預計在今年秋季,語音模式將全面覆蓋到所有ChatGPT Plus用戶群體中。
OpenAI在本周二明確指出:“我們采取逐步推廣策略,以便能夠密切關注用戶的使用體驗,并依據實際反饋持續提升模型的性能以及安全性。”此外,該公司還透露正在積極推進五月份發布會上展示的視頻和屏幕分享功能的研發工作。至于這些功能的具體上線時間,目前尚無確切消息。
因此,在語音模式的初始階段,其功能可能相對較為單一。舉例來說,ChatGPT將暫時無法運用計算機視覺功能,這項技術可以使聊天機器人借助智能手機的攝像頭,為用戶的舞蹈動作提供語音反饋。
現階段,GPT-4o語音模式已經配備了四種預設聲音——Juniper、Breeze、Cove和Ember,這些聲音均由經驗豐富的付費配音演員精心打造而成。
值得一提的是,之前ChatGPT中的一位名為Sky的女性配音曾因與好萊塢巨星斯嘉麗·約翰遜的聲線極為相似而備受爭議。在接獲約翰遜團隊的律師函之后,OpenAI不得不暫停使用Sky語音。
此外,OpenAI還特別強調,他們已經引入了全新的過濾機制,旨在確保軟件能夠準確識別并拒絕任何試圖生成受版權保護的音樂或其他音頻內容的請求。對于AI企業而言,如何規避潛在的法律風險已然成為必須高度重視的問題。
-
語音
+關注
關注
3文章
385瀏覽量
38028 -
OpenAI
+關注
關注
9文章
1079瀏覽量
6481 -
ChatGPT
+關注
關注
29文章
1558瀏覽量
7595
發布評論請先 登錄
相關推薦
評論