電子發燒友網報道(文/李彎彎)近日消息,OpenAI在一篇博客中表示,ChatGPT 將推出新的語音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過語音或圖像與ChatGPT交流。OpenAI稱,新功能在未來兩周內向付費用戶推出,不久后會推廣到其他用戶。
ChatGPT 是OpenAI推出的一種人工智能技術驅動的自然語言處理工具,它能夠基于在預訓練階段所見的模式和統計規律,來生成回答,還能根據聊天的上下文進行互動,能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務。自2022年11月30日發布以來,ChatGPT 已經進行了多次功能升級。
ChatGPT現在能看、能聽、能說了
ChatGPT使用了Transformer神經網絡架構,也是GPT-3.5架構,這是一種用于處理序列數據的模型,擁有語言理解和文本生成能力,尤其是它會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT具備上知天文下知地理,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。
2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊用戶數超過100萬。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費者應用。
2023年2月2日,OpenAI發布ChatGPT試點訂閱計劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價格提供,訂閱者可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。同日,微軟發布公告稱,旗下所有產品將全線整合ChatGPT。
2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態大模型,即支持圖像和文本輸入以及文本輸出,擁有強大的識圖能力。GPT-4的特點在于:第一,它的訓練數量更大;第二,支持多元的輸出輸入形式;第三,在專業領域的學習能力更強。
2023年5月18日,OpenAI官網宣布推出iOS版ChatGPT應用,該應用可免費使用,并在不同設備間同步用戶的歷史記錄。該應用還集成了OpenAI開源語音識別系統Whisper,支持語音輸入。ChatGPT Plus付費訂閱用戶可以獨家使用GPT-4功能。
2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應方式。此外,OpenAI還發布公告稱,給ChatGPT加了一個名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。
2023年9月25日,OpenAI發布《ChatGPT 現在能看、能聽、能說了》的公告,宣布ChatGPT 增加語音輸入和圖像輸入兩項新功能。這可以說是ChatGPT 發布以來極其重大的更新。
據介紹,語音輸入功能類似于手機上的語音助手,用戶只需要輕輕點擊一個按鈕,說出自己的問題,ChatGPT能將這些口述的問題轉換成文本,將其輸入至大語言模型中,生成答案,接著將答案轉化成語音,播放給用戶。
語音轉文本的任務由OpenAI 的 Whisper 模型提供支持。同時,該公司正在引入一款全新的文本轉語音的模型,據稱可以通過幾秒鐘的語音樣本生成與人類相似的音頻。
圖像輸入功能類似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會嘗試識別用戶想要詢問的內容,并給出相應的回答。用戶還可以用應用中的繪圖工具來幫助表達自己的問題,或者配合語音或文本輸入來進行交流。
用戶可以向ChatGPT展示一張或多張圖片,提問相關的問題。比如,發送一張壞掉的燒烤爐圖片,然后詢問無法啟動原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。
OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問ChatGPT:這里是扳手嗎?是調整這里嗎?甚至還把說明書拍照發給ChatGPT求解釋。
這正是ChatGPT獨特的特性所帶來的幫助,用戶可以與機器人進行互動,逐步完善答案,而無需首先進行搜索并在得到錯誤答案后再次搜索。
ChatGPT新增語音和圖像功能帶來的風險
OpenAI在博客中表示,其目標是構建安全有益的通用人工智能(AGI)。新增的語音和圖像功能可能會帶來一些風險,但是OpenAI正在采取措施緩解這些風險。
新的語音技術能夠在短短幾秒鐘的真實語音片段中生成逼真的合成語音,這一技術存在潛在風險,比如,惡意行為者可能會濫用這項技術,冒充公眾人物或實施欺詐。為了避免這些問題的發生,OpenAI決定將這項技術應用于特定的場景中,會受到嚴格的限制。
新的圖像功能也帶來一定風險,在進行更廣泛的部署之前,OpenAI測試了該模型在極端主義和科學領域等方面潛在的風險,并對一些關鍵細節進行了調整,來確保負責任地應用這項技術。比如,在處理人物圖片時,OpenAI限制了ChatGPT 對人物進行分析和直接評價的能力,這意味著上傳一個人的照片就能知道那是誰無法實現,這是為了隱私安全。
ChatGPT自發布以來,在受到廣大用戶追捧的同時,其伴隨的風險也讓各界人士表示擔憂。一是它可能在被使用的過程中造成數據信息的丟失;二是它也可能會被一些不法分子用來實施欺詐行為。在過去這大半年時間里,不少機構也在反對ChatGPT的使用和進一步研究。
2023年2月3日,IT行業的領導們擔心,ChatGPT已經被黑客們用于策劃網絡攻擊時使用。黑莓(Black Berry)的一份報告調查了英國500名IT行業決策者對ChatGPT這項革命性技術的看法,發現超過四分之三(76%)的人認為,外國已經在針對其他國家的網絡戰爭中使用ChatGPT。近一半的人認為,2023年,將會出現有人惡意使用ChatGPT成功進行網絡攻擊。
2023年4月,中國支付清算協會倡議支付行業從業人員謹慎使用ChatGPT。4月13日,西班牙國家數據保護局和法國國家信息自由委員會分別宣布對ChatGPT展開調查。
在各界人士對ChatGPT存在風險的質疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時而不會帶來新的問題。從這次的功能升級來看,OpenAI試圖通過有意限制新模型的功能,來達到更進一步提升功能和同時帶來新問題的平衡。OpenAI表示,將不斷改進和完善風險緩解措施,未來為大家提供更強大的系統。
總結
ChatGPT自出世以來就引起了廣泛關注,過去近一年時間,OpenAI對其底層模型和界面也進行了多次升級。如今,ChatGPT更是進行了一次重磅升級,新增語音輸入和圖像輸入功能,讓ChatGPT實現了能看、能聽、能說的能力。
與此同時,ChatGPT在使用中存在的風險一直以來也是各界擔心的問題,此次增加的新功能更是可能帶來新的風險。不過在過去這段時間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級中,OpenAI通過一些限制來在實現新功能的同時也避免可能帶來新風險。
-
ChatGPT
+關注
關注
29文章
1558瀏覽量
7595
發布評論請先 登錄
相關推薦
評論