視頻生成模型 Sora 的效果驚艷了全球,從宣布至今,我們時常能夠看到各種基于 Sora 生成的視頻在互聯網上流傳,盡管它有一些小瑕疵,但其效果依然引入驚嘆。我們已經迫不及待地想像當初 ChatGPT 發布一樣能夠立即使用上 Sora,然而在近日,據 OpenAI CTO Mira Murati 在采訪中表示,Sora 目前還在開發和測試階段,OpenAI 計劃在今年內的某個時間發布 Sora,目前仍在打磨中,且正在進行外部測試。
除了這個發布時間之外,Mira 還披露了 Sora 的其他幾個關鍵信息:
關于 Sora 生成視頻的時間:對于 720P 分辨率或 20 秒長視頻,生成時間大概在幾分鐘,這取決于提示的復雜性。
目前視頻依然沒有聲音,但未來 Sora 可能會支持視頻音效。
在 Sora 的訓練之中,Sora 的數據源是大家頗為關心的問題。當被問及 Sora 訓練的素材是否包括 YouTube、Instagram 和 Facebook 上的視頻時,Mira Murati 的回答是不確定的。她沒有明確確認這些平臺的視頻是否被用作訓練數據,稱 Sora 的訓練數據來自公開可用和授權的數據,最后結束后確認訓練數據包括 Shutterstock 的內容。
計算資源:Sora 的生成過程相比之前 ChatGPT 需要更多的計算資源,OpenAI 正在致力于優化技術,相信未來應該也會和此前 Altman 所講的 GPT 一樣,成本得到大幅降低,最終能夠極大地便于公眾使用。
安全性和可靠性:Sora 目前正在進行紅隊測試(測試工具的安全性、可靠性和缺陷),以識別潛在的漏洞、偏見和其他有害問題。
內容限制:與 DALL-E 類似,Sora 在生成內容時也會有一些限制,例如不生成公眾人物的圖像(但 DALL-E 很神奇的是能夠生成公司 logo),以避免誤導和濫用。
裸露內容:關于裸露內容的處理,提到 OpenAI 正在與藝術家和創作者合作,以確定工具應該提供的靈活性水平和合理的限制,但沒有具體提到如何區分藝術和色情的內容。
正在研究對視頻進行水印標記,但是相對于水印,視頻內容的審核限制更為重要,因為隨著生成的視頻更加真實,用戶將無法分辨視頻內容的真實性,防止生成誤導內容。
對于 Sora 我們至今依然只能通過它的技術報告論文以及各種討論里尋找蛛絲馬跡,這也給復現 Sora 帶來了極大的難度。目前國內潞晨科技、北京大學與兔展已初步實現了 Sora 復現的方案并均已開源,并取得了不錯的反饋。除了精準控制這一視頻生成的重要模塊之外(Sora 本身也正在致力于解決精準控制這一問題),對于復現目前面臨的最大難題依然是算力不足和數據源的需求,從 Mira Murati 的分享中我們也可以一窺其未來方向。
審核編輯:劉清
-
OpenAI
+關注
關注
9文章
1079瀏覽量
6481 -
ChatGPT
+關注
關注
29文章
1558瀏覽量
7595 -
Sora
+關注
關注
0文章
81瀏覽量
195
原文標題:Sora 將于今年正式發布!OpenAI CTO Mira Murati 披露 Sora 未來
文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論