ABSTRACT摘要
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據書面命令立即創建短視頻。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據書面命令立即創建短視頻。
Sora 并不是第一個展示這種技術的產品。但行業分析師指出,該工具迄今為止展示的視頻質量很高,并指出它的推出標志著 OpenAI 和文本到視頻生成的未來的整體重大飛躍。
盡管如此,與當今快速發展的人工智能領域的所有事物一樣,此類技術也引發了人們對潛在道德和社會影響的擔憂。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據書面提示創建長達 60 秒的視頻。該模型還可以從現有的靜態圖像生成視頻。
生成式人工智能是人工智能的一個分支,可以創造新的東西。示例包括聊天機器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統生成視頻是更新且更具挑戰性的,但依賴于一些相同的技術。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根據用戶的文本提示創建長達一分鐘的視頻。
OpenAI 在帖子中表示:“我們正在教人工智能理解和模擬運動中的物理世界,目的是訓練模型來幫助人們解決需要現實世界交互的問題。”
OpenAI 在帖子中補充道:“Sora 能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節的復雜場景。” “該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。”
此外,根據該帖子,生成式人工智能模型可以基于單個圖像創建視頻,以及擴展現有視頻或填充缺失的幀。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發布該工具之前,它正在與政策制定者和藝術家進行接觸),而且還有很多我們不知道的事情。但自周四宣布以來,該公司已經分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執行官 Sam Altman 還利用 X(以前稱為Twitter 的平臺)要求社交媒體用戶及時發送想法。后來,他分享了逼真詳細的視頻,這些視頻響應了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動物進行自行車比賽,運動員在無人機攝像機視圖下騎自行車”等提示。
雖然 Sora 生成的視頻可以描繪復雜、極其詳細的場景,但 OpenAI 指出仍然存在一些弱點,包括一些空間和因果元素。例如,OpenAI 在其網站上補充道,“一個人可能會咬一口餅干,但之后,餅干可能沒有咬痕。”
OpenAI 的 Sora 并不是同類產品中的第一個。谷歌、Meta 和初創公司 Runway ML 等公司都展示了類似的技術。
-
機器人
+關注
關注
212文章
28938瀏覽量
209719 -
AI
+關注
關注
87文章
32504瀏覽量
271708 -
人工智能
+關注
關注
1800文章
48107瀏覽量
242250
發布評論請先 登錄
相關推薦
評論