3 月 19 日,Google 在其官方博客上發布了關于 VLOGGER AI 模型的相關信息。這是一款利用用戶提供的肖像照片和音頻內容,使人物生動地呈現音頻內容并具備豐富面部表情的人工智能程序。
具體來說,VLOGGER AI 采用一種適應虛擬肖像的多模態 Diffusion 模型,通過 MENTOR 數據庫進行訓練,涵蓋了超80萬個人物肖像及超過2200小時的視頻數據。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態各異的肖像視頻。
研發團隊指出,相較于之前的同類產品,VLOGGER 的獨特之處在于無需針對每個使用者進行單獨培訓,且不受限于人臉檢測和裁剪,能產出完整的圖像,且能夠處理更多元化的情境如可見的身軀或者其他身份特征,這對于真實再現人物交流過程至關重要。
谷歌將 VLOGGER 視為通往“通用聊天機器人”未來的關鍵一步,使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報告、教育領域以及旁白等方面的輔助工具,并能對已有的電影進行剪輯和表情調整。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
相關推薦
在智能體時代,谷歌再次引領技術潮流,正式發布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實現了顯著提升,更是在多模態表現和
發表于 12-12 14:22
?255次閱讀
谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
發表于 12-12 10:13
?202次閱讀
谷歌最新推出的VLOGGER AI技術引起了廣泛關注,這項創新的多模態模型能夠讓靜態肖像圖“活”起來并“說話”。用戶只需提供一張人物
發表于 03-22 10:45
?835次閱讀
谷歌近日宣布推出其最新研發的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數,其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界中逐
發表于 03-04 14:02
?750次閱讀
谷歌近日發布了其全新的AI模型Genie,這一模型徹底改變了我們與數字世界的互動方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些
發表于 02-28 18:25
?1684次閱讀
谷歌公司近日宣布,其全新的AI大模型Gemma現已在全球范圍內開放使用。這一重要舉措不僅彰顯了谷歌在AI領域的領先地位,還為其在全球范圍內的
發表于 02-28 18:12
?1138次閱讀
谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎世界模型Genie。這一創新技術允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬環境,從而開啟了一個全新的數字體驗時代。
發表于 02-28 17:41
?821次閱讀
近日,谷歌發布了全新AI大模型Gemma,這款模型為各種規模的組織提供了前所未有的機會,以負責任的方式在商業應用中進行分發。
發表于 02-28 17:38
?839次閱讀
近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠將簡單的文本提示、草圖或初步想法迅速轉化為一個可以互動和游戲的虛擬世界。這一突破性的技術無疑將改變人們創建和體驗虛擬世界
發表于 02-28 10:05
?741次閱讀
谷歌模型
北京中科同志科技股份有限公司
發布于 :2024年02月28日 09:13:06
谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年OpenAI的ChatGPT引領
發表于 02-23 11:38
?853次閱讀
在人工智能領域,谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型,都基于谷歌在 2017 年發布的 Transformer 論文;谷歌的
發表于 02-22 18:14
?436次閱讀
近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發的“Space-Time U-Net”基礎架構,旨在
發表于 02-04 13:49
?1028次閱讀
近日,獵戶星空在2024·傅盛的開年AI大課暨獵戶星空企業應用大模型發布會上,正式發布了其最新研發的大模型。這個大
發表于 01-22 14:31
?688次閱讀
谷歌破繭而出,全新發布 Google AI SDK,引領 Android 應用邁向高性能 AI 集成新時代。這次發布的 SDK,專門為 An
發表于 01-03 14:18
?822次閱讀
評論