亚洲欧美国产高清va在线播放,在线免费看,一个人看的日本www

最近，麻省大學Amherst分校的Yang Zhou博士和他的團隊提出了一種具有深度結構的新方法「MakeItTalk」。給定一個音頻語音信號和一個人像圖像作為輸入，模型便會生成說話人感知的有聲動畫圖。

富有表現力的動畫誰都想要！

面部動畫在很多領域都是一項關鍵技術，比如制作電影、視頻流、電腦游戲、虛擬化身等等。

盡管在技術上取得了無數的成就，但是創造逼真的面部動畫仍然是計算機圖形學的挑戰。

一是整個面部表情包含了完整面部各部分之間的相互關系，面部運動和語音之間的協同是一項艱巨的任務，因為面部動態在高維多重影像中占主導地位，其中頭部姿勢最為關鍵。

二是多個說話人會有不同的說話方式，控制嘴唇一致，不足以了解說話的人的性格，還要表達不同的個性。

針對上述問題，Yang Zhou博士和他的團隊提出了一種具有深度結構的新方法「 MakeItTalk」。

這是一種具有深度架構的新方法，只需要一個音頻和一個面部圖像作為輸入，程序就會輸出一個逼真的「說話的頭部動畫」。

下面，我們就來看看，MakeItTalk的是如何讓圖片「說話」的。

都給我開口說話！神奇的 MakeItTalk 是什么？

MakeItTalk是一個新的深度學習為基礎的架構，能夠識別面部標志、下巴、頭部姿勢、眉毛、鼻子，并切能夠通過聲音的刺激使嘴唇發生變化。

模型以LSTM 和 CNN 為基礎，可以根據說話人的音調和內容，讓面部表情和頭部產生隨動。

本質上， MakeItTalk將輸入音頻信號中的內容和說話人分離出來，從產生的抽象表示中提取出對應的動畫。

而嘴唇和相鄰面部的協同也尤為重要。說話者的信息被用來獲取其他面部表情和頭部動作，而這些對于生成富有表現力的頭部動畫是必需的。

MakeItTalk模型既可以生成逼真的人臉說話圖像，也可以生成非逼真的卡通說話圖像。

聲音+圖像=「開口說話」？MakeItTalk是如何做到的？

下面的圖表顯示了生成逼真的說話頭像的完整方法和途徑：

（1）一個音頻剪輯和一個單一的面部圖像可以制作一個與音頻協調的，能感知說話者的頭部動畫。

（2）在訓練階段，使用現成的人臉檢測器對輸入的視頻進行預處理，提取標記，從輸入的音頻中訓練基礎模型，實現語音內容轉動畫和標記的精確提取。

（3）為了獲得高精度的運動，通過對輸入音頻信號的分離內容和說話人嵌入來檢測標記點的估計。為此，采用語音轉換神經網絡對語音內容進行提取，發現語音內容。

（4）內容與說話者無關，并且捕獲了嘴唇和相鄰部位的常見運動，其中說話內容調節了動作的特征和說話者頭部動作的剩余部分。

（5）嘴唇的大小和形狀隨著眼睛、鼻子和頭部的運動而擴大，這取決于誰說了這個詞，也就是說話人身份。

（6）最后，為了生成轉換后的圖像，MakeItTalk采用了兩種算法進行標記到圖像的合成：

對于非真實感的圖像，如畫布藝術或矢量藝術，一個特定的畸變方法是在 Delaunay triangulation 的基礎上部署；

對于真實感圖像，構建一個圖像到圖像的轉換網絡（與 pix2pix 相同），直接轉換自然人臉。

最后，混合所有的圖像幀和音頻共同生成頭部動畫。

作者簡介

該項目的作者本科畢業于上海交通大學電子工程系，然后在喬治亞理工學院獲得了碩士學位，現在是馬薩諸塞大學阿默斯特分校計算機圖形學科學研究小組的一名計算機科學博士生。

Yang Zhou在計算機圖形學和機器學習領域工作。主要致力于用深度學習技術來幫助藝術家、造型師和動畫師做出更好的設計。

如果也想給你的設計加點AI的基因，Yang Zhou的論文列表絕對是個不錯的選擇，有很多關于動畫生成和多模態深度學習的研究。
責編AJX

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

音頻

音頻

+關注

關注
29

文章
2882

瀏覽量
81631
模型

模型

+關注

關注
1

文章
3254

瀏覽量
48894
圖片

圖片

+關注

關注
0

文章
203

瀏覽量
15949

中國移動與南京大學合作研發高保真2D數字人說話系統

近日，中國移動宣布了一項重要合作成果——聯合南京大學團隊成功研發出高保真2D數字人說話驅動系統。作為全球用戶規模最大的通信運營商，中國移動每年的客戶服務運營成本居高不下。盡管智能語音客服已得到

發表于 12-13 11:32 ?347次閱讀

開口式電流互感器功能及使用場景

開口式互感器是一種特殊類型的電流互感器，其主要特點是可以在不切斷電纜或母線的情況下進行安裝，這對于正在運行的電力系統改造項目尤為重要。開口式互感器的設計允許它直接穿過電力系統的導線，無需斷電操作

發表于 12-05 10:28 ?204次閱讀

兆元光電與廈門大學攜手，Mini/Micro LED技術將迎新突破

進行深入合作，推動Mini/Micro LED技術的研發和應用。圖片來源：兆元光電此次合作將充分利用廈門大學在電子技術領域的科研優勢和兆元光電在技術應用方面的行業經驗，計劃通過聯合研發

發表于 11-29 09:40 ?200次閱讀

現代起亞聯合大學設立機器人研發實驗室

據外媒報道，現代汽車集團旗下的現代汽車和起亞汽車于當地時間周三共同宣布，他們已經攜手首爾大學、浦項科技大學以及韓國科學技術研究院，共同創立了一個專注于機器人技術研發的實驗室。

發表于 10-25 16:00 ?370次閱讀

開口式互感器好不好開口電流互感器有什么缺點

安科瑞徐赟杰18706165067 開口式互感器是一種常用于測量電流的傳感器。它通過將導線穿過一個開口，利用線圈中的磁場感應原理來測量電流的強度。本文將以“開口式互感器好不好”和“開口

發表于 09-27 09:22 ?513次閱讀

安科瑞AKH-0.66系列開口式電流互感器

概述：?[AKH開口式電流互感器]?是一種專門設計用于低壓電力測量的設備，它屬于[開口式電流互感器]的一種，具有高安全性和方便的安裝特性。這種互感器由一個閉合的璧式鐵芯組成，中間開有一個口，用于容納

發表于 09-26 10:37

2024年芯片行業有多難？用數據說話

2024年芯片行業有多難？用數據說話

發表于 08-10 18:20 ?4344次閱讀

日本大學研發出新極紫外(EUV)光刻技術

近日，日本沖繩科學技術大學院大學（OIST）發布了一項重大研究報告，宣布該校成功研發出一種突破性的極紫外（EUV）光刻技術。這一創新技術超越了當前半導體制造業的標準界限，其設計的光刻設備能夠采用更小巧的EUV光源，并且功耗僅為傳

發表于 08-03 12:45 ?1059次閱讀

未來的眼睛: 南京大學團隊研發出眼動追蹤隱形眼鏡

近日，中國南京大學聯合江蘇省人民醫院、南京航空航天大學的研究團隊研發出一種具有眼動追蹤功能的隱形眼鏡，外觀和普通隱形眼鏡無異

發表于 05-20 10:18 ?536次閱讀

智慧場館解決方案，讓場館“會說話”！

在十四五規劃文件和數字經濟發展報告中，都有明確指出加快建設數字城市，數字中國，旨在深化改革，持續推進我國場館事業高質量發展。從傳統場館管理到智慧場館，數字化的發展讓我們實現了場館“會說話”的完美轉型

發表于 04-25 15:34 ?355次閱讀

HarmonyOS開發案例：【圖片編輯】

基于canvas組件、圖片編解碼，介紹了圖片編輯實現過程。

發表于 04-22 16:42 ?939次閱讀

未來之聲 | 人形機器人說話篇：無聲！

隨著一個個有關人形機器人的“核彈式”新聞的出現，機器人技術肉眼可見地快速發展?；蛟S，與人們預想的“像人一樣說話”不同，未來人形機器人說話方式是：無聲！

發表于 04-13 08:00 ?304次閱讀

清華大學研發成功大規模干涉-衍射異構集成芯片——太極

4月12日公布，清華大學研發出太極芯片，實現了每瓦160TOPS的高性能通用智能計算，這是該校電子工程系與自動化系共同攻克的難題。

發表于 04-12 15:50 ?461次閱讀

鴻蒙開發教學-圖片的引用

該接口通過圖片數據源獲取圖片，支持本地圖片和網絡圖片的渲染展示。其中，src是圖片的數據源。

發表于 02-01 17:36 ?717次閱讀

觸覺智能正式成為吉林大學實習實踐基地

近日，觸覺智能與吉林大學正式達成了實習實踐基地合作，這個合作的達成標志著雙方在教育與企業之間搭建了一座連接的橋梁，讓高校老師科研項目更貼近市場需要，讓優秀的科研成果得到有效轉化，讓優秀

發表于 01-12 08:32 ?354次閱讀