一级片免费在线播放,亚州在线视频,亚洲综合图片

聲音與AI行為搭配在一起，會發生怎樣的化學反應呢？這一話題，正在成為國內外AI研究比較熱衷的新方向。

比如卡內基·梅隆大學和CMU機器人研究所，就在研究聲音和機器人動作之間的相互作用；國內則從數字人入手，搜狗分身技術團隊聯合清華大學天工智能計算研究院賈珈老師團隊，率先展開了音頻驅動身體動作的研究。

近日二者共同發表的數字人技術論文《ChoreoNet: 基于舞蹈動作單元的音樂-舞蹈合成框架》，就被2020國際頂級盛會ACM Multimedia錄用為長文。

作為計算機領域諾貝爾獎——圖靈獎的評選機構，ACM(國際計算機學會Association for Computing Machinery)的業界地位不用贅述，旗下的ACM Multimedia也被認為是多媒體技術領域奧運級別的頂級盛會，論文接受率很低。

那么，能得到頂會的認可，這一新技術究竟有哪些開創性呢？

聞聲起舞，“樂舞合成”是怎樣實現的？

讓數字人根據文本語義做出相對應的面部表情及肢體動作，目前已經有不少成熟的應用，比如AI合成主播。如果再能夠跟隨音頻做出同步、自然的肢體反應，無疑會在多種場景中產生奇妙的化學反應。

不過，隨聲而動這件事的難度在于，背后需要解決的技術問題不少，比如：

傳統音樂與舞蹈合成的方式是基線法，通過人體骨骼關鍵點的映射，但許多關鍵點難以捕捉和預測，就會出現高度冗余和噪聲，導致合成結果的不穩定、動作節銜接不像真人。

后來，雅爾塔等學者也提出要通過AI的弱監督學習來解決上述問題，但由于缺乏對人類舞蹈經驗知識的了解，依然會出現合成不夠自然、情感表達不夠流暢的問題。

另外，由于音樂片段比較長，背后伴隨著成千上萬的動作畫面，需要智能體記住并映射這種超長的序列也是一大挑戰。

搜狗及清華天工院研究團隊所做的突破，就是將人類專業知識融入算法，提出了一個模仿人類舞蹈編排的程序ChoreoNet，來根據音樂生成動態優美連貫、非線性高度擬真的舞蹈。

簡單來說，ChoreoNet是將專業舞者的各個動作單元與音樂旋律捕捉并數據化，然后讓AI在其中尋找規律，知道在怎樣的音樂節拍、旋律風格中應該做出怎樣的舞蹈動作，進而形成連貫的動作軌跡。

其中，研究人員共突破了兩個環節：

1.舞蹈知識化。用動作捕捉采集專業的人類舞者是如何根據音樂的節奏、旋律來編排動作的。研究人員收集了4種不同類型（恰恰、華爾茲、倫巴和探戈）的舞蹈數據，數個音樂節拍裁剪出一個編舞動作單元(CAUs) 相對應的片段，形成一個動作控制單元（CA），形成一個音樂與動作的映射序列。

2.之前采集的舞蹈動作只是人體骨骼關鍵點數據，怎樣讓它們之間的連續過渡更加自然呢？研究人員借助NLP語義理解，讓AI可以根據積累的知識進行實時反應。利用GAN設計了一個運動生成模型，讓AI可以繪制一些舞蹈動作，補上缺失的數據，從而實現舞蹈的平滑過渡，產生自然的效果。

實驗結果證明，與基線法相比，ChoreoNet性能更好，可以生成持續時間較長的結構化控件，來生成與音樂匹配的動作，并使其自然連接、情感流暢。

在這一突破中，搜狗對音頻驅動身體動作這一課題的敏銳感知，以及AI分身技術在身體動作及姿態生成方面的加成，無疑是領先技術能力與創新意識的絕佳組合。

持續領跑，搜狗與分身技術的不解之緣

可以看到，ChoreoNet的出現，既帶來了人機交互能力的提升，也給機器學習融入了知識元素。這可以看做是搜狗“分身技術”的一次進階，也側面印證了搜狗以“自然交互+知識計算”為核心的AI技術版圖，正在持續狂奔，也得以積蓄起不斷引領技術方向的勢能。

從2018年首創分身技術之后，搜狗的研發腳步從未停止，持續專注于如何以文本及音頻更好驅動數字人的面部表情及唇動進行研究。相繼在2D/3D數字人領域構建了音畫同步、逼真的面部表情唇動生成及驅動能力。

如何能夠讓數字人更加自然并且富有表現力也是搜狗分身的重點研究方向，其中身體動作以及姿態的表達至關重要。在對數字人的面部驅動達到較高標準后，搜狗將研究重點從面部為主的驅動轉到面部+動作的驅動，重點攻關如何讓肢體動作更具自然表現力。如在今年5月推出的3D AI合成主播身上，不僅有經得起高清鏡頭考驗的面部表現，同時實現了以文本語義為驅動的自如行走。

如今，ChoreoNet更進一步，實現了以音頻對AI數字人進行實時驅動。搜狗在業內率先嘗試并取得突破性研發結果的這一舉動，更是一改只能由文本、語義驅動AI分身面部+動作的現狀，為行業帶來了更多的創新可能，搜狗的分身技術理想與實力也躍然紙上。

不斷打造可視化、能自然交互的AI數字人，搜狗到底想做什么？

人機交互的未來，與搜狗的技術遠景

回歸到企業戰略層面，搜狗的AI理念是讓AI賦能于人。通過人機協作，把人從重復性工作中解放出來，更好地解放社會生產力。比如AI主播，就可以讓主持人不再困于朗讀既定內容，可以投身于更具創造性的工作。當然，這一切都要從更自然的人機交互開始，完成一次次交流與觸碰。

而此次ChoreoNet讓數字人跟隨音樂起舞，這個創意的突破不僅僅是技術上夠炫酷，應用空間也非常巨大。

不出意外，搜狗很大可能會將該技術同3D數字人相結合，因為相較2D數字人，3D數字人的肢體靈活性、可塑性驅動更強，從而有更廣泛的應用空間。音頻驅動技術的加入，不僅能豐富搜狗3D數字人在新聞播報、外景采訪的場景，更直接有助于突破融媒體領域、向娛樂、影視等領域落地進軍。可以看到，基于視覺的人機交互會越來越成為主流，比如當前流行的智能客服、虛擬偶像等等，往往需要大量文本、語義的輸入來進行推理與交互，虛擬偶像的動作也需要捕捉后由人工逐幀進行制作，而改為音頻驅動可以更為直接地實現語音交流，節省制作/計算的步驟與成本。

此外，人類知識體系與機器學習的結合，讓AI能力有極大的提升。通過垂直領域的知識數據進行訓練和學習，從而提供更精準、可靠的服務，大大提升AI客服的接受度。

當然，音頻驅動也可以生成更具人性化的個人秘書，幫助人減輕工作負擔、提高效率的同時，通過音頻識別與判斷來實時反應，表現力更加豐富，讓智能家居、服務機器人等更好地融入生活環境，在老人關懷、私人助理、兒童陪伴等等場景之中，扮演更積極的角色。

業內有個共識，一般情況下只有對日常生活和技術突破具有巨大影響潛力的研究項目，才會被ACM Multimedia通過和錄取。從這個角度看，搜狗與清華天工院所做的工作，遠遠不只是學術上的突破那么簡單。當全球科技巨頭都在探索如何用多模態交互締造新玩法、新功能的時候，搜狗已經向前邁出了讓人眼前一亮的步伐。

讓數字人更像人，就能更早地與人類達成親密無間的配合與協作，對于人類和AI來說，同樣重要。也正由于此，世界頂級盛會才會投注認可與鼓勵。下一次，搜狗會為數字人集齊怎樣的能力呢？我們拭目以待。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人機交互

人機交互

+關注

關注
12

文章
1208

瀏覽量
55415
搜狗

搜狗

+關注

關注
0

文章
90

瀏覽量
13937
3D

3D

+關注

關注
9

文章
2885

瀏覽量
107604
數字

數字

+關注

關注
1

文章
1693

瀏覽量
51327
清華

清華

+關注

關注
0

文章
15

瀏覽量
18734

啟英泰倫新推出多意圖自然說，重塑離線人機交互新標準！

智能語音識別技術作為人機交互領域的一場革命性突破，正逐步重塑我們與智能設備的交互方式。近期，啟英泰倫新推出了多意圖自然說技術，進一步增強了人機交互的自然流暢度與操作便捷性。AI語音2.

發表于 01-03 16:01 ?92次閱讀

啟英泰倫新<b class='flag-5'>推出</b>多意圖自然說，重塑離線<b class='flag-5'>人機交互</b>新標準！

浪潮信息與智源研究院攜手共建大模型多元算力生態

近日，浪潮信息與北京智源人工智能研究院正式簽署戰略合作協議，雙方將緊密合作，共同構建大模型多元算力開源創新生態。此次合作旨在提升大模型創新研發的算力效率，降低大模型應用開發的算力門檻

發表于 12-31 11:49 ?204次閱讀

新的人機交互入口？大模型加持、AI眼鏡賽道開啟百鏡大戰

Chat AI眼鏡、蜂巢科技推出的界環AI音頻眼鏡等，不同品牌推出的新品都有其各自的定位。與此同時，在市場需求的帶動下，越來越多企業進入AI眼鏡賽道。 ? ? 全新的人機交互入口已現？大模型

發表于 11-21 00:57 ?2918次閱讀

具身智能對人機交互的影響

在人工智能的發展歷程中，人機交互一直是研究的核心領域之一。隨著技術的進步，人機交互的方式也在不斷演變。從最初的命令行界面，到圖形用戶界面，再到現在的自然語言處理和語音識別，每一次技術的突破都極大

發表于 10-27 09:58 ?355次閱讀

字節跳動與清華AIR成立聯合研究中心

近日，清華大學智能產業研究院（AIR）與字節跳動共同宣布成立“可擴展大模型智能技術聯合研究中心”（SIA Lab），并在

發表于 10-12 15:24 ?400次閱讀

基于傳感器的人機交互技術

基于傳感器的人機交互技術是現代科技發展的重要領域之一，它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術，包括其基本原理、關鍵技術、應用領域以及未來

發表于 07-17 16:52 ?851次閱讀

人機交互界面是什么_人機交互界面的功能

人機交互界面（Human-Computer Interaction Interface，簡稱HCI或HMI），也被稱為人機界面（MMI）、操作員界面終端（OIT）、本地操作員界面（LOI）或操作員

發表于 06-22 11:03 ?2602次閱讀

香港城市大學與富士康鴻海研究院成立聯合研究中心

計算等領域的創新研究項目。近日，聯合研究中心的揭幕儀式舉行。主禮嘉賓包括城大校長梅彥昌教授、鴻海研究院執行長兼資通安全研究所所長利瓦伊斌博

發表于 06-21 14:37 ?446次閱讀

易華錄無錫數據湖與清華大學蘇州汽車研究院（吳江）合作挖掘智能駕駛數據新價值

6月15日，易華錄無錫數據湖與清華大學蘇州汽車研究院（吳江）數字工業中心就“聚焦汽車智能駕駛領域，共同挖掘智駕數據新價值”舉行了簽約儀式。清華大學蘇州汽車研究院顧問、數字工業中心主任王

發表于 06-18 15:00 ?930次閱讀

人機交互與人機界面的區別與聯系

隨著信息技術的飛速發展，人機交互（Human-Computer Interaction，HCI）已成為現代社會不可或缺的一部分。人機交互技術，作為實現人與計算機之間有效通信的橋梁，不僅改變了我們

發表于 06-07 15:29 ?1026次閱讀

中山聯合光電：精密光學實驗室簽約落地長春理工大學中山研究院

5月7日，中山聯合光電研究院有限公司與長春理工大學中山研究院“付秀華精密光學薄膜實驗室”簽約儀式在中山聯合光電科技股份有限公司正式舉行。聯合

發表于 05-10 10:08 ?776次閱讀

人機交互的三個階段 人機交互的常用方式

機交互經歷的三個階段：命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。

發表于 03-13 17:25 ?3144次閱讀

DEKRA Stan Zurkiewicz拜訪清華大學蘇州汽車研究院，探討汽車行業安全發展

3月12日，DEKRA德凱集團董事會主席兼首席執行官Stan Zurkiewicz先生一行拜訪清華大學蘇州汽車研究院，探討汽車行業安全發展。

發表于 03-13 16:46 ?1043次閱讀

人機交互技術有哪幾種 人機交互技術的發展趨勢

人機交互技術是指人與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術。隨著科技的進步，人機交互技術也在不斷發展創新。以下將介紹人機交互技術的幾種常見形式以及當前的發展趨勢。一

發表于 01-22 17:47 ?3724次閱讀

院士專家齊聚！京彩未來聯合重點研究院創建數字空間聯合實驗室

1月6日，京彩未來與北京大學數字中國研究院華南分院暨廣東省數字廣東研究院共同創建的“數字空間共同體聯合室驗室”正式掛牌運營。著名經濟學家管清友博士、北京大學數字中國

發表于 01-08 18:15 ?367次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

人機交互的未來搜狗聯合清華天工研究院推出ChoreoNet模型

評論

啟英泰倫新推出多意圖自然說，重塑離線人機交互新標準！

浪潮信息與智源研究院攜手共建大模型多元算力生態

新的人機交互入口？大模型加持、AI眼鏡賽道開啟百鏡大戰

具身智能對人機交互的影響

字節跳動與清華AIR成立聯合研究中心

基于傳感器的人機交互技術

人機交互界面是什么_人機交互界面的功能

香港城市大學與富士康鴻海研究院成立聯合研究中心

易華錄無錫數據湖與清華大學蘇州汽車研究院（吳江）合作挖掘智能駕駛數據新價值

人機交互與人機界面的區別與聯系

中山聯合光電：精密光學實驗室簽約落地長春理工大學中山研究院

人機交互的三個階段人機交互的常用方式

DEKRA Stan Zurkiewicz拜訪清華大學蘇州汽車研究院，探討汽車行業安全發展

人機交互技術有哪幾種人機交互技術的發展趨勢

院士專家齊聚！京彩未來聯合重點研究院創建數字空間聯合實驗室

搜索歷史

人機交互的未來 搜狗聯合清華天工研究院推出ChoreoNet模型

評論

人機交互的未來搜狗聯合清華天工研究院推出ChoreoNet模型