AIGC大爆發(fā),科技革新不斷,數(shù)字人在各種場(chǎng)景中嶄露頭角,如數(shù)字人主播、數(shù)字人解說員、數(shù)字人導(dǎo)購(gòu)等。根據(jù)真人形象AI生成數(shù)字人分身,這項(xiàng)技術(shù)已經(jīng)從未來走進(jìn)現(xiàn)實(shí)。
數(shù)字人(Digital Human)是指利用計(jì)算機(jī)技術(shù)和人工智能技術(shù),根據(jù)真實(shí)人類的外貌、動(dòng)作、聲音等特征,生成的具有高逼真度以及高交互性的虛擬人物,可以為人類提供多樣化的服務(wù)。
近期,【東風(fēng)生萬(wàn)物】思必馳DFM-2大模型及創(chuàng)新技術(shù)應(yīng)用成果發(fā)布會(huì)上,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱的數(shù)字分身重磅亮相發(fā)布會(huì)現(xiàn)場(chǎng)。
思必馳數(shù)字人生成技術(shù)
思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱
思必馳基于DFM-2大模型推出的自然場(chǎng)景數(shù)字人生成技術(shù),采用擴(kuò)散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,實(shí)現(xiàn)高品質(zhì)數(shù)字人生成,個(gè)性化對(duì)話生成與語(yǔ)音合成模型無(wú)縫結(jié)合,構(gòu)建可自由交互的個(gè)性化數(shù)字形象。思必馳打造的數(shù)字人不僅能說會(huì)道,還精通粵語(yǔ)、四川話、上海話等各地方言及英語(yǔ)、法語(yǔ)、俄語(yǔ)等多國(guó)語(yǔ)言,可應(yīng)用于智能家居、智能車載、智能軌交、市場(chǎng)營(yíng)銷等場(chǎng)景,為人類生活帶來更多可能。
思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱
真人出鏡
就像視頻中的數(shù)字人俞凱教授,無(wú)論是聲音、表情、動(dòng)作還是形象,都與真人高度接近,甚至還可以根據(jù)不同場(chǎng)景,切換語(yǔ)言與人類進(jìn)行交互。
數(shù)字人的打造需要運(yùn)用計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、自然語(yǔ)言處理、智能語(yǔ)音等領(lǐng)域的知識(shí)和技術(shù),從而生成一個(gè)從形態(tài)到聲音上都媲美真人的數(shù)字人。
思必馳基于自研的對(duì)話式語(yǔ)言大模型DFM-2與全鏈路綜合對(duì)話技術(shù)的聯(lián)動(dòng)能力,可快速生成高品質(zhì)的數(shù)字人。在外貌上,思必馳采用擴(kuò)散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,基于真人形象,構(gòu)建出可自由交互的數(shù)字形象。在語(yǔ)音上,思必馳通過聲音復(fù)刻、單人千音、細(xì)粒度情感及風(fēng)格合成、音頻場(chǎng)景合成等系列技術(shù),為數(shù)字人賦予語(yǔ)言能力,讓數(shù)字人變的更加鮮活。
●聲音復(fù)刻為數(shù)字人賦予真人同款聲音。思必馳聲音復(fù)刻技術(shù)服務(wù),支持男聲、女聲、童聲及中、英文和方言復(fù)刻,可輔助用戶打造不同年齡、不同性別的數(shù)字人形象。
●情感合成讓數(shù)字人也能表達(dá)喜怒哀樂。思必馳可合成高音質(zhì)、多情感的音色,呈現(xiàn)“高興、抱歉、撒嬌、中性”等多種情感聲音,為數(shù)字人的情感表達(dá)賦予了更多活力,提升了人機(jī)交互體驗(yàn)。
●單人千音讓數(shù)字人也能說方言外語(yǔ)。思必馳單人千音技術(shù)可以在短時(shí)間內(nèi)快速將單個(gè)發(fā)音人的音色,遷移成為粵語(yǔ)、四川話、上海話、蘇州話、閩南語(yǔ)等方言以及俄語(yǔ)、德語(yǔ)、日語(yǔ)、法語(yǔ)、泰語(yǔ)、西班牙語(yǔ)等外語(yǔ),讓數(shù)字人“青出于藍(lán)而勝于藍(lán)”。
中商產(chǎn)業(yè)研究院發(fā)布的《2023年數(shù)字人產(chǎn)業(yè)發(fā)展白皮書》顯示,2022年我國(guó)數(shù)字人產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)1464億元(同比增長(zhǎng)57%),預(yù)計(jì)2025年全國(guó)數(shù)字人相關(guān)企業(yè)數(shù)量將突破40萬(wàn)家、數(shù)字人產(chǎn)業(yè)市場(chǎng)規(guī)模將達(dá)到2600億元。數(shù)字人將進(jìn)入大規(guī)模應(yīng)用期,轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力為社會(huì)創(chuàng)造價(jià)值。
在市場(chǎng)營(yíng)銷領(lǐng)域,數(shù)字人可用于線上直播進(jìn)行產(chǎn)品營(yíng)銷推廣,降低公司的人力成本;在智能車載領(lǐng)域,數(shù)字人可融入車載系統(tǒng),提供導(dǎo)航、新聞播報(bào)等服務(wù),為用戶帶來更智慧的出行體驗(yàn);在家居領(lǐng)域,數(shù)字人可入駐家電大屏中,為用戶提供菜譜推薦、家務(wù)規(guī)劃、情感陪伴等服務(wù),成為用戶貼心的數(shù)字人管家;在軌交領(lǐng)域,數(shù)字人可在車站提供路線導(dǎo)航、購(gòu)票咨詢、信息咨詢等服務(wù),降低軌交領(lǐng)域人力成本。
相較于真人,數(shù)字人可以不受時(shí)間或空間的限制,隨著大模型技術(shù)的應(yīng)用,數(shù)字人也將持續(xù)釋放價(jià)值。未來,思必馳將基于DFM-2大模型,綜合全鏈路語(yǔ)音交互技術(shù),為用戶帶來更具特色的數(shù)字人形象,加速推進(jìn)AI技術(shù)的應(yīng)用落地。
審核編輯:彭菁
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7488瀏覽量
87854 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238266 -
思必馳
+關(guān)注
關(guān)注
4文章
284瀏覽量
14282 -
數(shù)字人
+關(guān)注
關(guān)注
0文章
127瀏覽量
2027 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2645
原文標(biāo)題:AI生成之?dāng)?shù)字人分身,音畫合一有模有樣
文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論