2018年底,在第五屆世界互聯網大會上,“克隆”于真人主播邱浩的全球首個AI合成男主播“首秀”,由新華社聯合搜狗發布,很快在全球范圍內引起熱議。
陳偉,搜狗語音交互技術中心高級總監,同時也是新華社AI主播項目的負責人。他表示,從去年11月到現在,新華社工作的兩位AI主播已經播報了幾千余條新聞,沒有出現過失誤。
今年2月19日,男主播升級成為站立式AI合成主播“新小浩”,站立式“新小浩”不僅能坐著播報新聞,還能站起來,帶著手勢、姿態等多種肢體動作,更接近于真人。與此同時,雙方還推出了首個AI合成女主播“新小萌”。
在新華社,基于兩位真實主播的聲音、表情等真實數據生成模型,工作人員僅需要輸入新聞稿,就可以讓AI形象自動根據文字播報。并且,無需進行二次視頻編輯,AI主播將自動識別語義并配上對應音調及表情。
“我們提供的系統,新華社只要每天在想要播報的新聞,過幾秒鐘生成一個完整的視頻,中文、英文不同類型的新聞視頻就可以馬上出來。”陳偉表示。我們看到,AI主播的能力在不斷進化,2月發布的“新小浩”開始加入肢體動作,讓主播的表達方式更加多元化。
AI合成主播來自于搜狗AI分身項目的落地,基于多種模態識別融合的技術,包括語音、手寫、唇語等維度的識別和模擬,僅需數個小時的視頻資料就可以合成一個比較逼真的真人形象。
“逼真度”是衡量AI主播效果的一個重要指標。陳偉向機器之心表示,在初期,團隊采用主觀的方式來衡量AI分身的真實度,最近逐漸考慮采用一些客觀標準,比如與真人視頻每一幀畫面進行比對。
近日,一段“換臉楊冪版”的《射雕英雄傳》在網上廣泛流傳,關于AI換臉和模擬真人技術的討論上升到社會層面,比如將技術用于不正當目的的倫理問題。
陳偉對此回應,首先, “分身”與“換臉”(deepfakes)在技術層面有著本質的差別,“換臉實際上是把一個人臉映射到另一個人臉上,前期投入成本很大,但‘分身’一旦建模之后,只需要輸入文字就可以生成視頻,不需要任何表演成本在里面。”
在技術使用的規范問題上,陳偉表示, “搜狗選擇和明確的公司、在明確的領域合作,盡量通過場景圈定技術的使用范圍,這樣的好處就是不會把技術濫用。
-
搜狗
+關注
關注
0文章
90瀏覽量
13927 -
AI
+關注
關注
87文章
30763瀏覽量
268913
原文標題:對話搜狗陳偉:AI合成主播下一步將如何進化?
文章出處:【微信號:robotn,微信公眾號:產業大視野】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論