前方請注意,一款機器人正在對你微笑!
該機器人由來自中國的哥倫比亞大學計算機科學專業在讀博士生陳博源主導研發,它的名字叫夏娃(EVA)。
陳博源告訴 DeepTech,夏娃的命名源于希伯來語,意為 “生命 “。相關論文已于 5 月 30 日在 ICRA 會議上發表,論文名為《從心而笑:用學習模型驅動機器人臉》Smile Like You Mean It: Driving Animatronic Robotic Face with Learned Models,陳博源擔任第一作者。今年 4 月,機器人的早期藍圖也已經在 Hardware-X 上開源。
目前,多數機器人都是靜態面孔、或者執行預先設計好的表情,但隨著酒店機器人等 C 端產品的普及,面部更加逼真、且能根據不同情景表達多樣表情的機器人,也成為科學家們的研究對象。
夏娃的誕生耗時五年左右,陳博源的導師霍德?利普森(Hod Lipson)說:“夏娃的想法在幾年前就形成了,當時我和我的學生開始注意到我們實驗室里的機器人正用它那塑料的、大大的眼睛盯著我們看。” 有次在雜貨店里,他看到一個補貨機器人,它帶著一頂舒適的手工編織帽。
當時霍德就想,人們通過給機器人設計眼睛、身份或名字,來增加它們的人性化,如果眼睛和衣服都有效,為什么不制造一個擁有超級表情和反應靈敏的人臉機器人呢?
然而說易行難,過去幾十年來,機器人的身體都由金屬或塑料制成,由于材料過硬導致機身無法像人體組織那樣流動和移動。
但是,模仿人類的面部表情,是讓機器人實現自適應面部反應的第一步。盡管這類系統具有實際價值,但現有研究主要集中在硬件設計和預先編程的面部表情上,即允許機器人從預定義的集合中選擇一個面部表情。
而人類能實現的表情復雜且多樣,因此具備該能力的機器人研發仍有一定挑戰性。
幾年前,夏娃項目的第一階段啟動,最初的夏娃是一個無實體的藍色半身像。之所以用藍色,是因為研究者希望避免機器人和人類過于相似,那種設計非常容易導致 “恐怖谷” 效應(Uncanny Valley),該效應指的是對于會威脅到人類存在的事物,人類會產生本能的反感和恐懼。
研究中,該團隊給夏娃設計了一款皮膚,其面部柔軟而富有表情,還能和人類表情相匹配。使用基于視覺的自我監督學習框架,可把夏娃的學習過程分為生成模型和逆模型,從而實現準確和多樣化的面部模仿。
牽動臉部 42 塊微小肌肉,表達 6 種基本情緒
具體來說,他們使用尼龍線和馬達來牽引夏娃臉上的柔性硅膠臉皮,這種機械結構構成了夏娃臉部的人造 “肌肉”。
憑借不同 “肌肉” 部位的拉伸和收縮,夏娃會表達憤怒、厭惡、恐懼、喜悅、悲傷和驚訝等六種基本情緒。
而通過附著在夏娃皮膚和骨骼不同點上的 42 塊微小肌肉,它可表達的表情遠超預先編程方法可達到的范圍。
創造夏娃的最大挑戰,是設計一個足夠緊湊的系統。該系統能讓它適應人類頭骨的范圍,同時還能具備足夠的功能以產生各種面部表情。
為克服該挑戰,陳博源等人使用 3D 打印來制造各種零件,這些零件能和夏娃的頭骨無縫集成在一起。結合上面提到的自監督學習系統,可讓夏娃的學習過程完全不依賴于任何來自人來的數據集。
經過團隊初期的努力,夏娃的微笑、皺眉甚至是不高興,都會給實驗室成員帶來情緒反應。
陳博源的導師霍德說:“有一天,當夏娃突然給我一個大大的、友好的微笑時,我正忙著自己的事,我知道這純粹是機械性的,但我發現自己不由自主地回以微笑。”
夏娃會笑了!接下來,他們要對指導夏娃面部動作的 AI 程序進行編程。編程之后,假如有人來到夏娃身邊,它可使用深度學習來 “閱讀” 人類表情。
但他們很快意識到,夏娃的面部運動過程過于復雜,因此無法被預定義的規則集控制。為應對該挑戰,陳博源和團隊使用多個深度學習神經網絡,創建出了夏娃的 “大腦”。
該“大腦” 具備兩大能力:讓夏娃通過大量的隨機運動,來了解自己復雜的機械系統能夠做出的各種表情;其次,在 “閱讀” 人類面孔后能夠想象:如果夏娃要模仿同樣的表情,自己看起來應該是什么樣子的呢?
為了讓夏娃知道自己的機械結構和臉部結構之間的對應關系,團隊記錄下了數小時夏娃在鏡頭面前隨意運動的影像,就像人類在鏡子前觀看自己一樣,夏娃的內部神經網絡(逆模型)學會了將肌肉運動、和自己臉部的視頻片段進行配對。
這時,夏娃對其自我形象已經具備初步了解,接下來通過另一個深度神經網絡(生成模型),它會將自我形象與目標面部表情特征進行匹配。
經過多次迭代和兩個神經網絡,夏娃最終可以閱讀人類的表情,并且對不同的表情進行實時模仿。
夏娃 2.0:設計上做出重大升級
基于夏娃 1.0,陳博源和即將加入其所在實驗室攻讀博士學位的胡宇航,在本次論文中提出了夏娃 2.0,把此前設計做了重大升級。
據他介紹,夏娃 2.0 由兩個子模塊組成:面部運動模塊和頸部運動模塊。
研究中,他們倆使用微型伺服電機來驅動夏娃表面的所有部件,這些部件都基于現成的硬件組件,可以自行 3D 打印或者去網上購買。
夏娃 2.0 還有一個基于學習的通用框架,能讓它從視覺觀察中學習面部模擬,從而模仿人類的不同表情。
更重要的是,該方法無需依賴人類監督來提供命令,其關鍵思想是將問題分解為兩個階段:(1) 給定標準化的人類面部特征之后,首先使用生成模型合成具有同樣表情的機器人自我圖像;(2)然后,利用逆網絡輸出的電機指令來驅動機器人做出對應表情。
相關實驗表明,該方法優于此前基于最近鄰搜索的算法、以及從人臉到動作的直接映射方法。此外,夏娃的模仿可視化表明,對于不同的人類對象,該方法可模仿出準確的面部表情。
陳博源介紹稱,該研究概括了 12 個人類受試者和近 400 個不同的面部表情。經測試發現,夏娃的響應時間約為 0.18s,實時反應能力較強。
在夏娃 2.0 中,其面部運動模塊可以進一步分為顱骨框架、眼睛模塊、肌肉模塊和顎模塊。團隊還重新設計了顱骨框架的三維形狀,為的是擴大機動空間,讓夏娃做更靈活的運動。新的頭骨框架,也讓其皮膚連接更緊密,面部外觀更光滑、更自然。
通過增加一對球關節和三對平行四邊形機制,還可確保夏娃 6 自由度的眼球模塊可在 ±20?的水平和垂直范圍內自由移動,每個眼球的旋轉由兩個電機和三個球關節連桿控制。此外,基于人臉的眼瞼設計也得到升級。
為了減少肌肉控制噪音,陳博源讓每根尼龍繩穿過連接頭骨前部、和電機的透明乙烯基管,這樣可確保每塊肌肉的變形與電機的旋轉角度成正比。
我們可以和機器人建立信任嗎?
夏娃只是一項實驗室設備,它還不能像人類那樣使用面部表情,去進行復雜的交流。但是,這種可對各種人體面部表情語言做出反應的機器人研究,將對機器人在工作場所、醫院、學校和家庭中發揮重要作用。
陳博源認為,未來機器人與人類的交互只增不減,因此和機器建立信任也變得越來越重要。
概括來說,該團隊提出了一種新的軟皮膚、以及基于視覺系統的電子機器人臉感知系統,并介紹了一個兩階段的自我監督學習框架人臉模擬。
其實驗表明,在各種條件下,兩階段算法均能提高模仿人類面部表情的準確性和多樣性,并能實現實時規劃,有望給實際應用開辟新的機會。
陳博源表示,模仿——是賦予機器人更復雜技能的重要一步。但是,對于交互式社交機器人來說,生成適當的反應也是必不可少的。
更廣泛地說,構建交互式機器人需要對他人情感、欲望和意圖進行更高水平的理解。因此對他來說,未來一個有趣的方向是探索機器人的高階思維。
陳博源生于 1994 年,談及學習經歷,他告訴 DeepTech,其本科就讀于吉林大學電子科學與工程學院,大四做畢設時,獲得去英國曼徹斯特大學訪問的機會。本科畢業后,因為喜歡紐約的藝術氣息,申請來到哥倫比亞大學讀碩士。
后來在 TedTalk 看到目前導師霍德的演講,并被后者深深吸引,霍德的演講曾是 TedTalk 上點擊率最高的機器人主題演講,出于對學術大牛的崇拜,以及剛好項目上有合作,陳博源來到霍德教授組(創意機器實驗室)讀博士,目前是博士最后一年。
談及未來就業,他說無論是教職機會和工業界機會,都會考慮一下。至于夏娃的未來,他表示希望不斷對軟硬件功能升級,使得夏娃可以作為一類研究平臺,為教育、醫療領域的認知機器人做出重要貢獻。
原文標題:具備6種情緒,還會跟著奧巴馬一起笑!26歲吉大畢業生研發軟皮膚機器人,已被ICRA 2021接收 | 專訪
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
機器人
+關注
關注
211文章
28390瀏覽量
206957 -
AI
+關注
關注
87文章
30763瀏覽量
268914
原文標題:具備6種情緒,還會跟著奧巴馬一起笑!26歲吉大畢業生研發軟皮膚機器人,已被ICRA 2021接收 | 專訪
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論