“人形機器人”,如今在外界眼中,簡直是“冬天里的一把火”。暴雪加寒潮,是這幾天的天氣特色,而人形機器人概念股,卻火熱得很。
寒潮天氣來臨前,人形機器人的專屬新政出爐了。11月2日,工信部印發了《人形機器人創新發展指導意見》(下稱“意見”)。
意見描繪出人形機器人的可期前景,甚至給出了確切的時間表。意見提出,到2025年,人形機器人創新體系初步建立,并實現批量生產;到2027年,綜合實力達到世界先進水平。
人形機器人的賽道,如今熱鬧喧囂了很多。但在外界眼中,那群長期探索中的知名從業者們,他們浸淫多年的感知和邏輯,卻依然影影綽綽,猶如迷霧一般。
源于此,筆者將兩個多月前的世界機器人大會期間,智創未來人形機器人技術與產業發展論壇上,專家、學者以及企業家等的演講以及對話等內容進行編輯,梳理出賽道內權威人士的所做所思所想,以供參考。
01
未來最大變量?
黃曉慶締造達闥科技已有8年之久,他有一個深切感知——“機器人為什么必須是人形”,是機器人行業一直爭論的問題。
黃曉慶是達闥科技創始人兼CEO、中國云計算專委會副主任。他喜歡從過往找答案。
一百多年前,福特夢想造一輛“不用馬的馬車”,從model A一直制造到model T,世界汽車工業革命也由此開始。
人形機器人誕生至今,也已走過上百年的漫長歲月。演變期間,有潮漲潮落,但從未止息。
黃曉慶看到,日本自1973年造出第一臺人形機器人后,研究從未中斷,即使在“福島事件”后進入低潮期,也并未停止;另一個“工業強國”德國,也同樣對人形機器人的研究孜孜以求。
“人形機器人,將是未來人機共存的第一選擇。”黃曉慶判斷。他認為,機器人的發展演進,與AI發展從專用小模型到通用大模型的轉變類似,路徑是從專用機器人到通用機器人。這一前提下,人形機器人同時具備:自動適應人類環境、使用人類工具、進行自然語言交互三個特點。
姚期智是2000年圖靈獎獲得者、中國科學院院士、清華大學交叉信息研究院院長。他最近在思考:人工智能的下一步是什么?
“未來的AGI(通用人工智能),需要有具身的實體。”姚期智思考過后得出結論。
姚期智說,人類本身,是世界上相當理想的一個具身智能體,其基本具備三個成分,即身體、小腦和大腦。其中身體的部分,應該就是人形機器人。
丹尼斯·洪(Dennis Hong)是美國加州大學洛杉磯分校教授、RoMeLa實驗室創始人,他從小就癡迷機器人,長大后延續了小時候的夢想。
丹尼斯·洪還是小孩時,就夢想和機器人一起生活。他發現,家庭環境是為人設計的,比如樓梯、門把手等都是由人來使用,因此他認為,機器人最好是人形的。“過去二十年當中,我們都專注于人形機器人的研究。”丹尼斯·洪說。
馬克·雷伯特(Marc Raibert)是美國波士頓動力公司創始人兼首席執行官,他是有名的長期主義者。他認為,機器人人工智能,由運動智能和認知智能兩部分組成。認知智能是人類頭腦思考中的意象。運動智能涉及如何使用自己的身體。
馬克·雷伯特發現,人類擁有非常高超的運動智能,哪怕僅僅幾歲的孩童,也具備這一智能。于是,他試圖賦予機器人運動智能。
宇樹科技創始人兼首席執行官王興興坦言,“前幾年,我個人有點悲觀,我甚至覺得世界科技已經停滯,紅利殆盡”,然而從去年底開始,他重新燃起了斗志。
這源自于通用性AI進展,遠超他個人預期,他感受到,目前通用人形機器人需要的AI,已經慢慢趨于成熟。去年底,他們立項做通用人形機器人。
“未來五到十年間,新工業革命、新經濟增長,都會誕生,”王興興說。
王興興認為,人形機器人與通用AI結合,是未來整個人類科技和經濟增長最大的變量。
02
堅守者的野望
周劍稱,很多年前他就提及,人類需要人形機器人來賦能生活。
周劍是優必選科技創始人、董事長兼首席執行官,優必選則是他締造的一家人形機器人公司,在該領域沉浸已有11個年頭。
在周劍看來,人形機器人并不缺應用場景。
在工業場景當中,他看到,如今幾乎所有的汽車生產線,ABB、庫卡用工業機械手臂到最后汽車組裝線,集體上陣的情況下,現場依然有大量工人。很多頭部企業擁有幾十萬規模的生產線工人。這個未來可以由人形機器人去替代。
“人形機器人和傳統智能化的設備去協作作業,用來解決復雜場景的柔性無人化的工廠,這才是未來機器人或者汽車智慧的超級無人工廠。”周劍說。
未來市場空間到底有多大?周劍預估稱,目前一個擁有50萬工人的汽車工廠,如果能節省10%的工人數量,就是5萬人,按每人節省6、7萬美金來算,這意味著,一個To B的工廠可能有幾十億美金的市場。
在生活場景當中,這里到處都要符合人體工程學,人形機器人尤其適合,在這一環境里陪伴人類,一起工作、學習、生活。
尤其是AI大模型的不斷發展之下,不同的大學、科研機構、公司,都用AI大模型,讓夢想不斷照進現實。
王興興認為,去年開始,人形機器人越來越火熱,這與馬斯克的身體力行脫不開關系,國內資本層面也與國外進行了對標。過去該領域高潮與低谷,已循環了很多個周期。“很難想象,十年前,AI是個冷門行業,如果不是去年生成式AI出現爆發性增長,可能AI又進入一個新低谷時期,但是,現在整個AI迭代速度已越來越快。”
馬克·雷伯特和其團隊的研究,可以追溯到15年前,他們開發了各種各樣的機器人,比如大狗機器人、野貓機器人、spot機器人、物流機器人stretch、人形機器人Atlas等等。
馬克·雷伯特將三個機器人,代表了波士頓動力公司的今天、明天和未來。其中正在開發的人形機器人Atlas代表未來。spot機器人和物流機器人stretch則分別代表今天、明天。
“人形機器人Atlas,我們管它叫未來機器人,因為目前它還算不上真正意義的機器人,”馬克·雷伯特說。
Atlas機器人有一個機載的計算機,還附有電池,四肢上大概有28個不同的傳感器或者一個視覺系統,可以幫助它看到前方的地形。馬克·雷伯特透露,最近他們正在研究Atlas的移動操控能力。
馬克·雷伯特認為,硬件工程,對于未來的機器人技術非常重要,它和軟件同等重要。“有人認為,軟件可以克服硬件上的所有問題和限制,但我個人并不贊同。我認為,只有最好的硬件設計師和軟件設計師傾力合作,才能夠設計出世界上最好的機器人。”
除了運動智能,認知智能也同等重要。馬克·雷伯特表示,他們創立了一個新的機構叫人工智能研究院,在現代集團的支持下,該院致力于具有運動智能和認知智能的智慧機器人。
丹尼斯·洪則講述了“ARTEMIS”人形機器人研發過程的波折。它花了團隊6年時間研發出來。2018年,它僅僅是停留在紙面上的一個簡單草圖。2019年,眾籌到12萬美金開始啟動。2020年疫情來襲,項目剛起步,實驗室卻被迫關閉。“但是我們沒有就此止步,在家里繼續研究,在寢室、臥室里,開著線上會議……”丹尼斯·洪回憶稱。
丹尼斯·洪進一步回憶說,“2021年1月,動態評估期;2月,第一次讓它站起來,好像不太成功;3月,第一次開始讓它做平衡工作,做推、拉,讓它地面開始震顫,進行站穩、平衡等各種實驗……2022年10月,它第一次穩定地走路,這是一個非常重大的成功;12月,第一次出現嚴重的故障,這對于通過力控制的機器人,如果有問題就會失去平衡,幾乎是自我摧毀,當時給我們很大的打擊,后續給樣機修理,花了很長時間。”
今年3月,“ARTEMIS”人形機器人正式發布,其特點就是,在極度的踢打測試中仍能保持平穩,奔跑速度達到2.1米/秒。它可以踢足球,還參加了2023年機器人世界杯足球賽。丹尼斯·洪說,比賽結束后,他發現比爾·蓋茨關注了他。
03
突進與阻力的較量
近年來,出現眾多知名廠商被迫放棄,或暫停多年研發成果的現象。比如,去年3月,本田Asimo正式宣布退役,其經歷14年的技術攻關后才誕生,之后的命運卻是,誕生12年、經歷七次迭代,最終結束生命周期。那之前,軟銀Pepper機器人于2021年已經停產,只存活了6年。
究其原因,“先烈們”折在了兩點上,一個是功能未達客戶可以買單的要求,二則是成本過高。
早年間,最基本的一體化關節,都要成立專門的公司,但近年來,智能制造以及工業機器人的長足發展,使得上下游產業鏈極大拉通,用產量來降低成本,正在照進現實。
除此之外,ChatGPT引發的生成式AI熱潮,也為其打開了一扇新大門。
王興興是新進者,他看到,現有大模型技術可以直接拿來用,或移植,或裁剪,對于人形機器人來說,只要一個小模型或中等模型,就足夠了。
日本大阪大學教授Hiroshi Ishiguro,對未來的一個暢想是,人類會使用各種不同的機器人以及替身,幫助展開各種活動。這意味著,人類想要發展人類與機器人共生的社會,而不是發展僅僅由機器人支持的社會。
啟動交互式機器人項目20多年來,Hiroshi Ishiguro制造了許多的機器人、類人機器人、替身以及計算機圖形替身。
Hiroshi Ishiguro的感受是,得益于大語言模型的問世,他們可以重點研究機器人更高層次的語言認知的功能。
他進一步稱,通過融合大型語言模型與面部表情、手勢等機器人的技術,他們可以研究許多模態的集成和多模態的表達,然后可以將意圖或者欲望,賦予機器人或類人機器人。
“我認為,意識是未來10年當中,最重要的問題之一,”Hiroshi Ishiguro說。
黃曉慶認為,機器人是人類的第三臺計算機,未來機器人的編程和安卓手機、windows PC的編程沒有本質區別。“ChatGPT的出現、5G的發展,開啟了一個用人工智能和云端機器人技術,來解放生產力的時代,這是一次非常重要的工業革命。”
突進之下,阻力也顯而易見。
黃曉慶看到,目前大模型缺乏機器人數據,沒有足夠多的行為數據,就沒辦法支持機器人的控制。需要把更多行為數據融進去,進行二次訓練,等機器人有了行為能力、空間能力,就可以進一步加快多模態大模型,可以叫它robot GPT。
“robot GPT是機器人的大腦。”黃曉慶說。
英國曼徹斯特大學終身教授、吉林大學唐敖慶講席教授任雷,二十多年來,他同時在做兩件事,一是仿生機器人,二是人體科學。
任雷的深切感受是,目前仿人機器人跟人類相比,在運動性上相差太遠,包括它的運動經濟性、運動機敏性、運動多樣性、環境適應性和運動的可塑性等等。
“現在我們把目光又轉向到了人體,人體是怎么設計的,能帶來哪些啟示,能不能有一條新的仿生的技術,帶來新型的仿人機器人,這是我們團隊目前在探索的。”任雷說。
德國慕尼黑工業大學教授Alois C. Knoll認為,人形機器人目前主要的障礙,在形態上。現在做一個數據中心的計算機比較容易,但做一個機械臂,讓其能完全模仿人的手臂,就比較困難,所以讓機器人像人一樣行走,也比較困難。
另外,Alois C. Knoll說,能源供應等問題,也需要新技術突破。還有一個較為遙遠的難題,即如何讓系統開發出一個自己的智慧,比如有自己的感知或靈魂,這涉及倫理問題。
王興興說,通用大模型本身,不是給通用機器人用的,其目前已把文本或文字邏輯處理好了,但它是靜態的,它對環境認知和感知基本是零。沒辦法認知物理環境,就沒法抓取,做一些操作。
王興興看到,谷歌對此事非常用心。十年來一直在做機器人AI相關的事情。“大家現在非常希望,給人形機器人或通用機器人,做一個專用的大模型出來。”
清華大學交叉信息研究院助理教授、星動紀元創始人陳建宇認為,當前機器人技術在硬件和軟件等方面都取得了長足的發展,但是仍然存在許多技術瓶頸。比如在硬件方面,機器人需要兼顧力量、速度、精度和成本等因素,但目前沒有一種技術能夠同時滿足這些要求。例如,液壓技術力量和速度強,但成本高,而高減速比諧波電機技術雖然精度高但靈活性有限。因此,目前的解決方案是平衡各種技術,根據不同的應用場景選擇不同的技術路線。未來,人們希望出現一種新技術,能夠像人一樣兼顧所有因素。
陳建宇發現,軟件也存在很大問題,目前還無法很好兼顧其泛化性和控制的任務操作的精巧性,比如谷歌Robotic Transformer系列,可以做到很泛化,但是控制的精度比較低,控制頻率就很低,做任務基本在操作控制層面,做相對簡單一些的任務。
陳建宇還看到,安全性的問題。實驗過程中出現的各種問題,具備一定的可解釋性,但如果用大模型、神經網絡,很難解釋它會不會出現一個非常危險的動作。“用ChatGPT對話時,它說錯一些字詞,關系不大。但是作為一個機器人,進入我們生活中時,這個就至關重要,這些都亟待新技術去改進。”
Alois C. Knoll也“潑出一瓢冷水”稱,人形機器人演變至今,已有百年之久,期間進展非常緩慢,如今不能把標準設得太高,或把市場胃口吊得太高,創造出一個類似于投機的氛圍來,甚至變成一個泡沫。“這是一個難而又難的高端頂級研究,或許比通用性AI要慢,可能不會快速見到巨變。”
“人形機器人,還有許多山峰需要翻越,”Alois C. Knoll強調。
編輯:黃飛
?
評論
查看更多