電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)感知系統(tǒng)是人形機(jī)器人實(shí)現(xiàn)智能交互和自主行動(dòng)的關(guān)鍵組成部分。該系統(tǒng)通常包括多種傳感器和算法,用于收集、處理和分析來自外部環(huán)境的信息。不同企業(yè)所采用的感知系統(tǒng)會有所不同,如優(yōu)必選、小米科技、宇樹科技等。
人形機(jī)器人感知系統(tǒng)包括哪些傳感器和算法
人形機(jī)器人感知系統(tǒng)包括各種傳感器,如視覺傳感器:通過模擬人類雙眼視覺系統(tǒng)的觀測原理,利用雙目相機(jī)、深度相機(jī)、激光雷達(dá)等獲取周圍環(huán)境的真實(shí)空間信息。例如,特斯拉在人形機(jī)器人上采用純視覺方案,使用三顆攝像頭實(shí)現(xiàn)低成本的環(huán)境感知。
位置傳感器:如IMU(慣性測量單元),用于測量機(jī)器人的運(yùn)動(dòng)及姿態(tài)信息。關(guān)節(jié)力控傳感器:包括一維壓力傳感器和一維力矩傳感器,用于測量關(guān)節(jié)的力和力矩信息。特斯拉在每個(gè)線性關(guān)節(jié)和旋轉(zhuǎn)關(guān)節(jié)上分別放置這些傳感器,以實(shí)現(xiàn)高精度的運(yùn)動(dòng)控制。
手腕和腳踝傳感器:采用六維力矩傳感器,提供手腕和腳踝的力和力矩信息。這些傳感器對于提高機(jī)器人的靈巧性和穩(wěn)定性至關(guān)重要。
觸覺傳感器:增加手部觸覺傳感器可以提高機(jī)器人手部的靈巧性能。特斯拉在手部使用了10個(gè)觸覺傳感器,而其他廠商也在探索基于視覺方案的觸覺傳感器。
算法方面,如視覺感知算法,包括雙目三維環(huán)境感知、3D點(diǎn)云配準(zhǔn)、位姿估計(jì)算法等,用于實(shí)現(xiàn)對外界環(huán)境的真實(shí)刻畫及數(shù)字模型的重建。
數(shù)據(jù)融合算法:將來自不同傳感器的數(shù)據(jù)進(jìn)行融合,提高感知系統(tǒng)的準(zhǔn)確性和魯棒性。
一般來說,人形機(jī)器人的感知系統(tǒng)會采用多模態(tài)感知,通過集成多種傳感器,實(shí)現(xiàn)視覺、位覺、觸覺等多模態(tài)感知,以獲取更全面的環(huán)境信息,另外還需要高精度和實(shí)時(shí)性,采用高精度傳感器和算法,可以確保感知系統(tǒng)能夠準(zhǔn)確感知外部環(huán)境的變化,感知系統(tǒng)需要具備高實(shí)時(shí)性,以確保機(jī)器人能夠及時(shí)響應(yīng)環(huán)境變化。
市面上的人形機(jī)器人都采用怎樣的感知技術(shù)
目前市面上已經(jīng)有多款人形機(jī)器人,如優(yōu)必選的人形機(jī)器人Walker X,它的感知系統(tǒng)主要由高性能伺服關(guān)節(jié)、多維力覺、多目立體視覺、全向聽覺、慣性及測距等全方位的感知技術(shù)構(gòu)成。
具體來看,Walker X擁有41個(gè)高性能伺服關(guān)節(jié),這些關(guān)節(jié)不僅具備高轉(zhuǎn)矩(4.5Nm-200Nm)和高轉(zhuǎn)速(30rpm-90rpm)的特點(diǎn),還通過精確的控制算法實(shí)現(xiàn)了快速而穩(wěn)定的運(yùn)動(dòng)。這些伺服關(guān)節(jié)是Walker X感知系統(tǒng)的重要組成部分,為機(jī)器人的四肢提供了靈活而有力的支持。
Walker X具備多維力覺感知能力,能夠?qū)崟r(shí)感知機(jī)器人四肢與外界環(huán)境的接觸力大小和方向。這種感知能力使得Walker X能夠在復(fù)雜環(huán)境中進(jìn)行柔順的物理交互,確保人機(jī)交互的安全性。
Walker X采用了多目立體視覺技術(shù),通過多個(gè)攝像頭捕捉周圍環(huán)境的三維信息。這種技術(shù)使得Walker X能夠?qū)崟r(shí)感知物體的位置、形狀和大小等信息,為機(jī)器人的導(dǎo)航、避障和物體識別等任務(wù)提供了重要的支持。
另外,Walker X的全向聽覺系統(tǒng)能夠?qū)崟r(shí)感知來自四面八方的聲音信息。通過先進(jìn)的音頻處理算法,Walker X能夠準(zhǔn)確識別語音指令、環(huán)境噪音等信息,并與用戶進(jìn)行自然的語言交互。
Walker X還配備了慣性和測距傳感器,用于實(shí)時(shí)感知自身的姿態(tài)、速度和位置等信息。這些傳感器能夠確保Walker X在行走、導(dǎo)航等任務(wù)中的穩(wěn)定性和準(zhǔn)確性。
小米科技的人形機(jī)器人CyberOne,其感知系統(tǒng)由多個(gè)傳感器和先進(jìn)的算法組成,使得機(jī)器人能夠?qū)崟r(shí)感知周圍環(huán)境,進(jìn)行自主運(yùn)動(dòng)及決策。該系統(tǒng)集成了多種感知技術(shù),包括視覺、聽覺、力覺等,確保機(jī)器人在各種復(fù)雜環(huán)境中都能做出準(zhǔn)確的反應(yīng)。
視覺感知方面,CyberOne搭載了自研的Mi-Sense深度視覺模組,結(jié)合AI算法,使其具有完整的三維空間感知能力。該視覺系統(tǒng)能夠?qū)φ鎸?shí)世界進(jìn)行三維虛擬重建,為機(jī)器人的導(dǎo)航、避障和物體識別等任務(wù)提供重要支持。同時(shí),通過深度學(xué)習(xí)和計(jì)算機(jī)視覺技術(shù),CyberOne能夠?qū)崿F(xiàn)人物身份識別、手勢識別、表情識別等功能,從而與人類進(jìn)行更自然的交互。
聽覺感知方面,CyberOne具備全向聽覺系統(tǒng),能夠?qū)崟r(shí)感知來自四面八方的聲音信息。結(jié)合自研的MiAI環(huán)境語意識別引擎和MiAI語音情緒識別引擎,CyberOne能夠識別85種環(huán)境音和6大類45種人類情緒,實(shí)現(xiàn)更智能的交互體驗(yàn)。
力覺感知方面,CyberOne具備多維力覺感知能力,能夠?qū)崟r(shí)感知機(jī)器人四肢與外界環(huán)境的接觸力大小和方向,確保人機(jī)交互的安全性。CyberOne還配備了慣性和測距傳感器,用于實(shí)時(shí)感知自身的姿態(tài)、速度和位置等信息,確保機(jī)器人在行走、導(dǎo)航等任務(wù)中的穩(wěn)定性和準(zhǔn)確性。
宇樹科技人形機(jī)器人Unitree G1的感知系統(tǒng)是其實(shí)現(xiàn)智能化交互和高效任務(wù)執(zhí)行的核心部分。視覺感知方面,Unitree G1搭載了Intel RealSense D435攝像機(jī)和LIVOX-MID360 3D激光雷達(dá),這些先進(jìn)的視覺傳感器共同構(gòu)成了G1的全方位探測與感知能力。通過這些傳感器,G1能夠?qū)崿F(xiàn)360°的探測感知,極大地增強(qiáng)了其對周圍環(huán)境的理解和適應(yīng)性。
傳感器配置方面,Unitree G1配備Intel RealSense D435攝像機(jī),這是一款高性能的RGB-D攝像機(jī),能夠提供深度信息和彩色圖像,幫助G1識別物體和人員,以及構(gòu)建周圍環(huán)境的三維模型。Unitree G1還配備LIVOX-MID360 3D激光雷達(dá),這款激光雷達(dá)能夠掃描周圍的環(huán)境,為G1提供精確的距離測量和障礙物檢測,確保機(jī)器人在復(fù)雜環(huán)境中的安全導(dǎo)航。
寫在最后
目前而言,隨著人工智能技術(shù)的發(fā)展,人形機(jī)器人的感知系統(tǒng)將更加智能化,能夠更好地理解和響應(yīng)人類的需求。未來的感知系統(tǒng)也將更加模塊化,可以根據(jù)不同的應(yīng)用場景和需求進(jìn)行靈活配置和擴(kuò)展。同時(shí),隨著傳感器和算法的不斷發(fā)展,人形機(jī)器人感知系統(tǒng)的成本將逐漸降低,人形機(jī)器人也將會更加普及和實(shí)用。
-
傳感器
+關(guān)注
關(guān)注
2550文章
51035瀏覽量
753067 -
算法
+關(guān)注
關(guān)注
23文章
4607瀏覽量
92828 -
感知系統(tǒng)
+關(guān)注
關(guān)注
1文章
70瀏覽量
15940 -
人形機(jī)器人
+關(guān)注
關(guān)注
2文章
443瀏覽量
16549
發(fā)布評論請先 登錄
相關(guān)推薦
評論