其他優(yōu)勝作品包括 AI 驅(qū)動的虛擬試衣應用和一款能夠?qū)ふ疫z失物品的機器人等。
YouTube 機器人技術主播 Dave Niewinski 開發(fā)的機器人五花八門,從可駕駛的“La-Z-Boy”椅子到由 AI 引導的扔沙包機器人、馬車比賽機器人等。
他最近的交互式電子動畫 GLaDOS 項目成為了 Hackster AI 創(chuàng)新挑戰(zhàn)賽的九個優(yōu)勝作品之一。約 100 名參賽者通過創(chuàng)建開源項目、推動 AI 在邊緣計算、機器人和物聯(lián)網(wǎng)領域的應用,來角逐由 NVIDIA 與 Sparkfun 提供的獎品。
Niewinski 根據(jù)視頻游戲開發(fā)商 Valve 的第一人稱解謎系列游戲《傳送門》(Portal)中的 GLaDOS 向?qū)ВO計出了一個創(chuàng)新機器人,該機器人贏得了生成式 AI 應用組第一名。
另兩位優(yōu)勝者 Andrei Ciobanu 和 Allen Tao 分別獲得了邊緣生成式 AI 模型和邊緣 AI 應用組的一等獎。Ciobanu 利用生成式 AI 幫助實現(xiàn)虛擬試衣,而 Tao 所開發(fā)的基于 ROS 的機器人可通過繪制家庭內(nèi)部地圖來幫助尋找物品。
將 LLM 應用于機器人
Niewinski 在其位于加拿大安大略省滑鐵盧的 Armoury Labs 開發(fā)定制化的機器人應用。他使用 NVIDIA Jetson 平臺開發(fā)邊緣 AI 和機器人技術,并根據(jù)自己的經(jīng)驗創(chuàng)建開源教程和 YouTube 視頻。
為了給自己配備一名實驗室私人助理,他制作了一個自己的 GLaDOS 交互機器人。該機器人使用基于 Transformer 的語音識別、文本轉(zhuǎn)語音和大語言模型(LLM)處理查詢,這些功能與模型均在 NVIDIA Jetson AGX Orin 上運行,可與機械臂和攝像頭進行交互。
GLaDOS 可以追蹤 Niewinski 在實驗室中的行蹤,能夠朝不同的方向移動來面對他,并對詢問作出快速反應。
Niewinski 表示:“我喜歡用機器人做一些出乎人們意料的事情。”
他希望這個助手的聲音能像《傳送門》中的原版 GLaDOS 一樣,并且能夠迅速作出反應。幸運的是,游戲公司 Valve 把《傳送門》和《傳送門 2》中的所有語音臺詞都放在了自己的網(wǎng)站上,Niewinski 可以下載該音頻來訓練模型。
他提到:“使用 Jetson 的話,一般的問答語音都能快速運行。”
Niewinski 利用 NVIDIA 的開源 NeMo 套件對 GLaDOS 的語音進行了微調(diào),訓練出一個名為 FastPitch 的頻譜生成器網(wǎng)絡和一個名為 HiFiGAN 的聲碼器網(wǎng)絡來提高音頻質(zhì)量。
這兩個網(wǎng)絡都被部署到搭載 NVIDIA Riva 的 Orin 上,將語音識別與合成功能的運行速度優(yōu)化到數(shù)倍于語音的實時速度,使其能夠與 LLM 同步運行并保持流暢的交互傳輸。
為了讓 GLaDOS 生成符合現(xiàn)實的回答,Niewinski 使用了一個名為 OpenChat 的本地托管 LLM,該模型在 Docker 中運行,來自 jetson-containers。所有這些 AI 都在 Jetson 模塊上運行,使用的是由 CUDA 和 JetPack 構建的最新開源 ML 軟件堆棧。
為了讓 GLaDOS 能夠移動,Niewinski 專門為宇樹科技 Z1 機械臂開發(fā)了交互功能。GLaDOS 可以通過一個立體攝像頭和多個模型來觀察和追蹤人類語言,其機械臂周圍裝上了 3D 打印的 GLaDOS 頭部和身體外殼。
借助生成式 AI 試遍新款服裝
來自羅馬尼亞的 Winner Ciobanu 希望借助生成式 AI 提升虛擬試衣體驗,他的作品 EdgeStyle: Fashion Preview at the Edge 奪得了第一名。
他使用 YOLOv5、SAM、OpenPose 等 AI 模型,從圖像和視頻中提取并完善數(shù)據(jù),然后使用 Stable Diffusion 生成圖像,他表示Stable Diffusion是實現(xiàn)精準虛擬試穿的關鍵所在。
Ciobanu 提到,這個系統(tǒng)教會了模型如何將衣服“穿”在不同姿勢的人身上,從而增強了試穿的真實感。
“這個系統(tǒng)非常方便,可以讓用戶不用真的去實際試穿,就能看到衣服穿在身上的效果。”
他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上順利運行 AI 模型所需的所有工具。
“AI 技術日新月異,擁有一套穩(wěn)定的工具非常有用。它確實為我們這些開發(fā)者節(jié)約了時間,減少了麻煩,讓我們能夠擺脫技術問題的困擾,把更多精力放在構建很酷的東西上。”
讓機器人幫助尋找遺失物品
加拿大安大略省的獲獎者 Winner Tao 創(chuàng)造的機器人可以幫助人們在家中尋找遺失物品。他的 An Eye for an Item 項目贏得了 Hackster 挑戰(zhàn)賽的第一名。
Tao 提到:“尋找丟失的物品是一件苦差事,而近期零樣本物體檢測和 LLM 領域的最新進展使計算機可以根據(jù)文字或圖片描述為我們檢測任意物體,這帶來了實現(xiàn)自動化的可能性。”
Tao 表示自己需要機器人的計算能力來對任何非結構化環(huán)境中的物體進行分類,比如客廳、大型倉庫等。他還需要機器人執(zhí)行實時計算以進行導航定位,并在更大規(guī)模的物體檢測模型上進行推理。
他表示:“Jetson Orin 是一個絕佳的選擇,它支持從使用 NanoDB 查詢文本和圖像到實時里程反饋等一切功能,包括使用 Isaac ROS 的硬件來加速 AprilTag 檢測進行漂移校正。”
審核編輯:劉清
-
機器人
+關注
關注
211文章
28379瀏覽量
206913 -
語音識別
+關注
關注
38文章
1739瀏覽量
112634 -
ROS
+關注
關注
1文章
278瀏覽量
17001 -
邊緣計算
+關注
關注
22文章
3084瀏覽量
48891 -
ai技術
+關注
關注
1文章
1266瀏覽量
24285
原文標題:AI 大顯身手:GLaDOS 交互機器人入選 Hackster.io 挑戰(zhàn)賽 9 個優(yōu)勝作品之一
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論