亚洲日韩国产有码,一个人免费观看www高清,亚洲国产成人久久综合一区77

說(shuō)到智能視頻分析（IVA）應(yīng)用（如交通監(jiān)控、倉(cāng)庫(kù)安全和零售消費(fèi)者分析）的感知，最大的挑戰(zhàn)之一就是遮擋。例如，人們可能會(huì)移動(dòng)到結(jié)構(gòu)性障礙物后面，零售消費(fèi)者可能由于貨架而無(wú)法被完全看到，汽車可能會(huì)被隱藏在大型卡車后面。

本文將介紹如何利用NVIDIA DeepStream SDK中全新的單視角 3D 追蹤功能，來(lái)解決現(xiàn)實(shí)生活中 IVA 部署常見的視覺感知遮擋問(wèn)題。

視覺感知中的視角和投影

在我們的物理世界中，通過(guò)相機(jī)鏡頭觀察到的一些物體的運(yùn)動(dòng)可能看起來(lái)并不穩(wěn)定，這是由于相機(jī)對(duì) 3D 世界的 2D 呈現(xiàn)所造成的。

水星和火星等行星的逆行就是一個(gè)例子，這讓古希臘天文學(xué)家感到困惑。他們無(wú)法解釋為什么行星有時(shí)看起來(lái)會(huì)向后移動(dòng)（圖 1）。

之所以會(huì)出現(xiàn)明顯退行，是由于恒星和行星在夜空中的軌跡所造成的。這些是宇宙 3D 空間中軌道運(yùn)動(dòng)在夜空2D畫布上的投影，如果古代天文學(xué)家知道3D空間的運(yùn)動(dòng)模式，他們就可以預(yù)測(cè)這些行星在2D夜空中的出現(xiàn)。

圖 1. 2014 年（左）和 2016 年（右）

火星在夜空中的逆行運(yùn)動(dòng)軌跡（圖片來(lái)源：NASA）

交通監(jiān)控?cái)z像頭提供了類似的例子。這些攝像頭通常用于監(jiān)測(cè)一個(gè)大面積的區(qū)域，在這個(gè)區(qū)域里，車輛在近場(chǎng)和遠(yuǎn)場(chǎng)的運(yùn)動(dòng)動(dòng)態(tài)可能截然不同。

在視頻 1 中，遠(yuǎn)處的車輛看起來(lái)較小且移動(dòng)緩慢。當(dāng)車輛靠近攝像頭并轉(zhuǎn)彎時(shí)，可以觀察到物體運(yùn)動(dòng)的突然變化。這些變化使得我們?cè)?2D 攝像機(jī)視圖中很難找到常見的模式，因此也很難預(yù)測(cè)車輛未來(lái)可能移動(dòng)的位置。

視頻 1. 近場(chǎng)車輛似乎移動(dòng)得很快，

而遠(yuǎn)場(chǎng)車輛則移動(dòng)得較慢

物體跟蹤本質(zhì)上是對(duì)物體物理狀態(tài)的連續(xù)估計(jì)，同時(shí)隨著時(shí)間的推移來(lái)識(shí)別其獨(dú)特身份。該過(guò)程通常包括對(duì)物體運(yùn)動(dòng)動(dòng)態(tài)進(jìn)行建模和預(yù)測(cè)，以抑制測(cè)量（檢測(cè)）中的固有干擾。從所提供的示例來(lái)看，直接在原生3D空間中對(duì)物體狀態(tài)進(jìn)行估計(jì)和預(yù)測(cè)顯然比在投影的2D 攝像頭圖像平面中效果更好，這是因?yàn)槲矬w存在于3D空間中。

使用 NVIDIA DeepStream進(jìn)行單視角 3D 跟蹤

NVIDIA DeepStream SDK 是一個(gè)基于 GStreamer 的完整流媒體分析工具包，可用于基于 AI 的多傳感器處理，視頻、音頻和圖像理解。DeepStream 6.4 版本引入了一種名為單視角 3D 跟蹤（SV3DT）的新功能，該功能能夠在單攝像頭視圖內(nèi)估計(jì) 3D 物理世界中的物體狀態(tài)。

這一過(guò)程包括使用每個(gè)攝像頭的 3×4 投影矩陣或攝像頭矩陣，將 2D 攝像頭圖像平面上的觀測(cè)測(cè)量轉(zhuǎn)換為 3D 世界坐標(biāo)系。物體在3D世界地平面中的位置表示為物體底部的中心，因此，行人被建模為一個(gè)立在世界地面平面上的圓柱體（具有高度和半徑），圓柱體模型底部的中心是行人的腳部位置（圖 2）。

圖 2. 每個(gè)圓柱形模型的底部中心表示

每個(gè)行人在 3D 世界地平面上的位置（用綠點(diǎn)標(biāo)記）

使用 3×4 投影矩陣和圓柱形人體模型，可以估算出針對(duì)檢測(cè)到物體的 3D 人體模型在 3D 世界地平面上的位置，從而使投影在 2D 攝像頭圖像平面上的 3D 人體模型，與檢測(cè)到的物體的邊界框相吻合。

例如，在圖 3（左）中，灰色邊界框表示對(duì)象檢測(cè)器使用NVIDIA TAO PeopleNet模型檢測(cè)到的物體，紫色和黃色圓柱體代表從 3D 世界地平面上的估計(jì)位置投影到 2D 攝像頭圖像平面的相應(yīng)的 3D 人體模型，投影的 3D 人體模型底部的綠點(diǎn)代表預(yù)估的腳部位置。盡管攝像頭視圖有透視和旋轉(zhuǎn)，但這些位置與實(shí)際腳部位置非常吻合。

圖 3. SV3DT 有助于跟蹤零售消費(fèi)者準(zhǔn)確的腳部位置，

即使存在遮擋也不影響

新推出的 DeepStream SV3DT 功能的一個(gè)重要優(yōu)勢(shì)是，即使存在明顯的局部遮擋，也可以準(zhǔn)確地找到物體的 2D 和 3D 腳部位置，而這是現(xiàn)實(shí)世界 IVA 應(yīng)用中最具挑戰(zhàn)性的問(wèn)題之一。

例如，圖 3（右）顯示了一個(gè)人在狹窄的過(guò)道里購(gòu)物，攝像頭只能看到其上半身的一小部分，這將導(dǎo)致物體邊界框較小，只能捕獲頭部和肩部區(qū)域。在這種情況下，要在全局商店地圖上對(duì)此人進(jìn)行定位就變得極具挑戰(zhàn)性，至少可以說(shuō)，估計(jì)腳部位置是一項(xiàng)非同小可的任務(wù)。

使用邊界框的底部中心作為對(duì)象位置的代表會(huì)為軌跡估計(jì)帶來(lái)很大的誤差。即使使用攝像頭校準(zhǔn)信息將 2D 點(diǎn)轉(zhuǎn)換為 3D 點(diǎn)情況也是如此，尤其是當(dāng)攝像頭透視和旋轉(zhuǎn)較大時(shí)。

DeepStream SDK 中的多目標(biāo)跟蹤器模塊中的 SV3DT 算法，在假設(shè)攝像頭安裝在頭部上方的情況下，通過(guò)利用 3D 人體建模信息來(lái)解決這個(gè)問(wèn)題。大多數(shù)部署在智能空間中的大型攝像頭網(wǎng)絡(luò)系統(tǒng)通常都是這種情況。有了這個(gè)假設(shè)，在估算相應(yīng)的 3D 人體模型位置時(shí)，就可以使用頭部作為錨點(diǎn)。如圖 3 顯示，即使在人被嚴(yán)重遮擋的情況下，SV3DT 算法也可以成功地找到匹配的 3D 人體模型位置。

視頻 2 顯示了在一家便利店中對(duì)消費(fèi)者進(jìn)行跟蹤的情況。需要注意的是，所使用的 3×4 投影矩陣沒(méi)有考慮鏡頭失真，盡管特定的攝像頭有一定的鏡頭失真，正如您所看到的，水平線有點(diǎn)彎曲而不是直線。這會(huì)導(dǎo)致 3D 人體模型位置估計(jì)更加不準(zhǔn)確，尤其是當(dāng)人位于視頻幀的邊緣時(shí)。

盡管如此，人們?cè)诒憷甑?2D 和 3D 腳部位置（用綠點(diǎn)表示）還是被準(zhǔn)確而穩(wěn)健地追蹤到了，這也提高了隊(duì)列長(zhǎng)度監(jiān)控和占用率地圖等其他分析的準(zhǔn)確性。

圖 4 顯示了如何在合成數(shù)據(jù)集中穩(wěn)健地追蹤每個(gè)行人的腳部位置，即使下半身的大部分被貨架等大型物體遮擋。

圖 4. 基于合成數(shù)據(jù)集的嚴(yán)重顆粒遮擋情況下的SV3DT 行人位置跟蹤

我們相信，解決部分遮擋問(wèn)題將為現(xiàn)實(shí)應(yīng)用帶來(lái)許多可能性。SV3DT 目前處于 Alpha 模式，因?yàn)槠鋵?duì)象類型支持有限（僅限站立的人），其他情況（如人們坐著和躺著）或其他對(duì)象類型可能會(huì)在未來(lái)的版本中得到支持。

DeepStream SV3DT 用例

該 DeepStream SV3DT 用例演示了如何在本文介紹的零售商店視頻上啟用單視角 3D 跟蹤，并從管道中保存 3D 元數(shù)據(jù)。如圖 4 和視頻 2 所示，用戶可以從數(shù)據(jù)中可視化凸起的船體和腳部位置。README 還介紹了如何在定制視頻上運(yùn)行該算法。

總結(jié)

NVIDIA DeepStream SDK 中的單視角 3D 跟蹤有助于緩解現(xiàn)實(shí)生活中 IVA 應(yīng)用程序和部署的部分遮擋問(wèn)題。該功能在 6.4 版本中首次推出，并在 7.0 版本中進(jìn)行了增強(qiáng)。具體而言，SV3DT 能夠在局部遮擋的情況下估計(jì)腳部位置，并能夠進(jìn)行更穩(wěn)健和準(zhǔn)確的對(duì)象追蹤，從而實(shí)現(xiàn) 3D 地平面中的準(zhǔn)確定位。依賴或利用地理空間分析的企業(yè)有望從這項(xiàng)技術(shù)中受益。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

傳感器

傳感器

+關(guān)注

關(guān)注
2550

文章
51035

瀏覽量
753083
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4978

瀏覽量
102990
攝像頭

攝像頭

+關(guān)注

關(guān)注
59

文章
4836

瀏覽量
95599

原文標(biāo)題：利用 NVIDIA DeepStream 中的單視角 3D 跟蹤技術(shù)減輕視覺感知中的遮擋現(xiàn)象

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

3D視覺技術(shù)廣闊的應(yīng)用前景

隨著工業(yè)自動(dòng)化領(lǐng)域的迅猛進(jìn)步，對(duì)制造過(guò)程中抓取作業(yè)的精度與效率提出了更為嚴(yán)苛的要求。作為機(jī)械構(gòu)造中的核心組件，活塞桿的精準(zhǔn)抓取成為了保障產(chǎn)品質(zhì)量、提升生產(chǎn)效率的關(guān)鍵環(huán)節(jié)。在此背景下，3D視覺

發(fā)表于 07-29 15:56 ?325次閱讀

OpenCV攜奧比中光3D相機(jī)亮相CVPR 2024

和機(jī)器學(xué)習(xí)軟件庫(kù)，提供豐富的圖像處理和計(jì)算機(jī)視覺算法。奧比中光與OpenCV的深入合作，使得復(fù)雜的3D感知項(xiàng)目開發(fā)變得簡(jiǎn)單高效。全球開發(fā)者及企業(yè)用戶可借助奧比

發(fā)表于 06-21 09:38 ?549次閱讀

蘇州吳中區(qū)多色PCB板元器件3D視覺檢測(cè)技術(shù)

3D視覺檢測(cè)相較于2D視覺檢測(cè)，有其獨(dú)特的優(yōu)勢(shì)，不受產(chǎn)品表面對(duì)比度影響，精確檢出產(chǎn)品形狀，可以測(cè)出高度（厚度）、體積、平整度等。在實(shí)際應(yīng)用中

發(fā)表于 06-14 15:02 ?404次閱讀

奧比中光英偉達(dá)聯(lián)辦3D視覺創(chuàng)新應(yīng)用競(jìng)賽圓滿收官

5月15日，奧比中光與NVIDIA（英偉達(dá)）聯(lián)合主辦的“2024第四屆3D視覺創(chuàng)新應(yīng)用競(jìng)賽”圓滿落幕。

發(fā)表于 05-30 09:37 ?423次閱讀

天馬微電子首發(fā)TIANMA META SIGHT光場(chǎng)3D解決方案

在3D顯示領(lǐng)域，視角的大小和畫面的穩(wěn)定性一直是行業(yè)內(nèi)的難題，TIANMA META SIGHT 3D光場(chǎng)顯示器采用了先進(jìn)的追蹤式超多視點(diǎn)技術(shù)

發(fā)表于 05-23 10:21 ?500次閱讀

奧比中光攜多款3D相機(jī)深度參與國(guó)內(nèi)3D視覺最高規(guī)格會(huì)議

4月19日-21日，國(guó)內(nèi)3D視覺最高規(guī)格會(huì)議China 3DV 2024大會(huì)在深圳舉行。奧比中光作為大會(huì)鉑金贊助商，攜多款不同技術(shù)路線的3D

發(fā)表于 04-24 09:26 ?445次閱讀

3D視覺技術(shù)：物流倉(cāng)儲(chǔ)中的“智慧之眼”

在繁忙的物流倉(cāng)儲(chǔ)中，有一雙“智慧之眼”正在默默守護(hù)著每一個(gè)紙箱的安全與準(zhǔn)確。它就是富唯智能的3D視覺技術(shù)，為紙箱拆碼垛帶來(lái)了前所未有的變革。

發(fā)表于 04-23 16:51 ?450次閱讀

奧比中光3D相機(jī)及方案亮相，攜手NVIDIA探索機(jī)器人應(yīng)用革新

3月18日-21日，奧比中光作為英偉達(dá)NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會(huì)，在美國(guó)加州圣何塞會(huì)議中心帶來(lái)基于奧比中光3D

發(fā)表于 03-22 09:37 ?355次閱讀

奧比中光3D相機(jī)及方案亮相，攜手NVIDIA探索機(jī)器人應(yīng)用革新

3月18日-22日，奧比中光作為英偉達(dá)NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會(huì)，在美國(guó)加州圣何塞會(huì)議中心帶來(lái)基于奧比中光3D

發(fā)表于 03-19 17:20 ?658次閱讀

高分工作！Uni3D：3D基礎(chǔ)大模型，刷新多個(gè)SOTA！

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域，scale up大模型（GPT-4，SAM，EVA等）已經(jīng)取得了很imp

發(fā)表于 01-30 15:56 ?869次閱讀

3D視覺引導(dǎo)3C薄片自動(dòng)化上料

3D視覺引導(dǎo)3C薄片自動(dòng)化上料在當(dāng)今高度自動(dòng)化的制造環(huán)境中，精確、高效地處理薄片類零件至關(guān)重要。特別是在3C行業(yè)，如手機(jī)、電腦等產(chǎn)品的制

發(fā)表于 01-30 11:13 ?525次閱讀

技術(shù)基因＋自主創(chuàng)新，光鑒科技塑造3D視覺感知新范式

感知技術(shù)已經(jīng)滲透到智能汽車、工業(yè)機(jī)器人、服務(wù)機(jī)器人、智慧城市、新零售和智能家居等廣泛領(lǐng)域，憑借精度高、速度快、適配性強(qiáng)、抗干擾能力強(qiáng)等突出優(yōu)勢(shì)，3D視覺感知技術(shù)迅猛發(fā)展之勢(shì)已經(jīng)不可阻擋

發(fā)表于 01-16 00:22 ?1306次閱讀

三星推出裸眼3D游戲顯示器，展出《匹諾曹的謊言》效果

此款顯示器運(yùn)用置于屏幕頂部的雙攝像頭制造3D立體效果，可實(shí)時(shí)追蹤使用者的頭部與眼球運(yùn)動(dòng)，輕松地將二維視頻轉(zhuǎn)化為3D效果。試驗(yàn)中，三星在顯示器運(yùn)行的游戲《匹諾曹的謊言》

發(fā)表于 01-08 14:38 ?839次閱讀

ad中3d封裝放到哪個(gè)層

在廣告中，3D封裝通常放置在視覺設(shè)計(jì)層。視覺設(shè)計(jì)是廣告中至關(guān)重要的一個(gè)層面，通過(guò)圖像、顏色和排版等視覺

發(fā)表于 01-04 15:05 ?1029次閱讀

一文了解3D視覺和2D視覺的區(qū)別

，3D視覺與2D視覺最明顯的區(qū)別在于立體感。2D視覺只有兩個(gè)維度，即寬度和高度；而

發(fā)表于 12-25 11:15 ?3017次閱讀