作者：極鏈科技曾啟澔

前言

隨著前端生態(tài)的發(fā)展，Java已經(jīng)不僅僅局限于作為網(wǎng)頁開發(fā)，也越來越活躍于服務(wù)器端，移動端小程序等應(yīng)用開發(fā)中。甚至通過Electron等打包工具，甚至能夠開發(fā)多系統(tǒng)的桌面應(yīng)用。其涉足的領(lǐng)域?qū)挿阂彩沟媚軌驅(qū)崿F(xiàn)的功能也不再是簡單的UI控件制作和內(nèi)容的展示，在互動娛樂，小游戲領(lǐng)域也有著極大的發(fā)展前景。本文以通過Java開發(fā)一個(gè)基于瀏覽器攝像頭的實(shí)時(shí)人物動作捕捉小程序?yàn)槔榻B一下前端在這一領(lǐng)域的可行性。

什么是TensorFlow

TensorFlow 最初是由Google大腦小組的研究員和工程師們開發(fā)出來，采用數(shù)據(jù)流圖（Data Flow Graphs）用于機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)方面數(shù)值計(jì)算的開源軟件庫。其高度的可移植性和多語言性使得它可以通過各種常用編程語言編寫，輕松的運(yùn)行在多種平臺的設(shè)備上。是一個(gè)集性能，可靠性，通用性，易用性為一體的強(qiáng)大開源庫。

本文所使用的開源Java模型庫：

l tfjs-models/posenet: 一個(gè)機(jī)器學(xué)習(xí)模型，功能為對圖像或者視頻中的人物進(jìn)行動作捕捉，輸出人體各個(gè)部位的keypoints（坐標(biāo)集）。具有單一人物分析和多人物分析的特點(diǎn)。

l tfjs-models/body-pix: 一個(gè)機(jī)器學(xué)習(xí)模型，功能為對圖像或者視頻中人物和背景進(jìn)行分析，將人物從背景中剝離出來，輸出結(jié)果為人體24個(gè)部位在畫面中的像素位置。具有將人物與背景分離的功能。

實(shí)現(xiàn)原理

本文所介紹的基于瀏覽器和網(wǎng)絡(luò)攝像頭的人物實(shí)時(shí)動作捕捉方法，其實(shí)現(xiàn)原理是通過Java調(diào)用

*在基本的原理中

通過tfjs-models/posenet模型庫實(shí)現(xiàn)人物動作捕捉

l基本配置

· 導(dǎo)入JS

· HTML

· 初始化網(wǎng)絡(luò)攝像頭

· 生成posenet對象

參數(shù)說明：

architecture：分為MobileNetV1和ResNet50兩個(gè)體系，其中ResNet50精度更高但處理速度較慢。

outputStride：輸出結(jié)果每個(gè)像素占用字節(jié)數(shù)，數(shù)字越小結(jié)果越精確，但處理的成本和時(shí)間更多。

inputResolution：輸入圖像壓縮后的尺寸，數(shù)字越大越精確，但處理的成本和時(shí)間更多。

multiplier：僅在MobileNetV1體系中使用，卷積運(yùn)算的深度（通道數(shù)），數(shù)字越大層數(shù)越多越精確，但處理的成本和時(shí)間更多。

l執(zhí)行實(shí)時(shí)分析

l結(jié)果

· 多人捕捉：多人捕捉時(shí)能夠獲得畫面中人物的keypoints，互相之間有一定的干擾但影響并不是特別大。

· 單人捕捉：很容易被背景及身邊人物干擾，導(dǎo)致人體keypoint定位不準(zhǔn)確。

l缺點(diǎn)

通過實(shí)際的效果可以看到，該模型可以在多人物的時(shí)候準(zhǔn)確捕捉到各個(gè)人物的動作和身體部位的keypoints，雖然存在若干干擾和不穩(wěn)定但基本能夠接受，實(shí)時(shí)性效果好，但是無法區(qū)分主要人物和次要人物，需要開發(fā)者對結(jié)果數(shù)據(jù)進(jìn)行處理。

其score的生成是根據(jù)形狀準(zhǔn)確度來計(jì)算，沒有場景深度的分析，因此無法判斷人物前后位置關(guān)系。

由于以上的問題，該方法在單一人物動作捕捉時(shí)被周圍環(huán)境干擾的影響極大。在背景存在其他人物時(shí)會因無法判斷主次人物關(guān)系，極大的降低準(zhǔn)確率。對單一人物動作捕效果非常的不理想，需要進(jìn)行改進(jìn)。

改進(jìn)方案

單一人物的動作捕捉被外界干擾的影響太大導(dǎo)致結(jié)果并不理想，因此首先要考慮的就是屏蔽掉周圍干擾物體，突出主體人物。由此引入了tfjs-models/body-pix模型庫。

**tfjs-models/body-pix模型庫的主要功能：**實(shí)時(shí)分析人物結(jié)構(gòu)，將人物從背景中剝離。其作用對象為單一捕捉對象，正好適用于上述單人捕捉結(jié)果不理想的情況。

l基本配置

· 導(dǎo)入JS

· 生成bodyPixNet對象

ltfjs-models/body-pix與tfjs-models/posenet的混合使用

l結(jié)果

tfjs-models/body-pix與tfjs-models/posenet的混合使用，雖然加大了canvas處理的負(fù)擔(dān)，加大了描繪和圖像處理的次數(shù)，但是由于tfjs-models/body-pix已經(jīng)先將人物與背景剝離，在tfjs-models/posenet只使用用最高效但低準(zhǔn)確度的參數(shù)配置下，也能夠產(chǎn)生遠(yuǎn)高于使用高精確度但消耗處理性能極大的配置所不能達(dá)到的準(zhǔn)確度。從而實(shí)現(xiàn)了高效，高準(zhǔn)確度，流暢的實(shí)時(shí)單人動作捕捉功能。

結(jié)論

通過TensorFlow的開源庫，能夠輕松的在瀏覽器上通過網(wǎng)絡(luò)攝像頭實(shí)現(xiàn)人物動作的實(shí)時(shí)捕捉。

由于基于圖像分析，因此表現(xiàn)能力極大的依賴于對canvas的描繪性能，移動端由于瀏覽器canvas描繪能力以及硬件性能限制的原因，表現(xiàn)并不出色，無法做到長時(shí)間實(shí)時(shí)捕捉。甚至部分瀏覽器限制了網(wǎng)絡(luò)攝像頭的調(diào)用。在移動端的表現(xiàn)并不出色。

在單一人物的動作捕捉時(shí)，tfjs-models/body-pix與tfjs-models/posenet的混合使用能夠使精確度大大提升。

由于需要對canvas進(jìn)行描繪，結(jié)合其他canvas的JS庫可以進(jìn)行交互UI，交互小游戲等不同場合APP的開發(fā)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

開源AI模型庫是干嘛的

開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經(jīng)過訓(xùn)練，能夠執(zhí)行特定的任務(wù)。以下，是對開源AI模型庫的詳細(xì)

發(fā)表于 12-14 10:33 ?167次閱讀

PNI高精度低功耗3D動作捕捉手柄方案

SpacePoint3D動作捕捉手柄方案被虛擬現(xiàn)實(shí)（VR）廠商PICO選入PICOTrackingkit產(chǎn)品。虛擬現(xiàn)實(shí)和游戲類手柄的設(shè)計(jì)師們非常清楚地了解，用消費(fèi)類慣性傳感器想做到高精準(zhǔn)度的動作

發(fā)表于 11-05 08:06 ?144次閱讀

PNI高精度低功耗3D<b class='flag-5'>動作</b><b class='flag-5'>捕捉</b>手柄方案

鴻蒙跨端實(shí)踐-JS虛擬機(jī)架構(gòu)實(shí)現(xiàn)

類似的框架，我們需要自行實(shí)現(xiàn)以確保核心基礎(chǔ)能力的完整。鴻蒙虛擬機(jī)的開發(fā)經(jīng)歷了從最初 ArkTs2V8 到 JSVM + Roma新架構(gòu)方案。在此過程中，我們實(shí)現(xiàn)了完整的鴻蒙版的“J2V8”和基于系統(tǒng)JSVM的JS虛擬機(jī)框架

發(fā)表于 09-30 14:42 ?2406次閱讀

鴻蒙跨端實(shí)踐-<b class='flag-5'>JS</b>虛擬機(jī)架構(gòu)<b class='flag-5'>實(shí)現(xiàn)</b>

如何在Tensorflow中實(shí)現(xiàn)反卷積

在TensorFlow中實(shí)現(xiàn)反卷積（也稱為轉(zhuǎn)置卷積或分?jǐn)?shù)步長卷積）是一個(gè)涉及多個(gè)概念和步驟的過程。反卷積在深度學(xué)習(xí)領(lǐng)域，特別是在圖像分割、圖像超分辨率、以及生成模型（如生成對抗網(wǎng)絡(luò)GANs）等任務(wù)中

發(fā)表于 07-14 10:46 ?597次閱讀

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google開發(fā)的一個(gè)開源深度學(xué)習(xí)框架，它允許開發(fā)者方便地構(gòu)建、訓(xùn)練和部署各種復(fù)雜的機(jī)器學(xué)習(xí)模型。TensorFlow憑借其高效的計(jì)算性能、靈活的架構(gòu)以及豐富的工具和庫

發(fā)表于 07-12 16:38 ?685次閱讀

tensorflow和pytorch哪個(gè)更簡單?

： TensorFlow和PyTorch都是用于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的開源框架。TensorFlow由Google Brain團(tuán)隊(duì)開發(fā)，而PyTorch由Facebook的AI研究團(tuán)隊(duì)開發(fā)。易用性：

發(fā)表于 07-05 09:45 ?849次閱讀

tensorflow簡單的模型訓(xùn)練

在本文中，我們將詳細(xì)介紹如何使用TensorFlow進(jìn)行簡單的模型訓(xùn)練。TensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)庫，廣泛用于各種機(jī)器學(xué)習(xí)任務(wù)，包括圖像識別、自然語言處理等。我們將從安裝

發(fā)表于 07-05 09:38 ?641次閱讀

keras模型轉(zhuǎn)tensorflow session

和訓(xùn)練深度學(xué)習(xí)模型。Keras是基于TensorFlow、Theano或CNTK等底層計(jì)算框架構(gòu)建的。TensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架，由Google Brain團(tuán)隊(duì)開發(fā)。它提供了一種靈活

發(fā)表于 07-05 09:36 ?515次閱讀

如何使用Tensorflow保存或加載模型

TensorFlow是一個(gè)廣泛使用的開源機(jī)器學(xué)習(xí)庫，它提供了豐富的API來構(gòu)建和訓(xùn)練各種深度學(xué)習(xí)模型。在模型訓(xùn)練完成后，保存模型以便將來使用或部署是一項(xiàng)常見的需求。同樣，加載已保存的模型進(jìn)行預(yù)測或

發(fā)表于 07-04 13:07 ?1492次閱讀

TensorFlow的定義和使用方法

TensorFlow是一個(gè)由谷歌人工智能團(tuán)隊(duì)谷歌大腦（Google Brain）開發(fā)和維護(hù)的開源機(jī)器學(xué)習(xí)庫。它基于數(shù)據(jù)流編程（dataflow programming）的概念，將復(fù)雜的數(shù)學(xué)運(yùn)算表示為

發(fā)表于 07-02 14:14 ?757次閱讀

鴻蒙OS元服務(wù)開發(fā)說明：【W(wǎng)ebGL網(wǎng)頁圖形庫開發(fā)接口】

WebGL主要幫助開發(fā)者在前端開發(fā)中完成圖形圖像的相關(guān)處理，比如繪制彩色圖形等。目前該功能僅支持使用兼容JS的類Web開發(fā)范式開發(fā)。

發(fā)表于 04-02 17:02 ?464次閱讀

web前端開發(fā)和前端開發(fā)的區(qū)別

、CSS和JavaScript等技術(shù)來構(gòu)建用戶界面，實(shí)現(xiàn)用戶與應(yīng)用程序的交互。Web前端開發(fā)包括網(wǎng)頁設(shè)計(jì)、網(wǎng)頁編碼、前端框架使用以及優(yōu)化頁面

發(fā)表于 01-18 09:54 ?3506次閱讀

基于TensorFlow和Keras的圖像識別

，讓我們先花點(diǎn)時(shí)間來了解一些術(shù)語。TensorFlow/KerasTensorFlow是GoogleBrain團(tuán)隊(duì)創(chuàng)建的一個(gè)Python開源庫，它包含許多算法和模型

發(fā)表于 01-13 08:27 ?811次閱讀

【堅(jiān)果派】JS開源庫適配OpenHarmony系列——第一期實(shí)操

由于OpenHarmony應(yīng)用是基于ArkTS開發(fā)，而ArkTS是在保持TypeScript（簡稱TS）基礎(chǔ)語法風(fēng)格的基礎(chǔ)上，對TS的動態(tài)類型特性施加更嚴(yán)格的約束，引入靜態(tài)類型。因此在開發(fā)OpenHarmony三方庫時(shí)，建議首選在成熟的JS/TS

發(fā)表于 12-26 10:48 ?1168次閱讀

OpenHarmony開源GPU庫Mesa3D適配說明

介紹的是另外一種開源實(shí)現(xiàn)的方式：mesa3D。 Mesa3D 圖形庫就是OpenGL API的一種開源實(shí)現(xiàn)。新版本還支持OpenCL、Ope

發(fā)表于 12-25 11:38

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于TensorFlow的開源JS庫的網(wǎng)頁前端人物動作捕捉的實(shí)現(xiàn)

前言

評論

開源AI模型庫是干嘛的

PNI高精度低功耗3D動作捕捉手柄方案

鴻蒙跨端實(shí)踐-JS虛擬機(jī)架構(gòu)實(shí)現(xiàn)

如何在Tensorflow中實(shí)現(xiàn)反卷積

TensorFlow是什么？TensorFlow怎么用？

tensorflow和pytorch哪個(gè)更簡單?

tensorflow簡單的模型訓(xùn)練

keras模型轉(zhuǎn)tensorflow session

如何使用Tensorflow保存或加載模型

TensorFlow的定義和使用方法

鴻蒙OS元服務(wù)開發(fā)說明：【W(wǎng)ebGL網(wǎng)頁圖形庫開發(fā)接口】

web前端開發(fā)和前端開發(fā)的區(qū)別

基于TensorFlow和Keras的圖像識別

【堅(jiān)果派】JS開源庫適配OpenHarmony系列——第一期實(shí)操

OpenHarmony開源GPU庫Mesa3D適配說明