色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenVINO場(chǎng)景文字檢測(cè)與文字識(shí)別教程

英特爾物聯(lián)網(wǎng) ? 來(lái)源:英特爾物聯(lián)網(wǎng) ? 2023-09-24 15:31 ? 次閱讀

作者:賈志剛英特爾邊緣計(jì)算創(chuàng)新大使

01OpenVINO場(chǎng)景文字檢測(cè)

OpenVINO是英特爾推出的深度學(xué)習(xí)模型部署框架,當(dāng)前最新版本是OpenVINO2023版本。OpenVINO2023自帶各種常見(jiàn)視覺(jué)任務(wù)支持的預(yù)訓(xùn)練模型庫(kù)Model Zoo,其中支持場(chǎng)景文字檢測(cè)的網(wǎng)絡(luò)模型是來(lái)自Model Zoo中名稱為:text-detection-0003的模型(基于PixelLink架構(gòu)的場(chǎng)景文字檢測(cè)網(wǎng)絡(luò))。

d381afc6-5936-11ee-939d-92fbcf53809c.png

圖-1 PixelLink網(wǎng)絡(luò)模型架構(gòu)

圖-1中的PixelLink場(chǎng)景文字檢測(cè)模型的輸入與輸出格式說(shuō)明

輸入格式:

1x3x768x1280 BGR彩色圖像

輸出格式:

name: "model/link_logits_/add", [1x16x192x320] – pixelLink的輸出
name: "model/segm_logits/add", [1x2x192x320] – 像素分類text/no text

左滑查看更多

02OpenVINO文字識(shí)別

OpenVINO支持文字識(shí)別(數(shù)字與英文)的模型是來(lái)自Model Zoo中名稱為:text-recognition-0012d的模型,是典型的CRNN結(jié)構(gòu)模型。(基于類似VGG卷積結(jié)構(gòu)backbone與雙向LSTM編解碼頭的文字識(shí)別網(wǎng)絡(luò))

d3a52870-5936-11ee-939d-92fbcf53809c.png

圖-2 CRNN網(wǎng)絡(luò)模型架構(gòu)

圖-2文本識(shí)別模型的輸入與輸出格式如下:

輸入格式:1x1x32x120

輸出格式:30, 1, 37

輸出解釋是基于CTC貪心解析方式,其中37字符集長(zhǎng)度,字符集為:0123456789abcdefghijklmnopqrstuvwxyz#

#表示空白。

03MediaPipe手勢(shì)識(shí)別

谷歌在2020年發(fā)布的mediapipe開(kāi)發(fā)包說(shuō)起,這個(gè)開(kāi)發(fā)包集成了包含手勢(shì)姿態(tài)等各種landmark檢測(cè)與跟蹤算法。其中支持手勢(shì)識(shí)別是通過(guò)兩個(gè)模型實(shí)現(xiàn),一個(gè)是模型是檢測(cè)手掌,另外一個(gè)模型是實(shí)現(xiàn)手掌的landmakr標(biāo)記。

d3c32fd2-5936-11ee-939d-92fbcf53809c.png

圖-3手勢(shì)landmark點(diǎn)位說(shuō)明

04OpenVINO與MediaPipe庫(kù)的安裝

pip install openvino==2023.0.2
pip install mediapipe

左滑查看更多

請(qǐng)先安裝好OpenCV-Python開(kāi)發(fā)包依賴。

05應(yīng)用構(gòu)建說(shuō)明

首先基于OpenCV打開(kāi)USB攝像頭或者筆記本的web cam,讀取視頻幀,然后在每一幀中完成手勢(shì)landmark檢測(cè),根據(jù)檢測(cè)到手勢(shì)landmark數(shù)據(jù),分別獲取左右手的食指指尖位置坐標(biāo)(圖-3中的第八個(gè)點(diǎn)位),這樣就得到了手勢(shì)選擇的ROI區(qū)域,同時(shí)把當(dāng)前幀的圖像送入到OpenVINO場(chǎng)景文字識(shí)別模塊中,完成場(chǎng)景文字識(shí)別,最后對(duì)比手勢(shì)選擇的區(qū)域與場(chǎng)景文字識(shí)別結(jié)果每個(gè)區(qū)域,計(jì)算它們的并交比,并交比閾值大于0.5的,就返回該區(qū)域?qū)?yīng)的OCR識(shí)別結(jié)果,并顯示到界面上。整個(gè)流程如下:

d3e388f4-5936-11ee-939d-92fbcf53809c.png

圖-4程序執(zhí)行流程圖

06代碼實(shí)現(xiàn)

根據(jù)圖-4的程序執(zhí)行流程圖,把場(chǎng)景文字檢測(cè)與識(shí)別部分封裝到了一個(gè)類TextDetectAndRecognizer,最終實(shí)現(xiàn)的主程序代碼如下:

import cv2 as cv
import numpy as np
import mediapipe as mp
from text_detector import TextDetectAndRecognizer
digit_nums = ['0','1', '2','3','4','5','6','7','8','9','a','b','c','d','e','f','g',
       'h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','#']


mp_drawing = mp.solutions.drawing_utils
mp_hands = mp.solutions.hands


x0 = 0
y0 = 0
detector = TextDetectAndRecognizer()


# For webcam input:
cap = cv.VideoCapture(0)
cap.set(cv.CAP_PROP_FRAME_HEIGHT, 1080)
cap.set(cv.CAP_PROP_FRAME_WIDTH, 1920)
height = cap.get(cv.CAP_PROP_FRAME_HEIGHT)
width = cap.get(cv.CAP_PROP_FRAME_WIDTH)
# out = cv.VideoWriter("D:/test777.mp4", cv.VideoWriter_fourcc('D', 'I', 'V', 'X'), 15, (np.int(width), np.int(height)), True)
with mp_hands.Hands(
 min_detection_confidence=0.75,
 min_tracking_confidence=0.5) as hands:
 while cap.isOpened():
  success, image = cap.read()


  if not success:
    break


  image.flags.writeable = False
  h, w, c = image.shape
  image = cv.cvtColor(image, cv.COLOR_BGR2RGB)
  results = hands.process(image)


  image = cv.cvtColor(image, cv.COLOR_RGB2BGR)
  x1 = -1
  y1 = -1
  x2 = -1
  y2 = -1
  if results.multi_hand_landmarks:
   for hand_landmarks in results.multi_hand_landmarks:
    mp_drawing.draw_landmarks(
     image,
     hand_landmarks,
     mp_hands.HAND_CONNECTIONS)
    for idx, landmark in enumerate(hand_landmarks.landmark):
      x0 = np.int(landmark.x * w)
      y0 = np.int(landmark.y * h)
      cv.circle(image, (x0, y0), 4, (0, 0, 255), 4, cv.LINE_AA)
      if idx == 8 and x1 == -1 and y1 == -1:
        x1 = x0
        y1 = y0
        cv.circle(image, (x1, y1), 4, (0, 255, 0), 4, cv.LINE_AA)
      if idx == 8 and x1 > 0 and y1 > 0:
        x2 = x0
        y2 = y0
        cv.circle(image, (x2, y2), 4, (0, 255, 0), 4, cv.LINE_AA)


  if abs(x1-x2) > 10 and abs(y1-y2) > 10 and x1 > 0 and x2 > 0:
   if x1 < x2:
 ? ? ? ?cv.rectangle(image, (x1, y1), (x2, y2), (255, 0, 0), 2, 8)
 ? ? ? ?text = detector.inference_image(image, (x1, y1, x2, y2))
 ? ? ? ?cv.putText(image, text, (x1, y1), cv.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 255), 2)
 ? ? ?else:
 ? ? ? ?cv.rectangle(image, (x2, y2), (x1, y1), (255, 0, 0), 2, 8)
 ? ? ? ?text = detector.inference_image(image, (x2, y2, x1, y1))
 ? ? ? ?cv.putText(image, text, (x2, y2), cv.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 255), 2)


 ? ?# Flip the image horizontally for a selfie-view display.
 ? ?cv.imshow('MediaPipe Hands', image)
 ? ?# out.write(image)
 ? ?if cv.waitKey(1) & 0xFF == 27:
 ? ? ?break


cap.release()
# out.release()

左滑查看更多

07移植到AlxBoard開(kāi)發(fā)板上

在愛(ài)克斯開(kāi)發(fā)板上安裝好MediaPipe即可,OpenVINO不用安裝了,因?yàn)閻?ài)克斯開(kāi)發(fā)板自帶OpenCV與OpenVINO,然后就可以直接把python代碼文件copy過(guò)去,插上USB攝像頭,直接使用命令行工具運(yùn)行對(duì)應(yīng)的python文件,就可以直接用了,這樣就在AlxBoard開(kāi)發(fā)板上實(shí)現(xiàn)了基于手勢(shì)選擇區(qū)域的場(chǎng)景文字識(shí)別應(yīng)用。

08后續(xù)指南

安裝語(yǔ)音播報(bào)支持包:

pip install pyttsx

AlxBorad開(kāi)發(fā)板是支持3.5mm耳機(jī)mic接口,支持語(yǔ)音播報(bào)的,如果把區(qū)域選擇識(shí)別的文字,通過(guò)pyttsx直接播報(bào)就可以實(shí)現(xiàn)從手勢(shì)識(shí)別到語(yǔ)音播報(bào)了,自動(dòng)跟讀卡片單詞啟蒙學(xué)英語(yǔ),后續(xù)實(shí)現(xiàn)一波,請(qǐng)繼續(xù)關(guān)注我們。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10183

    瀏覽量

    174198
  • 開(kāi)發(fā)套件
    +關(guān)注

    關(guān)注

    2

    文章

    171

    瀏覽量

    24625
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5557

    瀏覽量

    122597
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    114

    瀏覽量

    435

原文標(biāo)題:在英特爾開(kāi)發(fā)套件上打造指哪識(shí)哪的OCR應(yīng)用|開(kāi)發(fā)者實(shí)戰(zhàn)

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    首發(fā) | 告別手動(dòng)錄入,開(kāi)放平臺(tái)OCR上線印刷文字識(shí)別

    的就是印刷字體的轉(zhuǎn)化。二、印刷文字識(shí)別應(yīng)用廣泛正如文章開(kāi)頭我們提到的,生活中有很多需要將印刷字體轉(zhuǎn)換為設(shè)備可編輯的文本場(chǎng)景。而作為OCR家族的重要成員,印刷文字
    發(fā)表于 05-17 15:18

    基于SnapDragonBoard410C文字識(shí)別

    圖片格式。簡(jiǎn)單一句話,就是可以把圖片上的文字識(shí)別出來(lái)。應(yīng)用的場(chǎng)景有很多,比如說(shuō):身份證號(hào)碼識(shí)別,銀行卡號(hào)識(shí)別等等。So 我們本次介紹國(guó)內(nèi)巨頭
    發(fā)表于 09-26 18:11

    基于AI通用文字識(shí)別能力,檢測(cè)識(shí)別文檔翻拍、街景翻拍等圖片中的文字

    1. 介紹AI的通用文字識(shí)別可以對(duì)文檔翻拍、街景翻拍等圖片來(lái)源的文字檢測(cè)識(shí)別,可以集成在其他應(yīng)用中,提供
    發(fā)表于 08-27 11:27

    TH-OCR文字識(shí)別系統(tǒng)介紹

    TH-OCR文字識(shí)別系統(tǒng)的工作原理為通過(guò)掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,OCR文字識(shí)別系統(tǒng)實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)
    發(fā)表于 12-27 16:04 ?2318次閱讀

    Android文字識(shí)別

    Android文字識(shí)別
    發(fā)表于 12-20 22:40 ?0次下載

    基于matlab的文字識(shí)別算法

    在圖像中,文字信息包含了豐富的高層語(yǔ)義信息,提取出這些文字,對(duì)于圖像高層語(yǔ)義的理解、索引和檢索非常有幫助。基于matlab的文字識(shí)別算法具有局限性,模板匹配效率低,伸縮范圍比較小的的特
    發(fā)表于 01-15 10:31 ?3w次閱讀
    基于matlab的<b class='flag-5'>文字</b><b class='flag-5'>識(shí)別</b>算法

    基于FPGA的OCR文字識(shí)別技術(shù)的深度解析

    OCR在通用文字識(shí)別場(chǎng)景下有廣泛應(yīng)用,基于FPGA異構(gòu)加速的OCR識(shí)別相比CPU/GPU實(shí)現(xiàn)具有延時(shí)小、成本低的優(yōu)勢(shì)。我們?cè)O(shè)計(jì)了多FPGA芯片協(xié)同的異構(gòu)加速架構(gòu),能快速適配業(yè)務(wù)OCR
    發(fā)表于 01-26 12:19 ?4269次閱讀

    如何提取和檢測(cè)視頻中的文字?數(shù)字視頻中文字檢測(cè)提取技術(shù)的分析

    檢測(cè)與分割以及視頻文字識(shí)別(Video OCR) 等。對(duì)于不同的典型算法, 分析了其理論基礎(chǔ)和應(yīng)用特點(diǎn), 并且通過(guò)對(duì)比指出其不足和應(yīng)用的局限。最后, 本文還展望了該技術(shù)未來(lái)發(fā)展的方向。
    發(fā)表于 09-17 17:58 ?26次下載
    如何提取和<b class='flag-5'>檢測(cè)</b>視頻中的<b class='flag-5'>文字</b>?數(shù)字視頻中<b class='flag-5'>文字</b>的<b class='flag-5'>檢測(cè)</b>提取技術(shù)的分析

    如何在電腦中對(duì)圖片文字進(jìn)行局部識(shí)別

    ? ? 相信很多人和小編一樣電腦中保存了一些帶有文字的圖片,有時(shí)候因?yàn)樾枰獣?huì)將里面的文字進(jìn)行提取,然而又不想對(duì)著圖片一個(gè)字一個(gè)字的打出來(lái),這個(gè)時(shí)候就需要對(duì)圖片中的文字進(jìn)行局部識(shí)別了,那
    發(fā)表于 11-13 14:07 ?695次閱讀

    OCR文字識(shí)別視覺(jué)檢測(cè)系統(tǒng)應(yīng)用程序免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是OCR文字識(shí)別視覺(jué)檢測(cè)系統(tǒng)應(yīng)用程序免費(fèi)下載。
    發(fā)表于 05-28 17:31 ?27次下載

    計(jì)算機(jī)文字識(shí)別技術(shù)研究

    計(jì)算機(jī)文字識(shí)別技術(shù)研究。
    發(fā)表于 03-24 14:15 ?16次下載

    淺析HarmonyOS基于AI的通用文字識(shí)別技術(shù)

    對(duì)圖像信息進(jìn)行文字檢測(cè)識(shí)別和關(guān)鍵信息提取,并根據(jù)分析結(jié)果提供翻譯、搜索等相關(guān)服務(wù)。 通用文字識(shí)別的核心技術(shù)是OCR【Optical Cha
    的頭像 發(fā)表于 08-20 10:42 ?3514次閱讀

    OpenVINO2021.4版本中場(chǎng)景文字檢測(cè)識(shí)別模型的推理使用

    場(chǎng)景文字檢測(cè)識(shí)別模型 OpenVINO2021.4支持場(chǎng)景
    的頭像 發(fā)表于 08-26 15:01 ?3125次閱讀

    圖片文字識(shí)別:揭開(kāi)數(shù)字世界的神秘面紗

    隨著數(shù)字化時(shí)代的到來(lái),我們生活中的大部分?jǐn)?shù)據(jù)都以圖片的形式存在。然而,這些圖片中蘊(yùn)含的信息往往比文字更豐富,如何從這些圖片中提取有價(jià)值的信息,是數(shù)字世界中一個(gè)十分重要的問(wèn)題。這時(shí),圖片文字識(shí)別技術(shù)
    的頭像 發(fā)表于 05-11 18:20 ?864次閱讀

    基于OpenVINO+OpenCV的OCR處理流程化實(shí)現(xiàn)

    預(yù)處理主要是基于OpenCV、場(chǎng)景文字檢測(cè)識(shí)別基于OpenVINO框架 + PaddleOCR模型完成。直接按圖索驥即可得到最終結(jié)果。 O
    的頭像 發(fā)表于 11-07 11:21 ?1056次閱讀
    基于<b class='flag-5'>OpenVINO</b>+OpenCV的OCR處理流程化實(shí)現(xiàn)
    主站蜘蛛池模板: 日本一卡精品视频免费 | 无码AV动漫精品一区二区免费 | 羞羞麻豆国产精品1区2区3区 | 台湾佬综合娱乐网 | 色噜噜2017最新综合 | BL文高H强交 | 一个人免费播放高清在线观看 | 久久视频这里只精品99热在线 | 免费果冻传媒2021在线看 | 国产呦精品一区二区三区网站 | 亚洲VA天堂VA欧美VA在线 | 白洁在线观看 | 国产精品欧美一区二区在线看 | 亚洲免费观看在线视频 | 国精产品一区一区三区有限公司 | 亚洲欧美成人在线 | 菠萝菠萝蜜免费播放高清 | 色欲人妻无码AV精品一区二区 | 国产精品人妻无码久久久蜜桃 | 野花香HD免费高清版6高清版 | 精品国产国产精2020久久日 | 黄子佼81岁父亲现状曝光 | 暖暖 免费 高清 日本 在线 | 在线免费看a| 苍井空教师BD在线观看全集 | qvod 在线| 国产亚洲精品久久久无码狼牙套 | 噼里啪啦免费观看视频大全 | 亚洲高清视频在线观看 | 久久久黄色大片 | 狠狠综合久久综合88亚洲 | 久久WWW免费人成一看片 | 东京热影院| 久久久无码AV精品亚洲A片软件 | 女人的选择hd | 日本视频久久 | 55夜色66夜亚洲精品播放 | 116美女写真午夜电影z | 亚洲色欲色欲WWW在线成人网 | 中文天堂www资源 | 一二三四电影完整版免费观看 |

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品