色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一種全新的基于旋轉的框架,能對自然場景中任意方向的文字進行檢測辨認

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-08 09:30 ? 次閱讀

編者按:對圖像中的文字進行識別已經(jīng)有很多種方法了,但是大多是水平方向上的識別,一旦有了旋轉角度,這些方法可能就“失靈”了。來自復旦大學和中國科學院的幾位研究人員就提出了一種框架,可以識別圖像中經(jīng)過旋轉的文本。以下為論智對論文的編譯。

摘要

本文介紹了一種全新的基于旋轉的框架,能對自然場景中任意方向的文字進行檢測辨認。我們提出了Rotation Region Proposal Networks(RRPN),用于生成傾斜的框架,同時還帶有圖像旋轉角度的信息。之后,這些信息會適應邊界框,從而能更精確地在不同方向上確定文本區(qū)域。Rotation Region-of-Interest(RRoI)池化層是將隨機方向的候選窗口映射到文本區(qū)域分類器的特征映射上。

整個框架是基于區(qū)域候選框的結構上搭建的,它與之前的文本檢測系統(tǒng)相比,能保證在隨機方向的文本檢測上有更高的計算效率。我們在三種現(xiàn)實場景中對該框架進行了實驗,發(fā)現(xiàn)了相較于之前的方法它所表現(xiàn)出的效率。

背景介紹

文本檢測是CV領域一大熱門話題,它的目標是在給定圖像中定位文字區(qū)域,這項任務是很多復雜任務的前提,例如視覺分類、視頻分析和其他移動應用。雖然已有很多商業(yè)產(chǎn)品落地,但是由于場景的復雜性,自然場景下的文字識別仍然受到很多限制,例如光線不均、圖片模糊、角度扭曲、方向不同等等。而本文正是關注現(xiàn)實生活中不水平的文字區(qū)域。

最近一些研究提出了針對隨機方向文本的檢測方法,總的來說,這些方法大致包括兩個步驟:分割網(wǎng)絡(全卷積網(wǎng)絡)以及用于傾斜候選框的幾何方法。然而,對圖像進行分割通常很耗時,并且一些系統(tǒng)需要多次后處理才能生成最終的文本區(qū)域候選框,所以并不如直接的檢測網(wǎng)絡高效。

在這篇論文中,我們提出了一種基于旋轉的方法,和端到端的文本檢測系統(tǒng),該系統(tǒng)能生成任意方向的候選框。相較于之前的方法,我們的主要成果有:

這次的框架可以用基于候選框區(qū)域的方法預測文本線的方向,使候選框能更好地適應文本區(qū)域。框架中加入的新元素,例如RRoI池化層和旋轉的候選框都整合到了架構中,保證高效的計算力。

我們還提出了對候選框區(qū)域新型的微調(diào)方法,提高任意方向文本檢測的性能。

我們將新的框架應用到三種場景數(shù)據(jù)集上,發(fā)現(xiàn)它比此前的方法更精確、更高效。

具體框架

首先,框架的整體結構如下圖所示:

框架的前部是VGG-16的卷積層,其中由兩部分組成:RRPN和最后一個卷積層的特征映射的復制品。RRPN可以為文本樣本生成隨機方向的候選框,之后會對候選框進行回歸處理以更好地適應文本區(qū)域。而從RRPN分出去的兩個圖層是分類層(cls)和回歸層(reg)。

cls的分數(shù)和reg中的候選框信息組成了兩個圖層的輸出結果,并且他們的損失通過計算總結構會形成一個多任務的損失函數(shù)。之后,RRoI池化層會扮演一個最大池化層的角色,將RRPN上任意方向的文本候選框投射到特征映射上。

最后,兩個全卷積層結合成一個分類器,具有RRoI特征的區(qū)域被分為文本或者背景。

在訓練階段,真實的文本區(qū)域用五個元組表示旋轉后的邊界框,分別是(x, y, h, w, θ),(x, y)代表邊界框幾何中心的坐標,h和w分別代表邊界框較短和較長的兩邊,θ表示夾角。

旋轉連接點(anchors

傳統(tǒng)的連接點利用比例尺和長寬比參數(shù)表示,通常對現(xiàn)實中的文本檢測并不有效。所以我們通過調(diào)整設計了旋轉連接點(R-anchors)。具體表示可看下圖:

其中有六個不同的旋轉方向,是綜合考慮覆蓋和計算效率之后得出的結果。其次,由于文本區(qū)域經(jīng)常有特殊的形狀,長寬比改成了1:2、1:5、1:8,以覆蓋更寬的文本。

學習旋轉候選框

R-anchors生成后,為了執(zhí)行網(wǎng)絡學習,就需要對R-anchors進行采樣。候選框的損失函數(shù)形成了多任務損失,定義為:

其中l(wèi)是類別標簽的表示器,參數(shù)p時softmax函數(shù)計算出的類別概率,v表示文本標簽的預測元組,v*表示真實數(shù)值。

下圖可以看到經(jīng)過回歸后的圖像與未回歸的對比:

(a)是輸入的圖像,(b)是沒有經(jīng)過回歸處理的方向和連接點,(c)是經(jīng)過處理的點

白線的方向就表示R-anchors的方向,白線的長短表示連接點對文字的反饋。

下圖是不同多任務損失值的對比:

實驗效果

我們分別在三個數(shù)據(jù)集上進行了實驗:MSRA-TD500、ICDAR2015和ICDAR2013。三個數(shù)據(jù)集都是文本檢測常用的數(shù)據(jù)集。首先我們對比了旋轉和水平的候選框:

結果顯示,基于旋轉的方法能更精確地確定文字區(qū)域,不會包含太多的背景,這說明在框架中加入旋轉策略的有效性。但是雖然檢測效率有所提高,在MSRA-TD500中仍有檢測失敗的案例:

在不平衡的光線下(a)、非常小的字體上(b)以及過長的文本上(c)都會出現(xiàn)檢測失敗的情況

但最終在三種數(shù)據(jù)集上的表現(xiàn)還是很不錯的:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1083

    瀏覽量

    40449
  • 分類器
    +關注

    關注

    0

    文章

    152

    瀏覽量

    13179
  • 數(shù)據(jù)集

    關注

    4

    文章

    1208

    瀏覽量

    24690

原文標題:復旦&中科院成果:對任意方向的文字進行識別

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種基于圖像平移的目標檢測框架

    1、摘要近年來,在深度卷積神經(jīng)網(wǎng)絡(CNNs)的幫助下,圖像和視頻監(jiān)控在智能交通系統(tǒng)(ITS)取得了長足的進展。作為一種先進的感知方法,智能交通系統(tǒng)對視頻監(jiān)控幀感興趣的目標
    發(fā)表于 08-31 07:43

    一種專門用于檢測小目標的框架Dilated Module

    1. 介紹本文提出一種專門用于檢測小目標的框架框架結構如下圖:我們探索了可以提高小目標檢測能力的3個方面:Dilated模塊,特征融合以及
    發(fā)表于 11-04 11:14

    如何對運動的車輪進行測定

    在汽車,要使用車速表、牽引控制器、防抱死制動器和巡航控制器均需測知車輪的速度。應該對引擎的每分鐘轉數(shù)(RPM)進行監(jiān)視,以控制變速器,使車速保持在最高安全速度以下。電動車窗通常由一種具有閉環(huán)
    發(fā)表于 11-18 06:16

    一種名片圖像的文字區(qū)塊分割方法

    針對以手機攝像頭作為圖像采集器獲得的名片圖像,該文介紹一種文字區(qū)塊的分割方法。對用手機攝像頭獲取的彩色名片圖像,利用4個方向的sobel算子進行邊緣
    發(fā)表于 04-15 09:00 ?24次下載

    檢測物體旋轉方向及轉速的電路

    檢測物體旋轉方向及轉速的電路
    發(fā)表于 04-24 21:48 ?1821次閱讀
    <b class='flag-5'>檢測</b>物體<b class='flag-5'>旋轉</b><b class='flag-5'>方向</b>及轉速的電路

    一種改進的CAMShift跟蹤算法及人臉檢測框架

    為充分利用人臉視頻圖像序列的時空信息,獲得更加準確的人臉比對圖像序列,提出一種結合人臉跟蹤的人臉檢測框架。使用簡單快速的正面人臉檢測算法對
    發(fā)表于 11-25 09:32 ?0次下載
    <b class='flag-5'>一種</b>改進的CAMShift跟蹤算法及人臉<b class='flag-5'>檢測</b><b class='flag-5'>框架</b>

    一種適用于旋轉角的人體檢測算法

    常用的人體檢測算法多應用于無旋轉角的情況,而在旋轉角可變的情況下檢測性能有限,為此提出了一種適用于有旋轉
    發(fā)表于 01-09 16:07 ?0次下載
    <b class='flag-5'>一種</b>適用于<b class='flag-5'>旋轉</b>角的人體<b class='flag-5'>檢測</b>算法

    一種新型分割圖像中人物的方法,基于人物動作辨認

    圖像分割的般方法是先對物體進行檢測,然后用邊界框對畫中物體進行分割。最近,例如Mask R-CNN的深度學習方法也被用于圖像分割任務,但是大多數(shù)研究都沒有注意到人類的特殊性:可以通過身體姿勢
    的頭像 發(fā)表于 04-10 15:02 ?5656次閱讀
    <b class='flag-5'>一種</b>新型分割圖像中人物的方法,基于人物動作<b class='flag-5'>辨認</b>

    如何提取和檢測視頻文字?數(shù)字視頻中文字檢測提取技術的分析

    作為一種高級語義特征, 視頻文字信息對視頻內(nèi)容的理解、索引和檢索具有重要意義。本文針對非壓縮域中視頻文字檢測與提取技術做了詳盡的分析和
    發(fā)表于 09-17 17:58 ?26次下載
    如何提取和<b class='flag-5'>檢測</b>視頻<b class='flag-5'>中</b>的<b class='flag-5'>文字</b>?數(shù)字視頻中<b class='flag-5'>文字</b>的<b class='flag-5'>檢測</b>提取技術的分析

    一種硅片旋轉甩干裝置,它的應用優(yōu)勢是什么

    本實用新型涉及一種機械裝置,尤其涉及一種干燥既全面又徹底、成本較低的硅片旋轉甩干裝置。 傳統(tǒng)的裝置具有以下的不足之處:1)干燥程度不徹底、不全面;2)成本較高、性價比不高。 為了克服現(xiàn)有技術
    發(fā)表于 12-31 09:34 ?1212次閱讀
    <b class='flag-5'>一種</b>硅片<b class='flag-5'>旋轉</b>甩干裝置,它的應用優(yōu)勢是什么

    如何對typo 進行檢測和糾正

    自然語言文本中經(jīng)常會出現(xiàn)些拼寫錯誤(typo),在中文文本里即所謂的錯別字,中文拼寫糾錯(Chinese Spelling Correction,CSC)可以對中文文本的 typo 進行檢
    的頭像 發(fā)表于 07-13 14:38 ?1628次閱讀

    一種基于HOG+SVM的行人檢測算法

    在先進駕駛輔助系統(tǒng), 基于視覺的行人檢測能對攝像頭視野范圍內(nèi)的無遮擋行人進行檢測, 并且易受天氣的影響, 在極端天氣下無法工作。
    的頭像 發(fā)表于 02-22 10:17 ?2887次閱讀

    一種適用于動態(tài)場景的多層次地圖構建算法

    本文提出了一種適用于動態(tài)場景的多層次地圖構建算法,如圖1所示的系統(tǒng)框架。首先,利用YOLOX[8]獲取場景的語義信息,采用多目標跟蹤算法對漏檢進行
    發(fā)表于 08-28 10:56 ?702次閱讀
    <b class='flag-5'>一種</b>適用于動態(tài)<b class='flag-5'>場景</b>的多層次地圖構建算法

    OpenVINO場景文字檢測文字識別教程

    OpenVINO是英特爾推出的深度學習模型部署框架,當前最新版本是OpenVINO2023版本。OpenVINO2023自帶各種常見視覺任務支持的預訓練模型庫Model Zoo,其中支持場景文字
    的頭像 發(fā)表于 09-24 15:31 ?1564次閱讀
    OpenVINO<b class='flag-5'>場景</b><b class='flag-5'>文字</b><b class='flag-5'>檢測</b>與<b class='flag-5'>文字</b>識別教程

    一種利用幾何信息的自監(jiān)督單目深度估計框架

    本文方法是一種自監(jiān)督的單目深度估計框架,名為GasMono,專門設計用于室內(nèi)場景。本方法通過應用多視圖幾何的方式解決了室內(nèi)場景幀間大
    發(fā)表于 11-06 11:47 ?428次閱讀
    <b class='flag-5'>一種</b>利用幾何信息的自監(jiān)督單目深度估計<b class='flag-5'>框架</b>
    主站蜘蛛池模板: 毛片免费观看视频| 国产精品99久久久久久AV| 2021国产精品国产精华| 中文字幕欧美一区| 最新男同鸭子ktv| 99热在线视频这里只精品| 9亚洲欧洲免费无码在线| md2.pud 麻豆传媒官网| 哒哒哒高清视频在线观看| 国产精品嫩草影院一区二区三区| 国产超碰人人爱被IOS解锁| 国产 亚洲 另类 欧美 在线| 成人国内精品久久久久影| 成人免费视频在| 扒开小处30p| 夫妻性姿势真人做视频| xxx粗大长欧美| 疯狂小护士| 国色天香社区视频免费高清3| 精品香蕉99久久久久网站| 久久99re2在线视频精品| 久久久久久亚洲精品影院| 久久综合狠狠综合狠狠| 年轻老师毛茸茸自由性| 日本久久和电影| 亚洲qvod图片区电影| 亚洲欧洲日产国码中学| 在线观看中文字幕国产| 波多野结衣网站www| xxnx动漫| 久久99re6热在线播放| 欧美在线视频一区| 亚洲精品国产熟女久久久| 中文字幕在线播放| 大胆国模一区二区三区伊人| 国产免费久久精品国产传媒| 久久久伊人影院| 少妇仑乱A毛片| 纵欲(高H)| 久草在线草a免费线看| 亚洲精品高清在线观看|