色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于貝塞爾曲線和RNN的手寫識別新方法

nlfO_thejiangme ? 來源:lp ? 2019-03-12 09:59 ? 次閱讀

手寫輸入作為與設備的一種重要交互方式一直都受到各個廠商的重視,特別是對于中老年朋友來說,更喜歡通過手寫而不是鍵盤的方式來進行輸入。此外,對于一些復雜的語言、交互演示場景、試教等,手寫輸入扮演著不可或缺的作用。

15年時谷歌曾經推出了支持82種語言的手寫輸入,并在去年升級為100種語言。但隨著機器學習的迅速發展,研究人員也在不斷重構著以往的方法為用戶帶來更快更準的體驗。

先前的模型基于人工設計的方法,將輸入筆畫切分成單個字符并利用對應的解碼器進行理解。為了提高準確率和速度,研究人員開發了基于循環神經網絡的端到端手寫識別系統,通過將輸入筆畫轉為貝塞爾曲線序列進行分析處理,利用RNN得到了準確率更高的識別結果。在這篇文章中,研究人員以拉丁字母為例詳解了新型手寫字符識別背后的故事。

觸點、曲線和循環神經網絡

任何手寫字符識別系統都需要從識別手指/輸入設備的觸點。我們在屏幕或者手寫板上輸入的筆畫可以看做是一系列包含時間戳的出觸點序列。考慮到輸入的設備在尺寸、分辨率上各不相同,研究人員首先對輸入的觸點坐標進行了歸一化處理。而后利用三次貝塞爾曲線來對觸點序列進行描述,以便RNN能夠更好的理解筆畫序列的形狀。

貝塞爾曲線在手寫識別中有著很長的應用歷史,基于貝塞爾曲線可以對輸入數據進行更加連續的表達,對于不同的采樣率和分辨率更加魯棒。在貝塞爾曲線表達中,每一條曲線可以被表示為起始點、終止點和兩個控制點的多項式,較少的參數精確的表達輸入筆畫。

這種方法代替了谷歌先前基于分割-解碼的方案,先前的方案需要先將輸入的筆畫分割成單個字符,而后利用解碼的方式尋找最有可能的字符。使用貝塞爾曲線表達輸入筆畫的另一個優點在于它可以更加緊致的表述輸入的觸點序列,這將便于模型從輸入中抽取輸入的時序依賴性。上圖中顯示了利用貝塞爾曲線擬合“go”字符的過程。原始的輸入點集包含了186個觸點坐標,其中對于字母g可以用圖中的黃色、藍色、粉色和綠色點來表示四條三次貝塞爾曲線的序列,而對于字母o可以用橙色、翠綠色和白色表示的三條貝塞爾曲線序列來描述。在貝塞爾曲線序列表示的輸入基礎上,我們需要對序列進行解碼才能得到所表示的字符。RNN是處理序列輸入的有效方式,所以研究人員利用了多層RNN來對序列數據進行解碼,并為每一個輸入序列生成一個表示其所代表字母可能性的矩陣,從而計算出手寫筆畫代表的字符。

在實際過程中,研究人員選擇了一種雙向的準循環神經網絡來作為處理模型,這種模型中具有交替的卷積和回歸層在理論上具有并行處理的可能性,同時也在網絡權重較少的情況下保持模型的能力。由于手寫字符識別更多的是在移動設備上進行,小尺寸的模型是保持速度的關鍵所在。

為了對曲線序列進行解碼,識別出對應的字符,循環神經網絡會生成一個表示字母可能性的解碼矩陣。矩陣的每一列代表了一條貝塞爾曲線,而每一行則代表了對應輸入曲線對應的字母可能性。在上圖中的解碼矩陣中,對于每一列我們可以看到它和先前的序列一起構成了26個字母上對應的概率分布。第一到第三條曲線序列都對應著blank(代表還沒有識別出字符,來自于CTC算法),而到了第四條曲線時網絡在g字母處得到了較高的概率,這意味著RNN從前面的四條曲線中識別出了字母g,而后面的第八條曲線上我們又可以看到字母o對應的位置有較高的概率。通過序列處理就能將曲線解碼為對應的字符。

此外還有兩個有趣的現象值得注意,對于字母g的識別,在第四列中y字母(倒數第二個)對應的激活也比較高,這是因為g和y看起來比較類似。而對于o字母的識別,每一條曲線輸入后o對應的概率在不斷提升,這也和我們的直覺相吻合,o代表的圓圈畫的越完整是o的可能性就越大。此外研究人員還引入了有限狀態語言模型解碼器來對網絡的輸出進行組合,對于某些常見的字符組合會有更大的可能性輸入,這樣就可以快速的將解碼出的字符轉換為單詞輸出。總結下來新方法一共分為了三個主要步驟,首先將觸點序列轉為緊湊的貝塞爾曲線,隨后利用QRNN進行解碼,最后利用字符結果組合出對應的單詞。雖然看起來很簡單,但這種方法相比原先的方法使得識別的錯誤率下降了20%-40%!

關于模型訓練

模型的訓練分為兩部分,一部分是基于connectionist temporal classification(CTC)損失對模型進行訓練,另一部分是基于貝葉斯優化的解碼器調參。訓練的數據主要包含了三個數據集,分別是IAM-OnDB在線手寫字符數據集,IBM-UB-1英語數據集,以及ICDAR 2013的中文數據集Chinese Isolated Characters,ICFHR2018中的越南語數據集。詳細的數據集鏈接請參看文末參考文獻。

設備部署

對于手寫識別來說,精確的模型沒有速度的保證對于用戶來說是無法忍受的。為了減小手寫輸入的延時,研究人員將模型在tensorflow Lite上進行了實現,通過如量化等一系列手段成功地減小了模型和最終應用安裝包的大小。完善的模型加上小巧的實現將讓手機更容易看懂我們筆跡。如果想要了解更多細節,請參考原文:

https://arxiv.org/pdf/1902.10525.pdf


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1143

    瀏覽量

    40718
  • 神經網絡
    +關注

    關注

    42

    文章

    4771

    瀏覽量

    100715
  • rnn
    rnn
    +關注

    關注

    0

    文章

    89

    瀏覽量

    6886

原文標題:Google手寫字符識別的新進展

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    測電阻,新方法,不加激勵

    測電阻,新方法,不加激勵的辦法有沒有。
    發表于 03-26 10:44

    一種標定陀螺儀的新方法

    一種標定陀螺儀的新方法
    發表于 08-17 12:17

    識別傳感器信號的新方法

      本文介紹了一種快速識別傳感器信號的新方法,即嘗試對模擬信號直接進行數字化處理,用門限電平采樣記數法快速、準確地識別傳感器發出的信號,目的在于提高計算機控制系統對傳感器信號的識別速度
    發表于 10-30 16:00

    求大佬分享按鍵掃描的新方法

    求大佬分享按鍵掃描的新方法
    發表于 01-17 06:50

    二階濾波器

    二階濾波器
    發表于 12-01 13:08 ?7785次閱讀
    二階<b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>濾波器

    濾波器的設計步驟

    濾波器的設計步驟
    發表于 12-01 13:10 ?1547次閱讀
    <b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>濾波器的設計步驟

    S曲線加減速速度控制新方法

    S曲線加減速速度控制新方法,又需要的下來看看
    發表于 05-04 14:37 ?15次下載

    S曲線加減速控制新方法的研究

    S曲線加減速控制新方法的研究,又需要的下來看看
    發表于 05-04 14:37 ?20次下載

    AD采集的新方法資料分享

    AD采集的新方法
    發表于 03-23 09:44 ?10次下載

    MT-204:響應

    MT-204:響應
    發表于 03-21 08:41 ?1次下載
    MT-204:<b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>響應

    LTC6261演示圈-第二秩序濾波器

    LTC6261演示圈-第二秩序濾波器
    發表于 06-02 14:44 ?10次下載
    LTC6261演示圈-第二秩序<b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>濾波器

    LT1568演示電路-5階,,低通過濾(線性通帶相位)

    LT1568演示電路-5階,,低通過濾(線性通帶相位)
    發表于 06-04 20:56 ?3次下載
    LT1568演示電路-5階,<b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>,低通過濾(線性通帶相位)

    并聯APF直流側電壓選擇新方法

    并聯APF直流側電壓選擇新方法(肇慶理士電源技術)-并聯APF直流側電壓選擇新方法? ? ? ? ? ? ??
    發表于 09-17 16:47 ?5次下載
    并聯APF直流側電壓選擇<b class='flag-5'>新方法</b>

    VLSI系統設計的最新方法

    電子發燒友網站提供《VLSI系統設計的最新方法.pdf》資料免費下載
    發表于 11-20 11:10 ?0次下載
    VLSI系統設計的最<b class='flag-5'>新方法</b>

    光束產生的常用方式

    光束因其無衍射的特性,在很多領域都有廣泛的應用,因此一直以來都是研究的熱點,產生光束
    發表于 03-15 11:43 ?1875次閱讀
    <b class='flag-5'>貝</b><b class='flag-5'>塞</b><b class='flag-5'>爾</b>光束產生的常用方式
    主站蜘蛛池模板: 亚洲高清中文字幕| 中字幕视频在线永久在线| 伊人天天躁夜夜躁狠狠| A级毛片高清免费网站不卡| 国产精品综合AV一区二区国产馆| 精品午夜国产福利观看| 碰超成人在线公开免费视频| 亚洲精品无码国产爽快A片百度| 99精品久久久久久久| 国产香蕉视频在线观看| 男生射女生| 亚洲免费大全| 成人毛片手机版免费看| 久草热在线| 少妇精品久久久一区二区三区| 伊人影院亚洲| 国产成人免费高清视频| 蜜桃99影院| 亚洲国产精品自在自线观看| jk制服啪啪网站| 久久re这里视频只精品首页| 日本在线高清不卡免费播放| 有码 亚洲 制服 国产 在线| 国产av在在免费线观看美女| 麻豆国产精品va在线观看约| 久草热8精品视频在线观看| 久久是热频国产在线| 午夜视频在线观看国产| aaa级黄影片| 久久国产av偷拍在线| 男人扒开添女人屁股| 色多多污污在线播放免费| 日本高清加勒比| 99视频精品全部免费免费观| 99视频精品免视3| 父皇轻点插好疼H限| 国产成人高清在线观看播放| 国产精品爽爽久久久久久蜜桃网站 | 无码一区二区三区| 777米奇影院第七色色| 男生射女生|