色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TCN應該成為我們未來項目的優先選項

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-05-16 09:07 ? 次閱讀

我們一開始認為,時序問題(如語言、語音等等)天生就是 RNN 的地盤。然而現在這一觀點要成為過去式了。時間卷積網絡Temporal Convolutional Nets, TCNs)作為 CNN 家族中的一員健將,擁有許多新特性,如今已經在諸多主要應用領域中擊敗了 RNN。看起來 RNN 可能要成為歷史了。

也就是從 2014、15 年起,我們基于深度神經網絡的應用就已經在文本和語音識別領域達到 95% 的準確率,可以用來開發新一代的聊天機器人、個人助理和即時翻譯系統等。

卷積神經網絡(Convolutional Neural Nets, CNNs)是圖像和視頻識別領域公認的主力軍,而循環神經網絡(Recurrent Neural Nets, RNNs)在自然語言處理領域的地位與其是相似的。

但二者的一個主要不同是,CNN 可以識別靜態圖像(或以幀分割的視頻)中的特征,而 RNN 在文本和語音方面表現出色,因為這類問題屬于序列或時間依賴問題。也就是說,待預測的后一個字符或單詞依賴于前面的(從左到右)字符或單詞,因此引入時間的概念,進而考慮到序列。

實際上,RNN 在所有的序列問題上都有良好表現,包括語音 / 文本識別、機器翻譯、手寫體識別、序列數據分析(預測),甚至不同配置下的自動編碼生成等等。

在很短的一段時期里,RNN 的改進版本大行其道,其中包括 LSTM(long short term memory,長短期記憶網絡)和 GRU(gated recurring units,門循環單元)。這二者都改進了 RNN 的記憶范圍,令數據可以將距離其很遠的文本信息利用起來。

解決“才怪”問題

當 RNN 從左到右按順序讀取字符時,上下文就成了一個重要問題。比如,對一條評論進行情感分析時,剛開始的幾句話可能是正面的(例如,食物好,氣氛好)但以負面評論結束(如服務差,價格高),最后整條評論實際上是負面的。這其實在邏輯上等同于“才怪”的玩笑:“這個領帶看著不錯……才怪!”

這個問題的解決方案是使用兩個 LSTM 編碼器,同時從兩個方向讀取文本(即雙向編碼器)。這相當于在現在掌握了(文本的)未來信息。這很大程度上解決了問題。精度確實提高了。

Facebook 和 Google 遭遇的一個問題

早些年,當 Facebook 和 Google 發布各自的自動語言翻譯系統時,他們意識到了一個問題——翻譯耗時太長了。

這實際上是 RNN 在內部設計上存在的一個問題。由于網絡一次只讀取、解析輸入文本中的一個單詞(或字符),深度神經網絡必須等前一個單詞處理完,才能進行下一個單詞的處理。

這意味著 RNN 不能像 CNN 那樣進行大規模并行處理(massive parallel processing,MPP),特別是在 RNN/LSTM 對文本進行雙向處理時。

這也意味著 RNN 極度地計算密集,因為在整個任務運行完成之前,必須保存所有的中間結果。

2017 年初,Google 和 Facebook 針對該問題提出了相似的解決方案——在機器翻譯系統中使用 CNN,以便將大規模并行處理的優勢發揮出來。在 CNN 中,計算不依賴于之前時間的信息,因此每個計算都是獨立的,可以并行起來。

Google 的解決方案叫做 ByteNet,而 Facebook 的稱為 FairSeq(這是用 Facebook 內部的人工智能研究團隊 FAIR 來命名的)。FairSeq 的代碼已發布至 GitHub。

Facebook 稱他們的 FairSeq 網絡的運行速度比基本的 RNN 快 9 倍。

基本工作原理

CNN 在處理圖像時,將圖像看作一個二維的“塊”(高度和寬度);遷移到文本處理上,就可以將文本看作一個一維對象(高度 1 個單位,長度 n 個單位)。

但 RNN 不能直接預定義對象長度,而 CNN 需要長度信息。因此,要使用 CNN,我們必須不斷增加層數,直到整個感受野都被覆蓋為止。這種做法會讓 CNN 非常深,但是得益于大規模并行處理的優勢,無論網絡多深,都可以進行并行處理,節省大量時間。

特殊結構:選通 + 跳躍 = 注意力

當然,具體的解決方案不會像上面所說的那樣簡單。Google 和 Facebook 還向網絡中添加了一個特殊結構:“注意力(Attention)”函數。

最初的注意力函數是去年由 Google Brain 和多倫多大學的研究者們提出的,命名為變換器(Transformer)。

原論文鏈接:

https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf。

當時,Facebook 和 Google 使用的函數幾乎一模一樣,因此該函數備受關注,被稱為“注意力”函數。該函數有兩個獨特的特征。

第一個特征被 Facebook 稱為“多跳躍”。和傳統 RNN 方法的每個句子只“看”一次不同,多跳躍讓系統可以“瞥”一個句子“好多眼”。這種行為和人工翻譯更相似。

每“一瞥”可能會關注某個名詞或動詞,而這些詞并不一定是一個序列,因此在每一次迭代中可以更深入地理解其含義。每“瞥”之間可能是獨立的,也可能依賴于前面的“瞥”,然后去關注相關的形容詞、副詞或助動詞等。

上圖是 Facebook 給出的一個法英翻譯的例子,展示了第一次迭代的過程。該次迭代編碼了每一個法語單詞,然后用“多跳躍”的方法選擇最合適的英文翻譯。

第二個特征是選通(即門控制),用來控制各隱藏層之間的信息流。在上下文理解過程中,門通過對 CNN 的尺度控制,來判斷哪些信息能更好地預測下一個單詞。

不只是機器翻譯——時間卷積網絡(TCN)

至 2017 年中旬,Facebook 和 Google 已經通過使用 CNN 和注意力函數,完全解決了機器翻譯的時間效率問題。而更重要的一個問題是,這種技術大有用武之地,不能將其埋沒在加速機器翻譯的小小任務中。我們能否將其推廣到所有適用于 RNN 的問題?答案是,當然可以。

2017 年,相關的研究發表了很多;其中有些幾乎是和 Facebook、Google 同時發表的。其中一個敘述比較全面的論文是 Shaojie Bai、J. Zico Kolter 和 Vladlen Koltun 發表的“An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling”。

原文鏈接:https://arxiv.org/pdf/1803.01271.pdf。

有些同仁將這種新架構命名為時間卷積網絡。當然隨著工業上的應用,這個名稱有可能會被更改。

上述論文所做的工作是在 11 個不同的、非語言翻譯類的工業標準 RNN 問題上,將 TCN 與 RNN、LSTM、GRU 進行了直接比較。

研究的結論是:TCN 在其中的 9 個問題中,不僅速度更快,且精度更高;在 1 個問題中與 GRU 打了平手(下表中的粗體文字代表精度最高項。圖片截取自原論文)。

TCN 優缺點

Shaojie Bai、J. Zico Kolter 和 Vladlen Koltun 還給出了下面這一實用的列表,列舉了 TCN 的優缺點。

速度很重要。更快的網絡能使反饋環更短。由于在 TCN 中可以進行大規模并行處理,網絡訓練和驗證的時間都會變短。

TCN 為改變感受野大小提供了更多靈活性,主要是通過堆疊更多的卷積層、使用更大的膨脹系數及增大濾波器大小。這些操作可以更好地控制模型的記憶長短。

TCN 的反向傳播路徑和序列的時間方向不同。這避免了 RNN 中經常出現的梯度爆炸或梯度消失問題。

訓練時需要的內存更少,尤其是對于長輸入序列。

然而,作者指出,TCN 在遷移學習方面可能沒有 CNN 的適應能力那么強。這是因為在不同的領域,模型預測所需要的歷史信息量可能是不同的。因此,在將一個模型從一個對記憶信息需求量少的問題遷移到一個需要更長記憶的問題上時,TCN 可能會表現得很差,因為其感受野不夠大。

進一步考慮TCN 已經被應用在很多重要領域,也獲得了極大成功,甚至幾乎可以解決一切序列問題。因此,我們需要重新考慮我們之前的看法。序列問題不再是 RNN 的專屬領域,而 TCN 應該成為我們未來項目的優先選項。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4773

    瀏覽量

    100877
  • cnn
    cnn
    +關注

    關注

    3

    文章

    352

    瀏覽量

    22242

原文標題:時間卷積網絡(TCN)在 NLP 多領域發光,RNN 或將沒落

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電子元器件篩選方案的設計原則及篩選項目

    電子元器件的固有可靠性取決于產品的可靠性設計,因此,應該在電子元器件裝上整機、設備之前,就要設法把具有早期失效的元器件盡可能地加以排除,為此就要對元器件進行篩選。那么元器件篩選都有哪些方案?原則是什么?常見的篩選項目有哪些?
    發表于 12-26 13:47 ?1886次閱讀

    基于Arduino的灌溉項目的問題解析

    使用電子儀器和控制來提高澆水項目效率的選擇很多。推動適合灌溉項目的選項的最重要的限制因素是水的來源以及目標澆水區域相對于該來源的大小和位置。目標澆水區域廣泛覆蓋小型花園,中型花園和較大的農作物地塊。水源在自補儲水庫和靜水庫之間分
    的頭像 發表于 02-20 08:34 ?3437次閱讀

    APP會成為區塊鏈的未來嗎?

    `武漢區塊鏈軟件技術公司DAPP會成為區塊鏈的未來嗎?手機將人們帶進了移動互聯網時代,APP豐富了我們的移動互聯網生活,在過去幾年,APP經濟的興起改變人們眾多的生活習慣,從點外賣、看電影、打車
    發表于 12-06 16:14

    如何指定優先

    您好,我正在將一個項目從XC32 1.32更新到1.40,現在它拋出了許多與ISR聲明相關的警告,以及我如何指定優先級。例如,聲明一個中斷的包裝器,它看起來就像這樣。但是這會導致編譯器抱怨SRS
    發表于 09-26 11:57

    有歷史才有未來,DigiPCBA的項目歷史

    鏈接 - 單擊此鏈接將訪問該源項目的詳細管理頁面,該頁面在瀏覽器的單獨選項卡上打開。項目提交每次將項目提交并推送到工作區(該項目在工作區的內
    發表于 05-30 11:34

    IT項目的質量控制

    IT項目的特點IT項目的生命周IT項目管理的重要環節IT項目質量控制的基本程序(介紹一個項目質量控制的實例)信息化工程
    發表于 07-13 00:22 ?0次下載

    TCN75A/TCN75中文資料,pdf (數字溫度傳感器)

    Microchip Technology Inc. 的TCN75A 數字溫度傳感器將-40°C 到+125°C 范圍內的溫度轉換為數字字,精度為±1.5°C (典型值)。TCN75A 產品帶有用戶可編程寄存器,可靈活用于各種溫度檢測應用
    發表于 02-23 17:13 ?153次下載

    TCN75A典型應用電路

    TCN75A典型應用電路 TCN75A 產品帶有用戶可編程寄存器,可靈活用于各種溫度檢測應用中。用戶可選擇寄存器設置,
    發表于 02-23 17:14 ?1461次閱讀
    <b class='flag-5'>TCN</b>75A典型應用電路

    基于TCN實時協議棧過程數據通信研究

    基于TCN實時協議棧過程數據通信研究
    發表于 08-31 14:45 ?16次下載
    基于<b class='flag-5'>TCN</b>實時協議棧過程數據通信研究

    探究TCN列車網絡的未來發展

    引言 列車通信網絡是用于連接車載設備,實現信息共享、控制功能、監測診斷的數據通信系統。經過近二三十年的發展,列車網絡技術已經走向成熟,并成為現代軌道車輛的關鍵技術之一。目前,在城市軌道車輛、高速動
    發表于 10-19 11:34 ?0次下載

    關于MPLAB Harmony中項目恢復和備份選項的具體介紹

    MPLAB Harmony專輯 - 第5集 - MPLAB Harmony中的項目恢復和備份選項
    的頭像 發表于 07-08 00:33 ?2916次閱讀

    存儲優先架構存在優勢 或是AI芯片的未來

    造成的拖累,跨越“存儲墻”對于芯片性能提升的障礙已成為半導體行業廣泛探討的話題。而當“存儲優先架構”(SFA)解決方案被提出來,我們似乎找到了開啟未來AI芯片性能提升的金鑰匙。
    發表于 12-26 16:19 ?1934次閱讀

    區塊鏈項目的治理問題探討

    本文探討的本質是區塊鏈項目的治理問題,早期創始成員是不是應該先拿到大部分預付報酬,還是應該在完成既定的路線圖之后才能拿到代幣。當然,以太坊是2015年時的項目,當時關于區塊鏈治理的關注
    發表于 12-30 09:06 ?612次閱讀

    為什么使用CubeMx配置NVIC時不見子優先選項

    時,不難發現一個問題,那就是怎么沒有中斷子優先級【或稱響應優先級、副優先級等】的配置?!【當然,很多時候我們或許沒有關注子優先級】如下圖所示
    的頭像 發表于 09-09 15:32 ?1323次閱讀
    為什么使用CubeMx配置NVIC時不見子<b class='flag-5'>優先</b>級<b class='flag-5'>選項</b>

    波音評估Starliner項目未來,未決定剝離

    波音公司正在對其陷入困境的Starliner太空艙項目進行未來選項的評估。新任首席執行官Kelly Ortberg正在廣泛審視波音的業務組合,以確定未來的發展方向。 據知情人士透露,此
    的頭像 發表于 10-28 11:10 ?284次閱讀
    主站蜘蛛池模板: 九九久久国产| 纯肉合集(高H)| 欧美牲交A欧美牲交VDO| 国产精品69人妻无码久久| 最新色导航| 亚洲国产无线码在线观看| 青草国产在线视频免费| 久久国语精品| 国产成人精品综合在线| 99视频精品国产免费观看| 少妇两个奶头喷出奶水了怎么办 | 午夜福利08550| 欧美eee114| 久久精品一区二区免费看| 国产成人一区二区三中文| 999精品国产人妻无码系列| 亚洲一级特黄| 亚洲AV久久无码精品蜜桃| 色狠狠一区二区| 欧美日韩亚洲一区视频二区| 久久无码人妻AV精品一区 | WWW国产亚洲精品久久| 在线观看国产小视频| 亚洲欧美国产视频| 小蝌蚪视频在线观看免费观看WWW 小货SAO边洗澡边CAO你动漫 | 2021国产在线视频| 首页 国产 亚洲 中文字幕| 男女牲交大战免费播放| 久久久久99精品成人片三人毛片| 国产一区二区在线免费观看 | 国产偷抇久久精品A片蜜臀AV| 俄罗斯孩交精品| 超碰免费碰免费视频| BL低喘贯穿顶弄老师H| 99re1久久热在线播放| 在线成 人av影院| 玉林天天论坛| 怡春院国产精品视频| 伊人久久综合| 综合伊人久久| 91黄色大片|