天天综合天天色,一级视频在线免费观看,亚洲最大在线观看

有一種叫做注意機制的東西，但是你不需要知道注意力具體實現。

RNN/LSTM的不足。

A. Vaswani等人的《Attention Is All You Need》被認為是解決了眾所周知的LSTM/RNN體系結構在深度學習空間中的局限性的突破之一。本文介紹了transformers 在seq2seq任務中的應用。該論文巧妙地利用了 D.Bahdanau 等人通過聯合學習對齊和翻譯的神經機器翻譯注意機制的使用。并且提供一些示例明確且詳盡地解釋了注意力機制的數學和應用。

在本文中，我將專注于注意力機制的位置編碼部分及其數學。

假設您正在構建一個 seq2seq 學習任務，并且您想要開發一個模型，該模型將輸入英語句子并將其翻譯成其他語言。“All animals are equal but some are more equal than others ”→Badhā prā?ī’ō samāna chē parantu kē?alāka an’ya karatā vadhu samāna chē你的第一步是獲取這個輸入句子，運行一個分詞器，將它轉換成數字，然后將它傳遞給一個嵌入層，這可能會為這個句子中的每個單詞添加一個額外的維度。

在運行 RNN 或 LSTM 時，隱藏狀態保留單詞在句子中的相對位置信息。然而，在 Transformer 網絡中，如果編碼器包含一個前饋網絡，那么只傳遞詞嵌入就等于為您的模型增加了不必要的混亂，因為在詞嵌入中沒有捕獲有關句子的順序信息。為了處理單詞相對位置的問題，位置編碼的想法出現了。

在從嵌入層提取詞嵌入后，位置編碼被添加到這個嵌入向量中。

解釋位置編碼最簡單的方法是為每個單詞分配一個唯一的數字 ∈ ? 。或者為每個單詞分配一個在［0，1］ ∈ ? 范圍內的實數（如果輸入句子很長，這樣可以處理很大的值）。但是，上述兩種方法都沒有捕捉到單詞之間時間步長的準確性。為了克服這個問題，本文使用了 sin 和 cosine 函數形式的位置編碼。

打個比方，我們輸入模型的序列，無論是句子、視頻序列還是股票市場價格數據，都將始終是時域信號。表示時域信號的最佳方式是通過正弦方程 sin（ωt）。如果我們巧妙地使用這個波動方程，我們可以在一次拍攝中捕獲詞嵌入的時間和維度信息。

讓我們看一下這個等式，在接下來的步驟中，我們將嘗試把它形象化。

讓我們考慮一個簡單的句子，它被分詞，然后它的詞嵌入被提取。句子長度為5，嵌入維數為8。因此，每個單詞都表示為1x8的向量。

現在我們在時間維度上取一個序列把正弦PE向量加到這個嵌入向量上。

進一步，我們對沿dim維數的其他向量做類似的操作。

本文在嵌入向量中交替加入正弦和余弦。如果dim是偶數，則sin級數相加，如果dim是奇數，則cos級數相加。

這很好地捕獲了沿時間維度（或等式中描述的 pos 維度。我將 pos 和 time 互換使用，因為它們意味著相同的事情）但是如何也捕獲沿dims維度的相對位置信息呢？這里的答案也在于等式本身。ω 項。

隨著 i 從 0 增加到 d_embedding/2，頻率也從 1/2π 減少到 1/（2π.10000）

因此我們看到，沿著無序方向的每個向量，位置的唯一性被捕獲。該論文還描述了這種編碼的魯棒性。但是我仍然無法找出為什么特別使用數字 10000 進行位置編碼（它可能是一個超參數嗎？）。這個解釋粗略地展示了如何使用正弦和余弦對于模型理解是非常合理和有效的。下面的圖表本身講述了位置編碼如何隨位置（時間）和尺寸變化。

人們可以很容易地看到，這些是簡單的時頻圖，其中位置代表時間，深度代表頻率。時間頻率圖已被用于從射電天文學到材料光譜分析的許多應用中。因此，從現有的現實世界系統構建類比確實可以更好地理解問題。

這是我對注意力機制中使用的位置編碼的看法。在接下來的系列中，我將嘗試撰寫有關編碼器-解碼器部分的內容，并將注意力應用于現實世界的規模問題。

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4771

瀏覽量
100718
編碼

編碼

+關注

關注
6

文章
940

瀏覽量
54814
rnn

rnn

+關注

關注
0

文章
89

瀏覽量
6886
LSTM

LSTM

+關注

關注
0

文章
59

瀏覽量
3748

原文標題：位置編碼在注意機制中的作用

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

編碼器在機器人技術中的應用編碼器在傳感器系統中的作用

編碼器在機器人技術中扮演著至關重要的角色，特別是在傳感器系統中，其作用不可忽視。以下是對

發表于 11-24 10:02 ?472次閱讀

磁編碼器的安裝注意事項磁編碼器在測量系統中的作用

磁編碼器的安裝注意事項磁編碼器的安裝過程需要特別注意以下幾點，以確保其能夠正常工作并長期保持高精度：避免直接沖擊：在安裝磁

發表于 11-23 09:28 ?224次閱讀

磁編碼器在工業自動化中的應用

磁編碼器在工業自動化中的應用非常廣泛，其基于磁場變化來測量轉速和位置的工作原理，使其在提升生產效率、優化產品質量以及降低能耗等方面發揮著不可

發表于 11-23 09:09 ?412次閱讀

MySQL編碼機制原理

前言一位讀者在本地部署 MySQL 測試環境時碰到一個問題，我覺得挺有代表性的，所以寫篇文章介紹一下，看完相信你會對 MySQL 的編碼機制有最本質的了解，本文的目錄結構如下讀者問題簡介

發表于 11-09 11:01 ?222次閱讀

對于多級放大電路板，在PCB布局中，電源擺放的位置應該注意什么？

對于多級放大電路板，在PCB布局中，電源擺放的位置應該注意什么，我在一些資料上看到過：多級放大電路中

發表于 09-20 08:25

全極霍爾傳感器AH471在電動牙刷中起位置檢測作用

全極霍爾傳感器AH471在電動牙刷中起位置檢測作用

發表于 09-14 09:58 ?289次閱讀

電機控制系統中的編碼器概述與作用

編碼器分辨率是描述編碼器在測量運動過程中所能分辨的最小位置變化量的指標。理解編碼器分辨率對于設計和實現高精度的運動控制系統至關重要。以下是對

發表于 08-17 19:49 ?565次閱讀

簡述半導體原理——晶體管家族的核心工作機制

簡述半導體原理——晶體管家族的核心工作機制

發表于 07-20 08:14 ?961次閱讀

伺服電機編碼器的作用和功能是什么

伺服電機編碼器是伺服電機系統中的重要組成部分，它的作用和功能對于整個系統的穩定性、精度和可靠性具有至關重要的影響。本文將詳細介紹伺服電機編碼器的作用

發表于 06-17 11:09 ?2016次閱讀

伺服電機編碼器起什么作用

伺服電機編碼器是伺服系統中的重要組成部分，它的作用是將伺服電機的旋轉位置、速度等信息轉換成電信號，為控制系統提供反饋信息。一、伺服電機編碼

發表于 06-17 10:52 ?1863次閱讀

旋轉編碼器在PLC中怎么編程

在工業自動化領域，旋轉編碼器與可編程邏輯控制器（PLC）的結合應用極為廣泛。旋轉編碼器通過提供精確的旋轉角度或位置信息，為PLC提供反饋信號，進而實現對設備的精確控制。本文將詳細介紹旋

發表于 06-17 09:24 ?1627次閱讀

編碼器在機器人系統中的應用

隨著科技的飛速發展，機器人技術已廣泛應用于工業、醫療、服務等多個領域。在機器人系統中，編碼器作為核心的位置和速度檢測裝置，發揮著至關重要的作用

發表于 06-13 14:51 ?813次閱讀

編碼器在自動化系統中的應用

在現代自動化系統中，編碼器作為一種關鍵的位置和速度檢測裝置，發揮著不可替代的作用。它能夠將電機的角位移或直線位移轉換為可計量的電信號，為控制

發表于 06-13 14:50 ?839次閱讀

伺服電機后面的編碼器起什么作用

。本文將詳細介紹伺服電機后面的編碼器的作用、工作原理、分類以及在伺服系統中的應用。一、編碼器的作用

發表于 06-05 14:53 ?1817次閱讀

絕對值編碼器的工作原理及其在電機控制中的應用

絕對值編碼器在電機控制系統中的應用在電機控制系統中，絕對值編碼器帶來了精確的

發表于 05-21 10:55 ?1144次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

簡述位置編碼在注意機制中的作用

評論

編碼器在機器人技術中的應用編碼器在傳感器系統中的作用

磁編碼器的安裝注意事項磁編碼器在測量系統中的作用

磁編碼器在工業自動化中的應用

MySQL編碼機制原理

對于多級放大電路板，在PCB布局中，電源擺放的位置應該注意什么？

全極霍爾傳感器AH471在電動牙刷中起位置檢測作用

電機控制系統中的編碼器概述與作用

簡述半導體原理——晶體管家族的核心工作機制

伺服電機編碼器的作用和功能是什么

伺服電機編碼器起什么作用

旋轉編碼器在PLC中怎么編程

編碼器在機器人系統中的應用

編碼器在自動化系統中的應用

伺服電機后面的編碼器起什么作用

絕對值編碼器的工作原理及其在電機控制中的應用