關于維度的預備知識
在Tensor張量中,共有三維數據進行順序存放,分別是Channels(維度),Rows(行高), Cols(行寬),三維矩陣我們可以看作多個連續的二維矩陣組成,最簡單的方法就是使用嵌套的vector數組,但是這種方法非常不利于數據的訪問(尤其是內存不連續的問題)修改以及查詢,特別是在擴容的時候非常不方便,能滿足使用需求。
因此,綜合考慮靈活性和開發的難易度,我們會以Armadillo類中的arma::mat(矩陣 matrix)類和arma::cube作為數據管理(三維矩陣)類來實現Tensor 我們庫中類的主體,一個cube由多個matrix組成,cube又是Tensor類中的數據實際管理者。
首先我們講講Tensor類和Armadillo中兩個類的關系,可以從下方圖看出Tensor類中的數據均由arma::cube類進行管理擴充,我們設計的類以arma::cube為基礎實現了Tensor類,我們主要是提供了更方便的訪問方式和對外接口。
arma::cube是一個三維矩陣,分別是通道維度(slices或者channels),行維度(rows)和列維度(cols),請看下圖1, 圖中是兩個5行3列的矩陣,藍色的區域是數據的實際存儲區,灰色和和白色部分僅用作示意,在內存中實際不存在。
一個cube類由多個這樣的Matrix組成,圖1中表示的情況是arma::cube(2, 5, 3), 表示當前的三維矩陣共有2個矩陣構成,每個矩陣都是5行3列的。如果放在我們項目中會以這形式提供 Tensor tensor(2, 5, 3).
下圖2是這種情況下的三維結構圖,可以看出一個Cube一共有兩個Matrix,也就是共有兩個Channel. 一個Channel放一個Matrix. Matrix的行寬均為Rows和Cols.
Tensor方法總覽
我們從上面可以知道,我們的Tensor類是對armdillo庫中cube類的封裝,cube是多個Matrix的集合(二維矩陣的集合),關系圖如上圖1、圖2. 我們在這里對KuiperInfer中Tensor類的方法進行一個總覽,其中我們會讓大家親自動手實現兩個方法(加粗的兩個),只有動手起來才能參與其中。
類名 | 功能 |
---|---|
rows() | 返回Tensor的行數 |
cols() | 返回Tensor的列數 |
Fill(float value) | 填充Cube中的數據,以value值填充 |
「Padding(std::vector |
調整Matrix的維度,讓Rows和Cols變大一點:) |
at(uint32_t channel, row, col) | 返回Cube中第channel維,第row行,第col列的數據。 |
index(uint32_t offset) | 以另外一種方法來返回數據,返回Cube中第offset個數據,比如說在row行,col列,c維的一個數據,除了可以用tensor.at(c, row, col)方法訪問。我們也可以通過tensor.index(c × Rows × Cols + row × Cols + col)這種方式來訪問。可以參考圖4, 展平后的Matrix, at接口更適合用來存放展平后的數據。 |
「Fill(std::vector |
另外一個Fill方法, 我們需要以values中的所有數據去填充Tensor中的數據管理器cube類,注意values中數據的數量要等于Cube的行數×列數×維度 |
Flatten() | 將三維的矩陣展開鋪平為一維的。 |
Tensor類模板
Tensor共有兩個類型,一個類型是Tensor
如何創建一個Tensor
Tensor
如何訪問Tensor中數據(我們要大家實現的功能)
我們將在這個項目中為Tensor類定義多種訪問內部數據的方式。首先要講的是順序訪問方式,在tensor變量中,我們可以使用tensor.at(0, 1, 2)得到tensor變量中第0通道,第1行,第2列中存放的元素。
另外一種,我們可以使用tensor.index(0)這種方法來得到tensor變量中第0個數據 。我會在作業系統中給予大家充分的提示,讓大家準確無誤地把代碼寫出來。從下圖中可以看出,tensor.at(0,1,2)就是訪問圖中對應位置的點。第1個矩陣(channel = 0)中第2行(row = 1),第3列(col=2)中的數據。
再談談Tensor類中數據的排布
我們以具體的圖片作為例子,來講講Tensor中數據管理類arma::cube的數據排布方式,Tensor類是arma::cube對外更方便的接口,所以說armadillo::cube怎么管理內存的,Tensor類就是怎么管理內存的,希望大家的能理解到位。
如下圖中的一個Cube,Cube的維度是2,每個維度上存放的是一個Matrix,一個Matrix中的存儲空間被用來存放一張圖像(lena) . 一個框內(channel) 是一個Matrix,Matrix1存放在Cube第1維度(channel 1)上,Matrix2存放在Cube的第2維度上(channel 2). Matrix1和Matrix2的Rows和Cols均代表著圖像的高和寬,在本例中就是512和384.
如果將順序的一組數據[0,1,2,3,4,5....128]存放到一個大小為4×4的Matrix中,那么大家需要注意一個問題,我們的數據管理類Tensor(arma::cube)是列主序的,這一點和Opencv cv::Mat或者python numpy有一些不同。列主序在內存中的順序如下表:
審核編輯:劉清
-
tensorflow
+關注
關注
13文章
329瀏覽量
60528
原文標題:自制深度學習推理框架-張量類Tensor的實現-第二課
文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論