ios10中神經(jīng)網(wǎng)絡分析
大?。?/span>0.5 MB 人氣: 2017-10-10 需要積分:1
有時候,我們可能想超越平臺內置API的限制,創(chuàng)造獨一無二的東西。但更多的時候,我們是使用了一些現(xiàn)成的庫或直接建于Accelerate或Metal的快速計算功能之上,推出自己的機器學習功能。
例如,我的同事專為辦公室建立了一個錄入系統(tǒng),只使用一臺可檢測人臉的iPad,然后在Slack投遞一個gif,并允許用戶通過自定義命令開門。
但是現(xiàn)在,我們有了用于神經(jīng)網(wǎng)絡的第一方支持:在2016年的WWDC上,蘋果公司推出了兩個神經(jīng)網(wǎng)絡的API,分別稱為基礎神經(jīng)網(wǎng)絡子程序(BNNS)和卷積神經(jīng)網(wǎng)絡(CNN)。
機器學習和神經(jīng)網(wǎng)絡
AI先驅Arthur Samuel將機器學習定義為“沒有明確編程的情況下,給予計算機學習能力的研究領域”。人們用機器學習系統(tǒng)理解一些數(shù)據(jù)的意義,而這些數(shù)據(jù)不能很容易地使用傳統(tǒng)模型來描述。
例如,編寫一段計算房子建筑面積的程序很容易,我們可以考慮到所有房間和其他空間的規(guī)模和形狀,但是卻不能在公式中計算房子的價值;而另一方面,機器學習系統(tǒng)卻非常適合解決這樣的問題。通過給系統(tǒng)提供已知的具體數(shù)據(jù),如市場價值、房屋尺寸、臥室數(shù)量等,從而可以利用它預測價格。
神經(jīng)網(wǎng)絡是構建機器學習系統(tǒng)最常用的模型之一。早在半個多世紀前的1940年,已經(jīng)發(fā)展了神經(jīng)網(wǎng)絡的數(shù)學基礎,而上世紀80年代,并行計算才使其更為可行;并且到了2000年,人們對于深度學習的興趣又引發(fā)了神經(jīng)網(wǎng)絡的回潮。
神經(jīng)網(wǎng)絡由多個層構造,其中每個層由一個或多個節(jié)點組成。最簡單的神經(jīng)網(wǎng)絡具有三層:輸入、隱藏和輸出。輸入層節(jié)點可以代表圖像中的各個像素或一些其他參數(shù);如果我們試著自動檢測照片的內容,輸出層節(jié)點則經(jīng)常作為分類的結果,例如“狗”或“貓”;隱藏層節(jié)點配置為對輸入執(zhí)行操作,或配置為應用激活函數(shù)。
層類型
三種常見的層的類型為:池化(pooling)層、卷積層和全連接層。
池化層通常通過使用輸入的最大值或平均值來匯集數(shù)據(jù),降低其大小。一系列的卷積和池化層可以結合起來,用于將照片逐步提煉成越來越高層次的特征集合。
卷積層將卷積矩陣用于圖像的每個像素,實現(xiàn)圖像變換。如果你已經(jīng)用過Pixelmator或Photoshop濾鏡,那你很可能也用過了卷積矩陣。卷積矩陣通常是一個3×3或5×5的矩陣,被施加到輸入圖像的像素中,以計算輸出圖像中新的像素值。為獲得輸出像素值,我們就乘以原圖像中的像素值,并計算平均值。
例如,該卷積矩陣用于圖像模糊:
1 1 1 1 1 1 1 1 1
而下面的矩陣能夠銳化圖像:
0 -1 0 -15-10 -1 0
神經(jīng)網(wǎng)絡的卷積層使用卷積矩陣處理輸入,并產生下一層的數(shù)據(jù)。例如,提取圖像中的諸如邊緣特征的新特性。
全連接層可以被認為是濾波器尺寸和原始圖像相同的卷積層。換句話說,你可以這么認為,全連接層是一個函數(shù),能夠為每個像素分配權重,平均其結果,然后給出單個的輸出值。
訓練和推理
每一層都需要配置適當?shù)膮?shù)。例如,卷積層需要輸入和輸出圖像的信息(規(guī)模、通道數(shù)目等),也需要卷積層參數(shù)(內核大小、矩陣等)。全連接層通過輸入和輸出向量、激活函數(shù)和權重來定義。
要獲得這些參數(shù),必須訓練神經(jīng)網(wǎng)絡。需要以下幾步才能完成:通過神經(jīng)網(wǎng)絡傳遞輸入,確定輸出,測量誤差(即實際結果與預測結果相差多遠),并通過反向傳播調整權重。訓練神經(jīng)網(wǎng)絡可能需要數(shù)百、數(shù)千甚至成千上萬的樣本。
目前,蘋果公司新的機器學習API,可用于構建只做推理的神經(jīng)網(wǎng)絡,而不是訓練。這都是Big Nerd Ranch的功勞。
Accelerate: BNNS
第一個新的API是Accelerate框架的一部分,被稱為基礎神經(jīng)網(wǎng)絡子程序(BNNS,Basic Neural Network Subroutines)。BNNS補充了BLAS(基礎線性代數(shù)子程序),并用于一些第三方的機器學習應用。
BNNS在BNNSFilter類中定義層。Accelerate支持三種類型的層:
卷積層(由BNNSFilterCreateConvolutionLayer函數(shù)創(chuàng)建)全連接層(BNNSFilterCreateFullyConnectedLayer)池化層(BNNSFilterCreatePoolingLayer)
MNIST 數(shù)據(jù)庫是一個眾所周知的數(shù)據(jù)集,包含數(shù)以萬計的手寫數(shù)字,用于掃描和調整,以適應20乘20像素的圖像。
一種處理圖像數(shù)據(jù)的方法是將圖像轉換成矢量,并使之通過一個全連接層。對于MNIST數(shù)據(jù),一個20×20的圖像將成為400個值的矢量。下面展示了如何將手寫的數(shù)字“1”轉換為向量:
下面是配置全連接層的實例代碼,該層將大小為400的矢量作為輸入,采用S形的激活函數(shù),輸出矢量大小為25:
// input layer deor BNNSVectorDeor i_desc = { .size= 400, .data_type = BNNSDataTypeFloat32, .data_scale = 0, .data_bias = 0, };// hidden layer deor BNNSVectorDeor h_desc = { .size= 25, .data_type = BNNSDataTypeFloat32, .data_scale = 0, .data_bias = 0, };// activation function BNNSActivation activation = { .function= BNNSActivationFunctionSigmoid, .alpha= 0, .beta= 0, };BNNSFullyConnectedLayerParameters in_layer_params = { .in_size = i_desc.size, .out_size = h_desc.size, .activation= activation, .weights.data= theta1, .weights.data_type = BNNSDataTypeFloat32, .bias.data_type = BNNSDataTypeFloat32, };// Common filter parameters BNNSFilterParameters filter_params = { .version= BNNSAPIVersion_1_0; // API version is mandatory};// Create a new fully connected layer filter (ih = input-to-hidden) BNNSFilter ih_filter = BNNSFilterCreateFullyConnectedLayer(&i_desc, &h_desc, &in_layer_params, &filter_params);float * i_stack = bir; // (float *)calloc(i_desc.size, sizeof(float));float * h_stack = (float *)calloc(h_desc.size, sizeof(float));float * o_stack = (float *)calloc(o_desc.size, sizeof(float));int ih_status = BNNSFilterApply(ih_filter, i_stack, h_stack);
Metal!
該部分會得到更多的Metal嗎?確實是的,因為第二個神經(jīng)網(wǎng)絡API是Metal Performance Shaders(MPS)框架的一部分。Accelerate是在CPU上進行快速計算的框架,而Metal將GPU發(fā)揮了極致。Metal的特點是卷積神經(jīng)網(wǎng)絡(CNN,Convolution Neural Network)。
MPS自帶了一個類似的API集。
創(chuàng)建卷積層需要使用MPSCNNConvolutionDeor和MPSCNNConvolution函數(shù)。MPSCNNPoolingMax將為池化層提供參數(shù)。全連接層由MPSCNNFullyConnected函數(shù)創(chuàng)建。激活函數(shù)由MPSCNNNeuron的子類定義:
MPSCNNNeuronLinearMPSCNNNeuronReLUMPSCNNNeuronSigmoidMPSCNNNeuronTanHMPSCNNNeuronAbsolute
BNNS和CNN的比較
下表為Accelerate和Metal激活函數(shù)列表:
Accelerate/BNNS
Metal Performance Shaders/CNN
BNNSActivationFunctionIdentity
BNNSActivationFunctionRectifiedLinear MPSCNNNeuronReLU
MPSCNNNeuronLinear
BNNSActivationFunctionLeakyRectifiedLinear
BNNSActivationFunctionSigmoid MPSCNNNeuronSigmoid
BNNSActivationFunctionTanh MPSCNNNeuronTanH
BNNSActivationFunctionScaledTanh
BNNSActivationFunctionAbs MPSCNNNeuronAbsolute
池化函數(shù):
Accelerate/BNNS
Metal Performance Shaders/CNN
BNNSPoolingFunctionMax MPSCNNPoolingMax
BNNSPoolingFunctionAverage MPSCNNPoolingAverage
Accelerate和Metal為神經(jīng)網(wǎng)絡提供的一組函數(shù)功能非常相似,所以二者選擇取決于每個應用程序。GPU通常首選各種機器學習所需的計算,而數(shù)據(jù)局部性可能會導致Metal CNN的運行性能比Accelerate BNNS版本要差。如果神經(jīng)網(wǎng)絡對已存入GPU的圖像進行操作,例如,使用MPSImage和新MPSTemporaryImage時,很明顯,這時更適合用Metal。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
ios10中神經(jīng)網(wǎng)絡分析下載
相關電子資料下載
- 如何創(chuàng)建FPGA控制的機器人手臂 49
- 機器學習需要掌握的九種工具盤點 16
- 深度學習在工業(yè)缺陷檢測中的應用 63
- 智慧礦山:AI算法為何能提高未戴安全帶識別準確率! 51
- Hugging Face被限制訪問 404
- 《人工智能在指揮和控制系統(tǒng)中的決策支持》 133
- 生成式人工智能和機器學習正在這9個學科中打造未來 216
- 利用PyTorch實現(xiàn)NeRF代碼詳解 79
- 卷積神經(jīng)網(wǎng)絡中的池化方式 81
- 使用DNN深度神經(jīng)網(wǎng)絡實現(xiàn)圖像AIGC的開發(fā)-基于米爾瑞薩RZ/G2L開發(fā)板的創(chuàng)新應用 148