前言背景
近期,經過龍芯中科與NCNN社區的共同努力,在NCNN中使用龍架構(LoongArch)向量優化實現了大部分算子,得益于龍架構向量的高效實現,優化后NCNN在平臺上各項性能測試比通用實現普遍提升一倍以上。
基于龍架構向量優化開啟前后的NCNN各項性能對比
(豎軸為耗時高度,越高耗時越久,性能越低)
NCNN作為業界首個為移動端優化的神經網絡前向計算框架,在2017年首次開源,是騰訊優圖實驗室第一次對外公開深度學習的研究成果。目前多應用在圖像方面,例如人像自動美顏,照片風格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網絡的特點,是許多開發者在移動端、嵌入式設備上部署深度學習算法的首選框架。
龍架構向量優化加入NCNN生態社區
本次優化共產出3萬多行代碼,成果將應用于龍芯AI邊緣計算場景,完成基于龍架構平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統、手勢識別、口罩檢測等等。依托于NCNN計算框架優秀的低耦結構,開發者只需關注算子在龍架構平臺上的高效實現,無需考慮整個系統結構問題,實現更高效的開發與部署工作。前期,NCNN與龍芯CPU進行了較為全面的適配和性能優化,共同打通了AI應用和國產CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計算場景
龍芯中科將與NCNN社區保持密切合作,繼續根據龍架構平臺向量特點不斷優化算子,推進龍架構生態成果落地更多場景、服務更多領域、歡迎社區廣大開發者與龍芯中科一道共建自主開放的龍架構生態體系。
審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
原文標題:龍架構向量創新賦能AI圖像識別計算,促進NCNN神經網絡前向計算框架性能翻倍
文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關注!文章轉載請注明出處。
相關推薦
RKNPU在深度學習運算能力上有了顯著的提升。
2.3、技術特點
高性能 :RKNPU采用專門的硬件架構和優化算法,能夠實現高效的神經網絡計算,滿足復雜場景下的實時處理需求。
低功耗
發表于 10-10 09:27
操作)算力的高性能神經網絡處理器單元(NPU)。這款NPU不僅擁有強大的計算能力,支持TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NN 等常見
發表于 08-13 11:26
當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練的神經網絡模型。 PyTorch中的神經網絡模型 1. 引言 深度學習是一種基于人工神經網絡的機器學習技術,它在
發表于 07-11 09:59
?723次閱讀
人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別、語音識
發表于 07-05 09:13
?1265次閱讀
過程中的作用。 1. 前向傳播(Forward Propagation) 前向傳播是神經網絡在接收輸入數據后,通過一系列
發表于 07-03 11:11
?1485次閱讀
神經網絡在許多領域都有廣泛的應用,如語音識別、圖像識別、自然語言處理等。然而,BP神經網絡也存在一些問題,如容易陷入局部最優解、訓練時間長、對初始權重敏感等。為了解決這些問題,研究者們
發表于 07-03 11:00
?830次閱讀
BP神經網絡算法,即反向傳播(Backpropagation)神經網絡算法,是一種多層前饋神經網絡,通過反向傳播誤差來訓練網絡權重。BP
發表于 07-03 09:52
?533次閱讀
卷積神經網絡(Convolutional Neural Network, CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡的計算
發表于 07-03 09:36
?628次閱讀
卷積操作 卷積神經網絡的核心是卷積操作。卷積操作是一種數學運算,用于提取圖像中的局部特征。在圖像識別中,卷積操作通過滑動窗口(或稱為濾波器、卷積核)在輸入圖像上進行掃描,
發表于 07-02 14:28
?1183次閱讀
神經網絡是一種強大的機器學習模型,廣泛應用于各種領域,如圖像識別、語音識別、自然語言處理等。神經網絡的核心是前
發表于 07-02 14:18
?855次閱讀
隨著人工智能技術的飛速發展,神經網絡在圖像識別領域的應用日益廣泛。神經網絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將詳細介紹
發表于 07-01 14:19
?695次閱讀
神經網絡架構是機器學習領域中的核心組成部分,它們模仿了生物神經網絡的運作方式,通過復雜的網絡結構實現信息的處理、存儲和傳遞。隨著深度學習技術的不斷發展,各種
發表于 07-01 14:16
?742次閱讀
* 通過開源開放推動更多人開展基于 FPGA 的類腦體系結構研究與學習,目前已開放至 Github。
1.2 應用領域
從 SNN 算法角度:
該目標圖像識別基于脈沖前饋卷積網絡,運用
發表于 06-25 18:35
我們的下一個任務是使用先前標記的圖像來訓練神經網絡,以對新的測試圖像進行分類。因此,我們將使用nn模塊來構建我們的神經網絡。
發表于 01-22 10:01
?1060次閱讀
計算機視覺是人工智能領域的一個重要分支,它致力于讓機器能夠像人類一樣理解和解釋圖像。隨著深度學習和神經網絡的發展,人們對于如何讓AI識別和理
發表于 01-12 08:27
?1481次閱讀
評論