色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創作
電子發燒友網>電子資料下載>人工智能>如何通過深度學習,完成計算機視覺中的所有工作?

如何通過深度學習,完成計算機視覺中的所有工作?

2021-03-01 | pdf | 461.01KB | 次下載 | 2積分

資料介紹

作者 | George Seif
譯者 | 天道酬勤,責編 | Carol
出品 | AI科技大本營(ID:rgznai100)


你想做計算機視覺嗎?

如今,深度學習是必經之路。大規模數據集以及深層卷積神經網絡(CNN)的表征能力可提供超準確和強大的模型。但目前仍然只有一個挑戰:如何設計模型?

像計算機視覺這樣廣泛而復雜的領域,解決方案并不總是清晰明了的。計算機視覺中的許多標準任務都需要特別考慮:分類、檢測、分割、姿態估計、增強和恢復以及動作識別。盡管最先進的網絡呈現出共同的模式,但它們都需要自己獨特的設計。

那么,我們如何為所有這些不同的任務建立模型呢?

作者在這里向你展示如何通過深度學習完成計算機視覺中的所有工作!

1、分類

計算機視覺中最出名的就是分類。圖像分類網絡從一個固定大小的輸入開始。輸入圖像可以有任意數量的通道,但對于RGB圖像通常為3。在設計網絡時,分辨率在技術上可以是任意大小,只要足夠大到能夠支持在整個網絡中將要進行的向下采樣量即可。例如,如果你對網絡內的4個像素進行向下采樣,則你的輸入大小至少應為42= 16 x 16像素。

隨著深入網絡,當我們嘗試壓縮所有信息并降至一維矢量表示形式時,空間分辨率將降低。為了確保網絡始終有能力將其提取的所有信息進行處理,我們根據深度的比例增加特征圖的數量,來適應空間分辨率的降低。也就是說,我們在向下采樣過程中損失了空間信息,為了適應這種損失,我們擴展了特征圖來增加我們的語義信息。

在選擇了一定數量的向下采樣后,特征圖被矢量化并輸入到一系列完全連接的圖層中。最后一層的輸出與數據集中的類一樣多。


2、目標檢測

目標檢測器分為兩種:一級和二級。他們兩個都以錨框開始。這些是默認的邊界框。我們的檢測器將預測這些框與地面真相之間的差異,而不是直接預測這些框。
在二級檢測器中,我們自然有兩個網絡:框提議網絡和分類網絡??蛱嶙h網絡在認為很有可能存在物體的情況下為邊界框提供坐標。再次,這些是相對于錨框。然后,分類網絡獲取每個邊界框中的潛在對象進行分類。

在一級檢測器中,提議和分類器網絡融合為一個單一階段。網絡直接預測邊界框坐標和該框內的類。由于兩個階段融合在一起,所以一級檢測器往往比二級檢測器更快。但是由于兩個任務的分離,二級檢測器具有更高的精度。

快速RCNN二級目標檢測架構

SSD一級目標檢測架構

3、分割

分割是計算機視覺中較獨特的任務之一,因為網絡既需要學習低級信息,也需要學習高級信息。低級信息可按像素精確分割圖像中的每個區域和對象,而高級信息可直接對這些像素進行分類。這導致網絡被設計為將來自較早層和高分辨率(低層空間信息)的信息與較深層和低分辨率(高層語義信息)相結合。

如下所示,我們首先通過標準分類網絡運行圖像。然后,我們從網絡的每個階段提取特征,從而使用從低到高的范圍內的信息。每個信息級別在依次組合之前都是獨立處理的。當這些信息組合在一起時,我們對特征圖進行向上采樣,最終得到完整的圖像分辨率。

要了解更多關于如何分割與深度學習工作的細節,請查看這篇文章:
https://towardsdatascience.com/semantic-segmentation-with-deep-learning-...

GCN細分架構

4、姿態估計

姿態估計模型需要完成兩個任務:
(1)檢測圖像中每個身體部位的關鍵點;
(2)找出如何正確連接這些關鍵點。

這分以下三個階段完成:

① 使用標準分類網絡從圖像中提取特征。

② 給定這些特征,就可以訓練一個子網絡來預測一組2D熱圖。每個熱圖都與一個特定的關鍵點相關聯,并包含每個圖像像素關于是否可能存在關鍵點的置信值。

③ 再次給出分類網絡的特征,我們訓練一個子網絡來預測一組2D向量場,其中每個向量場都與關鍵點之間的關聯度進行編碼。然后,具有較高關聯性的關鍵點被稱為已連接。

用這種方法訓練子網絡的模型,可以聯合優化關鍵點的檢測并將它們連接在一起。

OpenPose姿態估計架構

5、增強和恢復

增強和恢復網絡是它們自己獨特的野獸。我們不會對此進行任何向下采樣,因為我們真正關心的是高像素/空間精度。向下采樣會真正抹殺這些信息,因為它將減少我們為空間精度而擁有的像素數。相反,所有處理都是在全圖像分辨率下完成的。

我們開始以全分辨率將想要增強/恢復的圖像傳遞到我們的網絡,而無需進行任何修改。網絡僅由許多卷積和激活函數組成。這些塊通常是受啟發的,并且有時直接復制那些最初為圖像分類而開發的塊,例如殘差塊、密集塊、擠壓激勵塊等。最后一層沒有激活函數,即使是sigmoid或softmax也沒有,因為我們想直接預測圖像像素,不需要任何概率或分數。

這就是所有這些類型的網絡。在圖像的全分辨率上進行了大量的處理,來達到較高的空間精度,使用了與其他任務相同的卷積。

EDSR超分辨率架構

6、動作識別

動作識別是少數幾個需要視頻數據才能正常運行的應用程序之一。要對一個動作進行分類,我們需要了解隨著時間推移,場景中發生的變化, 這自然導致我們需要視頻。我們的網絡必須經過訓練來學習時空信息,即時空變化。最完美的網絡是3D-CNN。

顧名思義,3D-CNN是使用3D卷積的卷積網絡。它們與常規CNN的不同之處在于,卷積是在3維上應用的:寬度、高度和時間。因此,每個輸出像素都是根據其周圍像素以及相同位置的前一幀和后一幀中的像素進行計算來預測的。

直接大量傳遞圖像

視頻幀可以通過幾種方式傳遞:

直接在大批量中,例如第一個圖。由于我們正在傳遞一系列幀,因此空間和時間信息都是可用的。

單幀+光流(左) 視頻+光流(右)

我們還可以在一個流中傳遞單個圖像幀(數據的空間信息),并從視頻中傳遞其相應的光流表示形式(數據的時間信息)。我們將使用常規2D CNN從這兩者中提取特征,然后再將其組合起來傳遞給我們的3D CNN,后者將兩種類型的信息進行合并。

將幀序列傳遞給一個3D CNN,并將視頻的光流表示傳遞給另一個3D CNN。這兩個數據流都具有可用的空間和時間信息。鑒于我們正在對視頻的兩種不同表示(均包含我們的所有信息)進行特定處理,因此這是最慢的選擇,但也可能是最準確的選擇。

所有這些網絡都輸出視頻的動作分類。

原文:https://towardsdatascience.com/how-to-do-everything-in-computer-vision-2...

文章來源于AI科技大本營,作者George Seif

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1491次下載  |  免費
  3. 2單片機典型實例介紹
  4. 18.19 MB  |  95次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于單片機和 SG3525的程控開關電源設計
  14. 0.23 MB  |  4次下載  |  免費
  15. 8基于AT89C2051/4051單片機編程器的實驗
  16. 0.11 MB  |  4次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關電源設計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537793次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費
主站蜘蛛池模板: 18禁无遮遮挡羞漫画免费阅读| 十二月综合缴缴情| 彭丹吃奶门| 日韩av无码在线直播 | 国产精片久久久久久婷婷| 国产国产成年在线视频区| 国内精品偷拍在线观看| 久久精品国产亚洲精品2020| 美女被C污黄网站免费观看| 青娱乐国产精品视频| 吸奶舔下面| 伊人久久青青| TUBE8最新日本护士| 国产精品人成视频免费999| 九九热在线视频精品店| 男女爽爽无遮挡午夜视频在线观看| 青草在线观看视频| 亚洲成AV人电影在线观看| 中字幕久久久人妻熟女天美传媒 | swag合集120部| 光棍天堂在线a| 久草视频在线观看免费4| 欧美乱妇日本无乱码特黄大片| 天天摸夜添狠狠添高| 在线精品一卡乱码免费| 成人免费在线| 久久精品视频在线看15| 欧美日本高清动作片www网站| 午夜福利免费0948视频| 曰本熟妇乱妇色A片在线| 全黄h全肉细节文在线观看| 国产一卡2卡3卡4卡孕妇网站| www.一级毛片| 韩国电影real在线观看完整版| hdsexvideos中国明星| 一个人在线观看免费高清视频| 世界第一黄暴漫画家| 日韩AV无码一区二区三区不卡毛片| 久青草影院| 老头狠狠挺进小莹体内视频| 精品无码一区二区三区不卡|