色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習在計算機視覺領域的瓶頸已至

悟空智能科技 ? 來源:lq ? 2019-02-18 14:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一片欣欣向榮背后,深度學習計算機視覺領域的瓶頸已至。提出這個觀點的,不是外人,正是計算機視覺奠基者之一,約翰霍普金斯大學教授Alan Yuille,他還是霍金的弟子。

他說,現在做AI不提神經網絡,成果都很難發表了,這不是個好勢頭。

如果人們只追神經網絡的潮流,拋棄所有老方法;如果人們只會刷榜,不去想怎樣應對深度網絡的局限性,這個領域可能很難有更好的發展。

面對深度學習的三大瓶頸,Yuille教授給出兩條應對之道:靠組合模型培養泛化能力,用組合數據測試潛在的故障。

觀點發表之后,引發不少的共鳴。Reddit話題熱度快速超過200,學界業界的AI科學家們也紛紛在Twitter上轉發。

Reddit網友評論道,以Yuille教授的背景,他比別人更清楚在深度學習在計算機視覺領域現狀如何,為什么出現瓶頸。

深度學習的三大瓶頸

Yuille指出,深度學習雖然優于其他技術,但它不是通用的,經過數年的發展,它的瓶頸已經凸顯出來,主要有三個:

需要大量標注數據

深度學習能夠實現的前提是大量經過標注的數據,這使得計算機視覺領域的研究人員傾向于在數據資源豐富的領域搞研究,而不是去重要的領域搞研究。

雖然有一些方法可以減少對數據的依賴,比如遷移學習、少樣本學習、無監督學習和弱監督學習。但是到目前為止,它們的性能還沒法與監督學習相比。

過度擬合基準數據

深度神經網絡在基準數據集上表現很好,但在數據集之外的真實世界圖像上,效果就差強人意了。比如下圖就是一個失敗案例。

一個用ImageNet訓練來識別沙發的深度神經網絡,如果沙發擺放角度特殊一點,就認不出來了。這是因為,有些角度在ImageNet數據集里很少見。

在實際的應用中, 如果深度網絡有偏差,將會帶來非常嚴重的后果。

要知道,用來訓練自動駕駛系統的數據集中,基本上從來沒有坐在路中間的嬰兒。

對圖像變化過度敏感

深度神經網絡對標準的對抗性攻擊很敏感,這些攻擊會對圖像造成人類難以察覺的變化,但可能會改變神經網絡對一個物體的認知。

而且,神經網絡對場景的變化也過于敏感。比如下面的這張圖,在猴子圖片上放了吉他等物體,神經網絡就將猴子識別成了人類,吉他識別成了鳥類。

背后的原因是,與猴子相比,人類更有可能攜帶吉他,與吉他相比,鳥類更容易出現在叢林中。

這種對場景的過度敏感,原因在于數據集的限制。

對于任何一個目標對象,數據集中只有有限數量的場景。在實際的應用中,神經網絡會明顯偏向這些場景。

對于像深度神經網絡這樣數據驅動的方法來說,很難捕捉到各種各樣的場景,以及各種各樣的干擾因素。

想讓深度神經網絡處理所有的問題,似乎需要一個無窮大的數據集,這就給訓練和測試數據集帶來了巨大的挑戰。

為什么數據集會不夠大?

這三大問題,還殺不死深度學習,但它們都是需要警惕的信號

Yuille說,瓶頸背后的原因,就是一個叫做“組合爆炸”的概念:

就說視覺領域,真實世界的圖像,從組合學觀點來看太大量了。任何一個數據集,不管多大,都很難表達出現實的復雜程度。

那么,組合學意義上的大,是個什么概念?

大家想象一下,現在要搭建一個視覺場景:你有一本物體字典,要從字典里選出各種各樣的物體,把它們放到不同的位置上。

說起來容易,但每個人選擇物體、擺放物體的方法都不一樣,搭出的場景數量是可以指數增長的。

就算只有一個物體,場景還是能指數增長。因為,它可以用千奇百怪的方式被遮擋;物體所在的背景也有無窮多種。

人類的話,能夠自然而然適應背景的變化;但深度神經網絡對變化就比較敏感了,也更容易出錯:

△是的,前面出現過了

也不是所有視覺任務都會發生組合爆炸(Combinatorial Explosion) 。

比如,醫學影像就很適合用深度網絡來處理,因為背景少有變化:比如,胰腺通常都會靠近十二指腸。

但這樣的應用并不常見,復雜多變的情況在現實中更普遍。如果沒有指數意義上的大數據集,就很難模擬真實情況。

而在有限的數據集上訓練/測試出來的模型,會缺乏現實意義:因為數據集不夠大,代表不了真實的數據分布。

那么,就有兩個新問題需要重視:

1、怎樣在有限的數據集里訓練,才能讓AI在復雜的真實世界里也有很好的表現?

2、怎樣在有限的數據集里,高效地給算法做測試,才能保證它們承受得了現實里大量數據的考驗?

組合爆炸如何應對?

數據集是不會指數型長大的,所以要試試從別的地方突破。

可以訓練一個組合模型,培養泛化能力。也可以用組合數據來測試模型,找出容易發生的故障。

總之,組合是關鍵。

訓練組合模型

組合性 (Compositionality) 是指,一個復雜的表達,它的意義可以通過各個組成部分的意義來決定。

這里,一個重要的假設就是,一個結構是由許多更加基本的子結構,分層組成的;背后有一些語法規則。

這就表示,AI可以從有限的數據里,學會那些子結構和語法,再泛化到各種各樣的情景里。

與深度網絡不同,組合模型 (Compositional Models) 需要結構化的表示方式,才能讓結構和子結構更明確。

組合模型的推斷能力,可以延伸到AI見過的數據之外:推理、干預、診斷,以及基于現有知識結構去回答不同的問題。

引用Stuart German的一句話:

The world is compositional or God exists.

世界是組合性的,不然,上帝就是存在的。

雖然,深度神經網絡也有些組合性:高級特征是由低級特征的響應組成的;但在本文所討論的意義上,深度神經網絡并不是組合性的。

組合模型的優點已經在許多視覺任務里面體現了:比如2017年登上Science的、用來識別CAPTCHA驗證碼的模型。

還有一些理論上的優點,比如可解釋,以及可以生成樣本。這樣一來,研究人員就更加容易發現錯誤在哪,而不像深度神經網絡是個黑盒,誰也不知道里面發生了什么。

但要學習組合模型,并不容易。因為這里需要學習所有的組成部分和語法;

還有,如果要通過合成 (Synthesis) 來作分析,就需要有生成模型(Generative Models) 來生成物體和場景結構。

就說圖像識別,除了人臉、字母等等少數幾種很有規律的圖案之外,其他物體還很難應付:

從根本上說,要解決組合爆炸的問題,就要學習3D世界的因果模型(Causal Models) ,以及這些模型是如何生成圖像的。

有關人類嬰兒的研究顯示,他們是通過搭建因果模型來學習的,而這些模型可以預測他們生活環境的結構。

對因果關系的理解,可以把從有限數據里學到的知識,有效擴展到新場景里去。

在組合數據里測試模型

訓練過后,該測試了。

前面說過,世界那么復雜,而我們只能在有限的數據上測試算法。

要處理組合數據 (Combinatorial Data) ,博弈論是一種重要的方法:它專注于最壞情況(Worst Case) ,而不是平均情況 (Average Case) 。

就像前面討論過的那樣,如果數據集沒有覆蓋到問題的組合復雜性,用平均情況討論出的結果可能缺乏現實意義。

而關注最壞情況,在許多場景下都是有意義的:比如自動駕駛汽車的算法,比如癌癥診斷的算法。因為在這些場景下,算法故障可能帶來嚴重的后果。

如果,能在低維空間里捕捉到故障模式 (Failure Modes) ,比如立體視覺的危險因子 (Hazard Factors) ,就能用圖形和網格搜索來研究這些故障。

但是對于大多數視覺任務,特別是那些涉及組合數據的任務,通常不會有能找出幾個危險因子、隔離出來單獨研究的簡單情況。

△對抗攻擊:稍稍改變紋理,只影響AI識別,不影響人類

有種策略,是把標準對抗攻擊(Adversarial Attacks) 的概念擴展到包含非局部結構(Non-Local Structure) ,支持讓圖像或場景發生變化的復雜運算,比如遮擋,比如改變物體表面的物理性質,但不要對人類的認知造成重大改變。

把這樣的方法應用到視覺算法上,還是很有挑戰性的。

不過,如果算法是用組合性(Compositional) 的思路來寫,清晰的結構可能會給算法故障檢測帶來很大的幫助。

關于Alan Yuille

Alan Yuille,目前就職于約翰霍普金斯大學,是認知科學和計算機科學的杰出教授。

1976年,在劍橋大學數學專業獲得學士學位。之后師從霍金,在1981年獲得理論物理博士學位。

畢業之后,轉而開拓計算機視覺領域。并先后就職于麻省理工學院的人工智能實驗室,哈佛大學計算機系等等學術機構。

2002年加入UCLA,之后擔任視覺識別與機器學習中心主任,同時也在心理學系,計算機系,精神病學和生物行為學系任客座教授。

2016年,加入約翰霍普金斯大學。

他曾獲得ICCV的最佳論文獎,2012年,擔任計算機視覺頂級會議CVPR的主席,計算機視覺界的奠基人之一。

此外,Alan Yuille也直接影響了中國AI的發展,其嫡系弟子朱瓏博士學成后,回國創辦了AI公司依圖科技,現在也是中國CV領域最知名的創業公司之一。

這篇文章中的觀點,出自Yuille在2018年5月發表的一篇論文,共同作者是他的博士生Chenxi Liu,在今年一月份,他們對這篇論文進行了更新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103497
  • 計算機視覺
    +關注

    關注

    9

    文章

    1708

    瀏覽量

    46758
  • 深度學習
    +關注

    關注

    73

    文章

    5560

    瀏覽量

    122763

原文標題:三大瓶頸扼住深度學習咽喉

文章出處:【微信號:WUKOOAI,微信公眾號:悟空智能科技】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數據的支持范圍。增加這項支持后,該平臺將能夠用于開發低功耗、低內存的邊緣AI視覺模型。這將給諸多應用
    的頭像 發表于 03-11 15:11 ?370次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持

    量子計算機與普通計算機工作原理的區別

    ? 本文介紹了量子計算機與普通計算機工作原理的區別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然
    的頭像 發表于 11-24 11:00 ?1455次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區別

    工業計算機類型介紹

    ,各行各業80%的企業依靠計算機進行日常運營,使其成為成功不可或缺的工具。從小型企業到大型企業,計算機已成為工業領域的支柱,推動著增長并推動企業向前發展。本文中,我們將
    的頭像 發表于 11-04 15:56 ?659次閱讀
    工業<b class='flag-5'>計算機</b>類型介紹

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉換
    的頭像 發表于 10-31 17:00 ?1214次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及<b class='flag-5'>學習</b>路線

    信號繼電器計算機系統中的應用

    信號繼電器計算機系統中的應用是一個重要且復雜的領域,它作為電氣控制的關鍵元件,計算機系統中發揮著信號轉換、隔離、放大以及控制等多種作用。
    的頭像 發表于 09-27 16:29 ?922次閱讀

    晶體管計算機和電子管計算機有什么區別

    晶體管計算機和電子管計算機作為計算機發展史上的兩個重要階段,它們多個方面存在顯著的區別。以下是對這兩類計算機
    的頭像 發表于 08-23 15:28 ?3573次閱讀

    如何利用ARMxy ARM嵌入式計算機的NPU進行深度學習模型的訓練和優化?

    正文開始前,我們先大致了解鋇錸的ARMxy ARM嵌入式計算機,再來說說我們如何利用ARMxy ARM嵌入式計算機的NPU來實現深度學習
    的頭像 發表于 08-20 13:43 ?746次閱讀
    如何利用ARMxy ARM嵌入式<b class='flag-5'>計算機</b>的NPU進行<b class='flag-5'>深度</b><b class='flag-5'>學習</b>模型的訓練和優化?

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內置了1TOPS算力 NPU,它每秒可以執行高達一萬億次的浮點運算,這為復雜的圖像處理和深度學習任務提供了充足的計算資源。在產品缺陷檢測
    的頭像 發表于 08-20 11:53 ?836次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機</b>搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學習</b>

    計算機視覺有哪些優缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發展不僅推動了多個行業的變革,也帶來了諸多優勢,但同時也伴隨著一些挑戰和局限
    的頭像 發表于 08-14 09:49 ?2023次閱讀

    圖像處理器與計算機視覺有什么關系和區別

    圖像處理器與計算機視覺是兩個圖像處理領域緊密相連但又有所區別的概念。它們之間的關系和區別可以從多個維度進行探討。
    的頭像 發表于 08-14 09:36 ?1039次閱讀

    計算機視覺中的圖像融合

    許多計算機視覺應用中(例如機器人運動和醫學成像),需要將多個圖像的相關信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準確性和數據質量。多視圖融合可以提高圖像分辨率,并恢復場景的三維表示
    的頭像 發表于 08-01 08:28 ?1128次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>中的圖像融合

    DRAM計算機中的應用

    DRAM(Dynamic Random Access Memory,動態隨機存取存儲器)計算機系統中扮演著至關重要的角色。它是一種半導體存儲器,用于存儲和快速訪問數據,是計算機主內存的主要組成部分。以下是對DRAM
    的頭像 發表于 07-24 17:04 ?2967次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現這一目標,計算機
    的頭像 發表于 07-24 12:46 ?1786次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發表于 07-16 10:23 ?1152次閱讀

    基于Python的深度學習人臉識別方法

    基于Python的深度學習人臉識別方法是一個涉及多個技術領域的復雜話題,包括計算機視覺深度
    的頭像 發表于 07-14 11:52 ?1687次閱讀
    主站蜘蛛池模板: 国产成人精品久久久久婷婷 | 欧美久久综合性欧美 | 午夜国产精品免费观看 | 亚洲视频欧美视频 | 日本护士hd| 亚洲看片网站 | 大陆女人内谢69XXXORG | 亚洲精品国产品国语在线试看 | 免费精品一区二区三区AA片 | 国产成人片视频一区二区青青 | 大学生第一次破苞疼哭了 | 野花韩国中文版免费观看 | 国产伦子沙发午休系列资源曝光 | 亚洲午夜一区二区电影院 | 在教室轮流被澡高H林萌 | 亚洲精品无码不卡在线播放he | 把腿张开再深点好爽宝贝 | 久久久97丨国产人妻熟女 | 国产精品久久免费视频 | 亚洲 欧美 国产 综合久久 | 日本68xxxxxxxxx老师 | 18禁在线无遮挡羞羞漫画 | 国内九一激情白浆发布 | 99国产在线视频有精品视频 | 性xxx免费| 99精品视频在线观看免费播放 | 快播最新电影网站 | 精品国产品国语在线不卡丶 | 婷婷五月久久丁香国产综合 | 秋霞午夜鲁丝片午夜精品久 | 国产人妻麻豆蜜桃色 | YELLOW日本动漫高清免费 | 中文字幕乱码在线人视频 | 狼好色有你好看 | 色噜噜2017最新综合 | av色天堂2018在线观看 | 无码骚夜夜精品 | 全彩无翼污之邪恶女教师 | 偷窥wc美女毛茸茸视频 | 亚洲第一伊人 | 青草在线在线d青草在线 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品