計算機視覺頂會CVPR 2018召開在即,從接收的論文看,這屆會議展現(xiàn)出了怎樣的趨勢?你不要不信,生成對抗網絡GAN,正在成為新的“深度學習”。
又到了一年一度CVPR的時節(jié)。
當被接收的論文列表公布以后(點擊這里查看所有論文列表),愛統(tǒng)計趨勢的我們又有很多事情可以做了。
這一次,Google Research的研究科學家Jordi Pont-Tuset做了一個統(tǒng)計,根據(jù)論文題目,看深度學習的發(fā)展趨勢。結果,他發(fā)現(xiàn)生成對抗網絡(GAN)強勢出擊,大有取代“深度學習”(Deep Learning)之勢。
下面這張圖展示了CVPR 2018的論文題目中,關鍵詞GAN、Deep,以及LSTM的對比:
可以看出,普通的“深度學習”已經在走下坡路,而且趨勢明顯。Jordi Pont-Tuset認為,這很可能是研究人員已經見慣不慣了。
與此同時,GAN則大幅抬頭,有8%的論文標題中含有GAN(相比2017年增長了2倍多),已經不能說是少數(shù),而是相當有分量的一個方向了。
此外,LSTM也出現(xiàn)下滑,可能是越來越多人開始關注并使用Attention的方法。
“深度學習”趨于飽和,GAN強勢飛升
GAN的上升趨勢并不是從CVPR 2018才開始的。下面這張圖展示了從2013年到2017年CVPR期間,GAN(以及LSTM)在CVPR、ICCV和ECCV這三大計算機視覺頂會論文標題中出現(xiàn)的頻次。統(tǒng)計者依然是Jordi Pont-Tuset。
盡管占比的絕對值不高(在2017年時為2.5%),但可以發(fā)現(xiàn)GAN從CVPR-16開始一飛沖天的趨勢。
這種趨勢在隨后舉行的ICCV 2017上更加明顯,GAN在ICCV-17上已經超越了LSTM,并且占比達到了4%。
再來看“深度學習”,三大CV頂會的數(shù)據(jù)表明,歷經2014年到2016年的火爆,從2017年開始,雖然還在增長(CVPR的稍微多一些),但都已趨于飽和。
GAN是新的“深度學習”?
需要指出,這里統(tǒng)計的僅僅是三大計算機視覺會議接收論文的標題里的關鍵詞。
就像Jordi Pont-Tuset推測的那樣,普通的“深度學習”可能已經為人熟知,如今在研究領域開始往更細的、更具體的方向發(fā)展,比如GAN。
生成對抗網絡(Generative Adversarial Nets)在 Ian Goodfellow 等人2014年的論文《Generative Adversarial Nets》中提出,是非監(jiān)督學習的一種方法,通過讓兩個神經網絡相互博弈的方式進行學習。
GAN結構示意。來源:Slinuxer
生成對抗網絡由一個生成網絡(Generator)與一個判別網絡(Discriminator)組成。生成網絡從潛在空間(latent space)中隨機采樣作為輸入,其輸出結果需要盡量模仿訓練集中的真實樣本。判別網絡的輸入則為真實樣本或生成網絡的輸出,其目的是將生成網絡的輸出從真實樣本中盡可能分辨出來。而生成網絡則要盡可能地欺騙判別網絡。兩個網絡相互對抗、不斷調整參數(shù),最終目的是使判別網絡無法判斷生成網絡的輸出結果是否真實。生成對抗網絡常用于生成以假亂真的圖片。此外,該方法還被用于生成視頻、三維物體模型等。
現(xiàn)在,《Generative Adversarial Nets》這篇論文的引用數(shù)量已經達到了3363次。
在一次Quora問答直播中,Yann LeCun表示,生成對抗性網絡是近十年來最有趣的想法,是人工智能最值得期待的算法之一。
去年在接受吳恩達的采訪時,Ian Goodfellow曾經說,GAN是生成模型的一種,實際上 GAN 能做的事情,很多其他生成模型也能做,如果GAN的訓練能穩(wěn)定下來,甚至像深度學習那么可靠,那么GAN就能真正發(fā)展起來。如果不能,那么GAN 將會被其他方法所取代。他有大約 40% 的時間都用在穩(wěn)定 GAN 上面。
至少從這屆CVPR看,GAN被取代的情況還完全不存在。
現(xiàn)在,有很多針對GAN的研究,除了Ian Goodfellow所在的谷歌和他之前所在的OpenAI,F(xiàn)AIR/NYU也是一大重鎮(zhèn)。實際上,是FAIR/NYU最先把GAN帶進了我們的視野,提出了LAPGAN,那是GAN第一次生成了逼真的高清圖像,也是第一次得到媒體曝光。
另外一個重要陣營是伯克利+英偉達,他們專注超高清逼真圖像和視頻,無監(jiān)督翻譯,等等。伯克利的CycleGAN,利用對偶學習并結合GAN機制來優(yōu)化生成圖片的效果。英偉達則采取“漸進式生成”技術訓練GAN,讓計算機可以生成1024*1024大小的高清圖片,幾乎可以以假亂真。
除了圖像生成,GAN的應用也已經拓展到了NLP和Robot Learning。
Ian Goodfellow在去年一次問答中表示,GAN是使用強化學習來解決生成建模問題的一種方式。“GAN的不同之處在于,獎勵函數(shù)對行為是完全已知和可微分的,獎勵是非固定的,以及獎勵是Agent的策略的一個函數(shù)。”Goodfellow說:“我認為GAN基本上可以說就是強化學習?!?/p>
-
GaN
+關注
關注
19文章
1933瀏覽量
73286 -
深度學習
+關注
關注
73文章
5500瀏覽量
121111 -
強化學習
+關注
關注
4文章
266瀏覽量
11246
原文標題:GAN正在成為新的深度學習
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論