幾天之前,國內科技媒體,尤其是AI媒體之間刷屏了一篇文章。其原作者是機器視覺專家Filip Piekniewski ,標題叫做《AI Winter is Well on its Way》。這篇文章在國內有各種翻譯的版本,并配了很多標題。但主旨差不多是一樣的:深度學習完了!AI寒冬又要來了!
無論是國內還是國外,在社交媒體上“看熱鬧就不嫌事大”屬于一種基本操作。所以這篇文章還是短期內引發了大量關注。比如我們會看到國內一些媒體以這篇文章為依據,開始提出人工智能要完了;人工智能脫下皇帝新衣等等觀點。
可是這篇文章究竟是否靠譜呢?用大神Yann LeCun的評價,這篇文章的觀點屬于“非常無知very uninformed”。確實其中也有不少近似常識錯誤的部分,不是很值得討論。比如文章中認為,深度學習要糟糕的證據之一,是深度學習專家們發的相關推特越來越少了。文章中還煞有介事地分析了吳恩達發推特的數量……
這個論證邏輯實在有點牽強,一個技術誕生好幾年后,當然難以與它剛剛面世時的流量熱度相提并論。而且另一方面,似乎全世界的人均發推數也在大幅下降……
但我們未嘗不能把目光放的更遠一點:比如客觀來看,反深度學習思潮已非一日之寒。各種關于深度學習的爭論,以及對其泡沫的懷疑,在近半年間塵囂之上。這當然不會完全沒有道理。而且圍繞在深度學習身旁的爭議,經常有著復雜的動機和話語背景。而被媒體,尤其是翻譯后媒體所展示出來的,不過是冰山一角而已。
那么或許我們可以從那篇《AI寒冬就要來了》的文章里,去觀察一下這場“深度學習的王座保衛戰”。或許這可以給我們一些線索,來判斷AI之冬到底是遠在天邊還是觸手可及。
Filip Piekniewski對深度學習的質疑一共有這么幾項證據:
1. 關于深度學習的推特在減少……這個我們就不多聊了。
2. 大公司對AI的興趣正在消退。
3. 深度學習沒有證實“架構可以無限延展”的傳聞。
4. 接二連三出現的自動駕駛事故讓深度學習失去價值。
這四大證據,得出的結論就是AI寒冬就像股市崩盤一樣,很快就會發生。不得不說,這個邏輯鏈里的槽點還是相當密集的。
自動駕駛事故,是深度學習的鍋嗎?
首先來我們回到備受爭議的自動駕駛事故。Filip Piekniewski認為,Uber在坦桑尼亞州撞死人的那起事件,直接證明了深度學習的無效性。原因在于報告顯示,AI系統沒有認出視線范圍內的行人。
這個推論乍聽起來有理有據的,但仔細一想絕對可謂強行甩鍋。這就像一輛車因為發動機熄火導致發生了車禍,那么原因可能有很多,比如車主沒有好好保養;汽車制造商有質量問題;汽車零部件生產商有問題;甚至是意外因素。但實在很難想象把原因甩給內燃機技術,以及相關學術界。
當然,深度學習目前可不像內燃機一樣經過了千錘百煉。但脫離具體的解決方案與算法、零部件、車載系統、廠商之間的技術差異等等因素,去質疑宏觀技術,似乎也是不妥。更何況深度學習也難以被視為無人駕駛場景中的最核心技術。
比如Uber的事故率可謂出名的高,但Waymo的事故率卻出名的低。那么究竟他們都使用的某種技術不行,還是廠商不行呢?這大概不是個難以回答的問題。
換個角度想,假如深度學習非常炸裂,達到了毀天滅地的程度,于是無人駕駛就成熟到可以不經過任何測試與研究,馬上就取代人類司機安全上路了嗎?好像也不是。
所以把個別廠商的安全事故要甩給大家都用的底層技術,實在有點甩鍋的嫌疑。
大公司放棄人工智能了嗎?
Filip Piekniewski提出大公司對人工智能的興趣正在衰退。比如有媒體報道谷歌正在不知道拿DeepMind怎么辦(這篇文章之后沒多久,谷歌I/O大會里又著重強調了DeepMind的技術),而DeepMind和OpenAI這兩個深度學習王牌公司如今靜悄悄的沒什么聲音,結論是Facebook和谷歌開始展露出從AI撤退的意圖。
那這個意圖可能確實有點太隱晦了。就像Yann LeCun批評的那樣,谷歌、Facebook和微軟這樣的大公司,近期對AI的加注和加速招聘人才都是顯而易見的。這個時間段最有代表性的可能是微軟,最近憑借一通緊密關聯AI的神操作,微軟股價漲出了新高。谷歌和Facebook,甚至亞馬遜的進一步AI化都非常明顯。而谷歌,可就連軍方AI項目都那么地不離不……
文章提到了另一點,是DeepMind在AlphaGo之后就沒有什么驚人表現了。當然每個人對于驚人的定義是不同的,但從我們的角度看,DeepMind這兩年在強化學習和仿生AI的研究上,成果是非常顯著的。它與谷歌能否長期兼容當然是另一個商業層面的問題,僅僅就技術表現而言,絕不可能每一個技術進步都有AlphaGo的傳播性和公關價值。
當然,值得注意的是,DeepMind確實正在越來越少提出深度學習相關的技術,反而強化學習正在成為這家公司新的關鍵詞。
泡沫與不確定性,確實彌漫在DL身旁
整體而言,這篇刷屏文章中相對靠譜的一個懷疑,是關于深度學習的框架延展性問題。13到16年間,確實彌漫過很多對深度學習的過分吹捧,并且其中很大部分來自于科學家。其中一個論調,是深度學習的特殊性讓其架構可以無限增長,于是智能也就會停不下來地幾何級擴張。
但在實踐中,這顯然不靠譜。首先是無限增長架構效果并不一定好,這在很多過分復雜的模型中都得到了印證;其次過于復雜的架構,同時也意味著巨大的能耗和龐大的數據需求量,這都是今天無法負擔的。
這類赤果果的打臉,在深度學習身上已經發生了不少。由于深度學習技術提出時,確實讓學術界和產業界看到了非常可觀的延展空間,以及把很多抽象能力計算化的可能。而在競技、視覺以及自然語言翻譯等領域,深度學習也的確帶來了不可替代的提升。
于是無論圈內還是圈外,關于深度學習就是那個“終極算法”,人類可以借由DL一路達到通用智能等等言論蜂擁而至。而深度學習之所以被很多科學家反感,這些反常識的言論其實占據了主要原因。
這些言論和樂觀估計是否帶來了資本和商業市場上的泡沫呢?可以說是絕對有的,而且恐怕美國比中國更甚。這些因素,加上深度學習技術一些無法被攻破的先天不足:比如嚴重的黑箱性、數據依賴性,以及對動態模擬的不足等等,共同組成了一個不穩定空間。
尤其在AI嘗試走向商業化的時候,這些不穩定或許會發展為定時炸彈。好在目前來看,商業應用初級深度學習的技術紅線,還有非常遙遠的距離。
而即使是“反深度學習聯盟”中最大的旗幟Marcus也認為,在功能架構上來說,深度學習可能是今天最好的解決方案,雖然它有這樣或那樣的問題。
評論
查看更多