近日,人工智能領(lǐng)域傳來好消息——美國計算機學會宣布將2018年圖靈獎頒發(fā)給深度學習領(lǐng)域三位先驅(qū)——約書亞·本吉奧、杰弗里·辛頓和雅恩·勒昆,以褒獎他們推動深度神經(jīng)網(wǎng)絡成為計算機技術(shù)的重要組成部分。感謝他們拯救了AI、改變了世界。
之前,業(yè)內(nèi)有人提出“深度學習已死”的基調(diào),讓深度學習的熱度大大下降,而此消息一出,猶如按下重啟鍵,人們再次將目光鎖定深度學習。那么,作為人工智能的一種形式,目前深度學習如何突破瓶頸,迎接新一代人工智能的到來?讓我們聽聽國內(nèi)外專家如何說。
已然改變?nèi)藗兩?/h2>
事實上,用深度學習進行分析的目的在于識別真實數(shù)據(jù)中的真實模式。如果這種建設性能力可應用于總結(jié)經(jīng)驗、設計方案以及記錄歷史,甚至能夠以驚人的逼真性反饋于人們的身體,那么現(xiàn)實與幻想之間的界線將變得非常模糊。
“深度學習雖然有種種局限,但在很多領(lǐng)域已然切切實實發(fā)揮作用,比如在語音識別、機器翻譯等,這是一些可算作‘無限但可枚舉’(Infinite but enumerable)的數(shù)據(jù)對象。在這些領(lǐng)域中,訓練數(shù)據(jù)集及其變種可以包括大部分我們可能遇到的實際數(shù)據(jù),深度學習可以解決?!毙乱淮斯ぶ悄墚a(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟聯(lián)合秘書長、科大訊飛副總裁兼AI研究院聯(lián)席院長李世鵬在接受科技日報記者采訪時指出。
他說:“而另外一些領(lǐng)域則屬于‘無限也不可枚舉’的數(shù)據(jù)對象,比如說自動駕駛場景下的各種環(huán)境圖像和視頻,計算機視覺中通用識別問題的數(shù)據(jù)對象等。這些問題,深度學習可能會解決其中某些子問題,但整體來看,會出現(xiàn)不久前全球人工智能計算機視覺領(lǐng)域奠基人之一艾倫·尤爾教授所提及‘深度學習在計算機視覺領(lǐng)域已至瓶頸’的問題?!?/p>
“實際上,深度學習主要依賴于大量的數(shù)據(jù)和數(shù)據(jù)標注。在醫(yī)療領(lǐng)域,可對采集到上萬個病例數(shù)據(jù)庫的醫(yī)學影像進行分析,供放射學和病理學方面訓練,幫助醫(yī)生做出更為精準高效的診斷,實現(xiàn)大規(guī)模應用。不過,對于應用本身其是受限的,因為很多領(lǐng)域并無那么多數(shù)據(jù),也沒太多真正意義上的訓練。如在自動駕駛領(lǐng)域,正常駕駛很多的數(shù)據(jù)可以采集到,但有些非正常數(shù)據(jù)像事故方面卻很難采集。” 遠望智庫人工智能事業(yè)部部長、圖靈機器人首席戰(zhàn)略官譚茗洲認為。
法國泰雷茲集團首席技術(shù)官馬克·厄曼表示:“在眾多的人工智能技術(shù)中,深度學習是為我們所熟知的一種。當你擁有大量的數(shù)據(jù)和少量知識的時候,它是一種非常強大的技術(shù)。例如,人臉識別,但是這需要采集大量的圖像來訓練。在許多情況下,用于學習的數(shù)據(jù)庫極為龐大,有時候需要千萬甚至幾億數(shù)據(jù)。學習方法也有快慢之別,但是本質(zhì)上來說,它不及人類大腦聰明。”
可行方法揚長避短
“深度學習肯定不是解決通用人工智能問題的全部,但是人類探索機器智能的必經(jīng)之路。我們應該意識到現(xiàn)在深度學習的一些限制,要做的是揚長避短——用可行的方法解決現(xiàn)在可以解決的問題?!崩钍砾i指出。
如何解決數(shù)據(jù)短缺問題?李世鵬說,目前很多科學家在對此研究。一類是從數(shù)據(jù)源方面解決,比如,借助更高效的數(shù)據(jù)標注工具幫助人快速獲取更多標注數(shù)據(jù)、用對抗網(wǎng)絡生成數(shù)據(jù)等;一類是從深度學習算法本身改進,比如遷移學習、少樣本學習、無監(jiān)督學習和弱監(jiān)督學習等。
我們看到,AI在自動駕駛領(lǐng)域若達到99.9%的準確率,也意味著很多次駕駛活動中可能出現(xiàn)一次機器不能處理或者不能處理得很好的例子。這是否說明自動駕駛就不能做了?“當然不是。解決方法是通過人機耦合來實現(xiàn)穩(wěn)定可靠的人工智能?!崩钍砾i答道。
李世鵬解釋道,今天的人工智能即使在可以發(fā)揮得很好的領(lǐng)域,也不是百分之百可靠。在一些不是很關(guān)鍵的領(lǐng)域,某些AI技術(shù)也許是可用甚至好用,但在某些關(guān)鍵領(lǐng)域卻遠遠不能符合要求。因此,不要把人工智能當作萬全技術(shù),在設計一個產(chǎn)品或者系統(tǒng)時,要充分考慮機器失敗的時候,人類怎么能很好地接手。
具體而言涉及兩個問題:一是系統(tǒng)如何識別什么情況下它處理不好,就是說在AI給出某種決定的同時,也給出做此決定的可信度。在可信度很低的情況下,是否可以喚醒人類接應?
另一個是人機如何和諧地在一起工作,這涉及到用戶體驗設計和AI的結(jié)合。至少AI在現(xiàn)階段還只是作為提高人類效率的工具,所以在用戶體驗設計中應該做到不需要人時刻盯著,但在有狀況時應及時提醒反饋給人類無縫接手。
探索未來突破之路
國內(nèi)外專家表示,盡管人工智能的發(fā)展水平令人矚目,但目前的人工智能系統(tǒng)有一定智商沒情商、會計算不會“算計”、有專才無通才。就目前既有的解決方法,還不夠具有革命性,要讓未來的AI更“智慧”,需要加強對人類大腦等方面的研究,探索突破深度學習瓶頸之路。
“尤爾等指出的組合模型訓練及用組合數(shù)據(jù)測試,實質(zhì)上應該認為是個分解過程,但難點就在于分解。就像計算機視覺里最難的問題是圖像或物體分割一樣,這本身可能需要更多高層次上的語義理解。更具顛覆性的方法是賦予AI引擎一些推理功能,即使沒有見過的數(shù)據(jù),也能通過推理進行解決。”李世鵬指出。
李世鵬進一步說,腦科學和認知科學的發(fā)展給我們很多啟示,MIT等一些大學院所的科學家正沿著這條路徑探索。其實,上世紀90年代盛行的專家系統(tǒng)很多時候就是給機器一些規(guī)則(推理法制),讓機器按規(guī)則去推理從而解決一些問題。但專家系統(tǒng)的問題是規(guī)則制定本身是件很麻煩的事,遠不及今天數(shù)據(jù)標注來得簡單。將來的思路可能是需要深度學習從大數(shù)據(jù)中歸納出一些可以解釋的規(guī)則,然后,將它們應用到新的數(shù)據(jù)中去解決問題。知識圖譜和深度學習的結(jié)合也許是這條路線的一個實用分支。
在某些方面,我們發(fā)現(xiàn)深度學習如同挖掘機一樣,能夠采集相當多的數(shù)據(jù),然而,卻不像小孩子那樣,不需要千萬次的學習即會認出自己的母親。
厄曼說,這是因為實際上孩子認媽媽是將多種信息混合在一起判定,其中包括形象、氣味、身體接觸、出生記憶以及許多復雜因素。盡管深度學習是受到生物啟發(fā),基于我們所說的神經(jīng)元,但是,當你與神經(jīng)科學家交談時,會覺得深度學習僅是一種對人腦的過于簡單的再現(xiàn),人腦可比這復雜得多。所以深度學習只是AI使用的眾多技術(shù)中的一種,希望其他技術(shù)可以對其加以補充。
“正如現(xiàn)在的自動駕駛,只能說是試水階段,其技術(shù)本身肯定不是主要依賴深度學習,而是多模態(tài)感知,運算也不是簡單依賴于視覺,而是與人類認識這個世界一樣,通過眼、耳、鼻、舌、身、意多個感知來綜合認知,而人腦本身在大多數(shù)情況下不依賴于大量數(shù)據(jù),而是借助‘觸類旁通’等能力。因此,人腦科學、計算機科學、生理學和認知科學等跨界交融應用才是未來AI的發(fā)展方向?!弊T茗洲指出。
他認為,深度學習是一個好的開始,但是不能解決一切問題,需要和更高維度的方式疊加。而跨學科的研究會在語義、知識圖譜、機器記憶、想像、邏輯推理等類人腦的領(lǐng)域,彌補深度學習的一些短板。
評論
查看更多