Keras之父、谷歌大腦人工智能和深度學(xué)習(xí)研究員Fran?ois Chollet最新撰寫了一本深度學(xué)習(xí)Python教程實(shí)戰(zhàn)書籍《Python深度學(xué)習(xí)》,書中介紹了深度學(xué)習(xí)使用Python語言和強(qiáng)大Keras庫,詳實(shí)新穎。
近日,F(xiàn)ran?ois Chollet接受了采訪,就“深度學(xué)習(xí)到底是什么”、“Python為何如此廣受歡迎”、“目前深度學(xué)習(xí)面臨的主要挑戰(zhàn)”等議題進(jìn)行了回答。他認(rèn)為,目前很多深度學(xué)習(xí)領(lǐng)域的論文都是無意義的,因?yàn)檫@些研究使用了不科學(xué)、不規(guī)范的研究方法。
關(guān)于本人
問:您主要的工作內(nèi)容是什么?
答:我在谷歌大腦團(tuán)隊(duì)工作,花了很多時(shí)間開發(fā)Keras。我也參加TensorFlow的工作。最近我主要在寫機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、將深度學(xué)習(xí)應(yīng)用于定理證明等方面的論文。我的主要研究興趣是理解AI中的抽象和推理問題,如何從感知得到抽象的、高度概括的模型。
深度學(xué)習(xí)的本質(zhì)、挑戰(zhàn)、和未來
問:深度學(xué)習(xí)到底是什么?
答:深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種具體方法。與以前的方法相比,它更加強(qiáng)大和靈活。在大多數(shù)應(yīng)用程序中,我們所說的“深度學(xué)習(xí)”是指一種把大量由人類注釋的數(shù)據(jù)轉(zhuǎn)換為以與人類相似的方式自動(dòng)注釋新數(shù)據(jù)的軟件。您可以通過這種方式自動(dòng)完成很多不同的任務(wù)。深度學(xué)習(xí)尤其擅長理解“感知”數(shù)據(jù),如圖像、視頻或聲音。
我來舉例說明。假設(shè)有很多圖片都帶有相關(guān)聯(lián)標(biāo)簽(如“貓”、“狗”)。深度學(xué)習(xí)可以讓你自動(dòng)將數(shù)據(jù)轉(zhuǎn)換到一個(gè)“了解”如何把圖片映射到標(biāo)簽的系統(tǒng),只需從示例中學(xué)習(xí),無需任何手動(dòng)調(diào)整或自定義工程。然后這種系統(tǒng)可以被應(yīng)用到新的數(shù)據(jù),將標(biāo)記圖片任務(wù)有效自動(dòng)化。
同樣,你可以將深度學(xué)習(xí)應(yīng)用于機(jī)器翻譯、語音識別、文本到語音轉(zhuǎn)換,光學(xué)字符識別等問題。
問:深度學(xué)習(xí)社區(qū)現(xiàn)在面臨的主要挑戰(zhàn)是什么?
答:打擊炒作、發(fā)展倫理意識、獲得科學(xué)嚴(yán)謹(jǐn)性。
炒作:對人工智能的大肆炒作正在危害這個(gè)領(lǐng)域。一些人正荒謬地夸大目前AI取得的進(jìn)展,還說人工智能已把人類逼到了絕境。但事實(shí)并非如此。如果我們把目標(biāo)設(shè)得極高,卻又不能實(shí)現(xiàn),就是逼著公眾站在我們的對立面上。而且,炒作AI這件事,本質(zhì)上是不誠實(shí)的,對公眾討論也產(chǎn)生了危害。
倫理: 現(xiàn)在部署人工智能系統(tǒng)的大多數(shù)人來自單一背景,他們往往沒有意識到自己所構(gòu)建的系統(tǒng)給人們帶來了道德影響和副作用。這將成為一個(gè)問題,因?yàn)檫@個(gè)群體所擁有的權(quán)力會(huì)越來越大。我們需要更多地討論這些問題,并提高人們對不道德使用AI的潛在行為的覺察力,例如具有偏見性的預(yù)測模型會(huì)影響公眾生活,或以危險(xiǎn)的方式操縱AI。
科學(xué):每天都有大量的深度學(xué)習(xí)論文發(fā)表,其中大多數(shù)并沒有真正產(chǎn)生任何有意義的新知識,因?yàn)檫@些論文沒有遵循科學(xué)的研究方法。他們以模糊的方式“評估”模型,或者在他們的訓(xùn)練數(shù)據(jù)上測試過度擬合模型(尤其是生成模型和強(qiáng)化學(xué)習(xí),這是深度學(xué)習(xí)研究中發(fā)展最快的兩個(gè)主題),僅在MNIST上評估模型等。深度學(xué)習(xí)簡直是科學(xué)的重災(zāi)區(qū)。同行評審?fù)ǔ2粫?huì)以有意義的方式解決這些問題,也許部分原因是大多數(shù)同行評審員進(jìn)入這個(gè)領(lǐng)域最多才一兩年。如果想要取得更快的進(jìn)展,那么當(dāng)涉及研究可重復(fù)性、基線、模型評估和統(tǒng)計(jì)顯著性時(shí),我們需要更加嚴(yán)謹(jǐn)。我們目前的激勵(lì)機(jī)制是與科學(xué)相對立的:發(fā)表論文是被鼓勵(lì)的。如果你的研究聽起來既復(fù)雜又神秘,很難被正確評估研究重要性,那么發(fā)表論文就容易多了。
問:你認(rèn)為深度學(xué)習(xí)的未來是什么?
答:我期望AI未來能把“直觀的”模式識別模塊與正式推理模塊相結(jié)合。我也希望AI能夠演變得更像自動(dòng)化軟件開發(fā)的形式,借用目前軟件工程中的很多模式和實(shí)踐。
寫書動(dòng)機(jī)
問:你出版了一本新書《Python深度學(xué)習(xí)》。為什么要寫這本書呢?
答:寫這本書的原因是,我想推出一個(gè)課程,來教那些已有Python編程能力,但沒有機(jī)器學(xué)習(xí)背景的人。
Python為何廣受歡迎
問:Python應(yīng)該是目前發(fā)展最快的編程語言,至少在高收入國家是這樣。為什么Python如此受歡迎?
答:我愛Python。學(xué)習(xí)Python很容易上手,當(dāng)你習(xí)慣使用它之后,會(huì)越來越高效。與我使用過的大多數(shù)其他語言相比,Python非常直觀和優(yōu)雅。但是Python真正的殺手锏并不在于語言本身,而是周圍的生態(tài)系統(tǒng)和社區(qū)。無論你需要做什么,比如解析特定的文件格式或與特定系統(tǒng)連接,幾乎有一個(gè)Python庫在做這件事,你不必花時(shí)間去做。在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,這使得Python成為一種非常高效的語言。
我喜歡Python的另一個(gè)原因是,它并不是一個(gè)領(lǐng)域特定的語言,而是多領(lǐng)域的交叉點(diǎn),從網(wǎng)站開發(fā)到數(shù)據(jù)科學(xué)和系統(tǒng)管理。這意味著無需切換到新語言來將Keras模型部署為Web API。無論你需要做什么,無論是啟動(dòng)一個(gè)web應(yīng)用程序,查詢一個(gè)REST API,還是解析一些文件,訓(xùn)練最先進(jìn)的深度學(xué)習(xí)模型,Python通常都會(huì)是一個(gè)很好的選擇。
給初學(xué)者的建議
問:有些聲音認(rèn)為進(jìn)入機(jī)器學(xué)習(xí)有壁壘。您如何看待?
答:我不同意。在過去的5年中,進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域變得非常容易。當(dāng)然,5-7年前這很艱難。你可能需要研究生教育。你需要用C ++或Matlab來編寫大量的低級算法。我經(jīng)歷過這些。而現(xiàn)在不一樣了。你只需要Python,很容易上手,你有權(quán)限訪問高級和易于使用的工具(如Keras)。另外,你可以在網(wǎng)上學(xué)到很多非常高質(zhì)量的資源,你可以在Kaggle上練習(xí)現(xiàn)實(shí)世界的問題。學(xué)習(xí)從未如此簡單。
問:對于初學(xué)者來說,最重要的是什么?
答:最重要的是要深刻了解深度學(xué)習(xí)能做什么,不能做什么。去感受一些best practice,比如如何正確評估模型,如何防止過度擬合。這需要把正式解釋(formal explanations)和對現(xiàn)實(shí)問題的廣泛實(shí)踐結(jié)合起來。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47354瀏覽量
238818 -
python
+關(guān)注
關(guān)注
56文章
4797瀏覽量
84776 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5504瀏覽量
121246
原文標(biāo)題:Keras之父:大多數(shù)深度學(xué)習(xí)論文都是垃圾,炒作AI危害很大
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論