隨著深度學(xué)習(xí)關(guān)注度和勢(shì)頭上升,深度學(xué)習(xí)被越來(lái)越多的企業(yè)和組織的生產(chǎn)實(shí)踐結(jié)合起來(lái)。這時(shí),無(wú)論是對(duì)于深度學(xué)習(xí)相關(guān)專(zhuān)業(yè)的初學(xué)者,還是已經(jīng)在企業(yè)和組織中從事工業(yè)場(chǎng)景應(yīng)用和研發(fā)的開(kāi)發(fā)者來(lái)說(shuō),選擇一個(gè)適合自己,適合業(yè)務(wù)場(chǎng)景需求的深度學(xué)習(xí)框架顯得尤為重要。
對(duì)于不同學(xué)習(xí)階段和不同崗位的開(kāi)發(fā)者來(lái)說(shuō),什么樣的深度學(xué)習(xí)框架才是適合自己的呢?為此,AI 前線邀請(qǐng)了來(lái)自BAT的深度學(xué)習(xí)框架專(zhuān)家解答這個(gè)疑問(wèn)。
以下是選擇深度學(xué)習(xí)框架時(shí)常見(jiàn)的幾個(gè)問(wèn)題:
目前,國(guó)內(nèi)外有哪些主流的深度學(xué)習(xí)框架?分別有什么優(yōu)缺點(diǎn)?
TensorFlow:谷歌大廠出品,社區(qū)資源豐富,用戶群體廣泛。如果你的業(yè)務(wù)是實(shí)現(xiàn)一個(gè)比較成熟的應(yīng)用場(chǎng)景,選擇 TensorFlow 是個(gè)不錯(cuò)的選擇,畢竟大部分坑前人已經(jīng)踩過(guò)了。如果你還是一名初學(xué)者,想要去實(shí)現(xiàn)全新的算法,那要慎重選擇 TensorFlow,因其發(fā)展時(shí)間較久,代碼庫(kù)龐大,想要真正看懂它的代碼會(huì)是一個(gè)不小的挑戰(zhàn)。
PaddlePaddle:百度出品,跟 TF 類(lèi)似,PaddlePaddle 也是在百度內(nèi)部實(shí)際應(yīng)用的工業(yè)框架。值得一提的是,PaddlePaddle 為大量工業(yè)級(jí)模型提供官方支持;大規(guī)模分布式訓(xùn)練技術(shù)能力強(qiáng),支持大規(guī)模稠密參數(shù)和稀疏參數(shù)場(chǎng)景的并行訓(xùn)練;基于其中文文檔友好、簡(jiǎn)單易上手的特點(diǎn),社區(qū)活躍度不斷提高。本土開(kāi)發(fā)者中文交流非常方便。
PaddlePaddle 已經(jīng)升級(jí)為全面的深度學(xué)習(xí)開(kāi)發(fā)套件,除了核心框架,還開(kāi)放了 VisualDL、PARL、AutoDL、EasyDL、AI Studio 等一整套的深度學(xué)習(xí)工具組件和服務(wù)平臺(tái),更好地滿足不同層次的深度學(xué)習(xí)開(kāi)發(fā)者的開(kāi)發(fā)需求。18 年百度加大了生態(tài)投入,在工業(yè)制造、農(nóng)林領(lǐng)域有不少案例,對(duì)于想要落地應(yīng)用場(chǎng)景,特別是針對(duì)中文語(yǔ)言處理的場(chǎng)景和大規(guī)模推薦場(chǎng)景,PaddlePaddle 或許是個(gè)不錯(cuò)的選擇。
PyTorch+Caffe2:臉書(shū)出品。PyTorch 前身是 Torch(一個(gè)基于 Lua 語(yǔ)言的深度學(xué)習(xí)庫(kù))。PyTorch 靈活性相比 TensorFlow 大大增強(qiáng),支持動(dòng)態(tài)構(gòu)圖,開(kāi)發(fā)者可以隨時(shí)改變神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。PyTorch 今年因其易用性表現(xiàn)突出,越來(lái)越受到學(xué)術(shù)界的青睞。
如果你是一名初學(xué)者,想要去復(fù)現(xiàn)前沿的算法,推薦使用 PyTorch。如果你是工業(yè)場(chǎng)景開(kāi)發(fā)者,最好先搜一搜是否已經(jīng)有使用 PyTorch 的成功落地案例。因?yàn)樵谶\(yùn)算效率、工業(yè)部署上,PyTorch 還不算成熟。Caffe2 為生產(chǎn)環(huán)境設(shè)計(jì),提供在各種平臺(tái)(包括移動(dòng)設(shè)備)的運(yùn)行時(shí)。Caffe2 意在彌補(bǔ) Pytorch 在生產(chǎn)環(huán)境的不足,目前還沒(méi)有看到太多開(kāi)發(fā)者反饋 Caffe2 的工業(yè)表現(xiàn),需要更多時(shí)間驗(yàn)證。
MxNet:已被亞馬遜 (Amazon) 選為 AWS 上的深度學(xué)習(xí)框架,支持動(dòng)態(tài)圖計(jì)算。優(yōu)勢(shì)是高效小巧,更適合自定義需求高的公司和研究者。如果你的工作需要對(duì)框架進(jìn)行修改時(shí),改 MxNet 要比改 TF 高效多了。MXNet 的用戶相比其他框架并不算太多,有少量擁戴者。MXNet 在文檔質(zhì)量方便經(jīng)常被詬病,新手還需要多磨合一下。
Keras:是一個(gè)用于快速構(gòu)建深度學(xué)習(xí)原型的高層神經(jīng)網(wǎng)絡(luò)庫(kù),Keras 由純 Python 編寫(xiě)而成,并基于 Tensorflow、Theano 以及 CNTK 后端。Keras 隱藏了大部分的內(nèi)部運(yùn)算,對(duì)于新手來(lái)說(shuō)非常友好。如果想要快速入門(mén),建議可以選擇 Keras。但真的想成為深度學(xué)習(xí)大拿,還是要手動(dòng)從零開(kāi)始寫(xiě)一個(gè)神經(jīng)網(wǎng)絡(luò)的代碼,否則容易依賴(lài)于 Keras 的易使用性而忽略底層原理。
XDL:阿里出品。X-Deep Learning (XDL) 是針對(duì)特定工業(yè)級(jí)場(chǎng)景(比如廣告)深度學(xué)習(xí)問(wèn)題的解決方案,而不是與其他框架并列的底層框架。實(shí)際上,XDL 采用橋接的方式支持使用 TensorFlow 和 MXNet 作為單節(jié)點(diǎn)的計(jì)算后端。對(duì)于已經(jīng)使用 TensorFlow、MXNet 的開(kāi)發(fā)者來(lái)說(shuō),如果需要在大規(guī)模稀疏場(chǎng)景應(yīng)用可以選擇 XDL 試試, XDL 依賴(lài)于阿里提供特定的部署環(huán)境,對(duì)非阿里系用戶不是很人性化。
不同學(xué)習(xí)階段、不同崗位的開(kāi)發(fā)者,面對(duì)不同的業(yè)務(wù)場(chǎng)景需求應(yīng)該選擇什么深度學(xué)習(xí)框架?選擇和衡量的標(biāo)準(zhǔn)是什么?
不同類(lèi)型的用戶,選擇和衡量的標(biāo)準(zhǔn)會(huì)有一定差異。選擇框架通常要考慮易用性、性能、社區(qū)、平臺(tái)支持等問(wèn)題。初學(xué)者應(yīng)該考慮容易上手的框架。偏研究性的開(kāi)發(fā)者,一般選擇易用而且有領(lǐng)先的模型基線的框架。偏工業(yè)應(yīng)用的開(kāi)發(fā)者可以考慮使用穩(wěn)定性高、性能好的框架。比較高階的用戶,往往需要同時(shí)掌握多個(gè)框架。
最新的開(kāi)源算法可能會(huì)基于某個(gè)框架,掌握多個(gè)框架可以更快復(fù)現(xiàn)前沿成果。同時(shí)不同框架在不同模型上有性能差異,掌握多個(gè)框架也可以選擇在某個(gè)場(chǎng)景下最適合的框架。
在選擇深度學(xué)習(xí)框架時(shí)有哪些經(jīng)驗(yàn)可以分享?需要考慮哪些因素?
開(kāi)發(fā)者通常用深度學(xué)習(xí)框架組建網(wǎng)絡(luò),去解決實(shí)際企業(yè)級(jí)業(yè)務(wù)中的具體問(wèn)題,比如:詞法分析、機(jī)器翻譯等。選擇框架時(shí)通常需要關(guān)注以下一些因素:
框架是否已經(jīng)官方支持了當(dāng)前最好的算法,比如中文詞法分析任務(wù)。
框架是否高效。同樣的算法用不同框架實(shí)現(xiàn),訓(xùn)練速度更快,意味著更少的線下資源,更快的迭代速度;預(yù)測(cè)速度更快,意味著實(shí)際部署時(shí)可以為企業(yè)節(jié)省大量的機(jī)器資源,也具有更高的響應(yīng)速度。
框架的接口是否容易使用。
掌握一個(gè)深度學(xué)習(xí)框架,開(kāi)發(fā)者需要做哪些準(zhǔn)備?
在開(kāi)發(fā)者已經(jīng)學(xué)習(xí) Python 程序開(kāi)發(fā)和深度學(xué)習(xí)基礎(chǔ)知識(shí)的前提下,掌握一個(gè)深度學(xué)習(xí)框架,開(kāi)發(fā)者需要了解框架的基本原理,學(xué)習(xí)并掌握框架的基本概念和用法。
通常可以先從官方文檔開(kāi)始,通過(guò)大致瀏覽官方文檔對(duì)框架基本概念和用法有一個(gè)大致的了解。
另外可以結(jié)合官方提供的快速入門(mén)例子,在自己的機(jī)器上安裝并練習(xí)使用。
然后可以再?gòu)墓俜降哪P蛶?kù)里面挑選一些算法,進(jìn)行學(xué)習(xí)參考。
結(jié)合自己具體任務(wù)組建網(wǎng)絡(luò),查看 API 接口文檔,解決實(shí)際任務(wù)。
深度學(xué)習(xí)框架能“包治百病”嗎?是否適用于所有應(yīng)用場(chǎng)景需求?
需要提醒大家的是,深度學(xué)習(xí)框架不能包至百病,深度學(xué)習(xí)框架能夠解決的是適合使用深度學(xué)習(xí)技術(shù)的應(yīng)用場(chǎng)景。
深度學(xué)習(xí)(DL)是機(jī)器學(xué)習(xí)(ML)的一個(gè)分支,也是當(dāng)下最流行的機(jī)器學(xué)習(xí)方法,雖然近幾年在圖像、語(yǔ)音、自然語(yǔ)言處理等應(yīng)用方向,深度學(xué)習(xí)技術(shù)都取得了突破性的進(jìn)展,但是我們依然不應(yīng)該神話深度學(xué)習(xí),認(rèn)為深度學(xué)習(xí)無(wú)所不能。
適合掌握深度學(xué)習(xí)的任務(wù)應(yīng)具備這樣一些特點(diǎn):
具備大量樣本數(shù)據(jù)。如果樣本數(shù)據(jù)難以獲取或者數(shù)量太少,我們認(rèn)為就不適合深度學(xué)習(xí)技術(shù)解決
樣本數(shù)據(jù)對(duì)場(chǎng)景的覆蓋度足夠完善。深度學(xué)習(xí)模型的效果完全依賴(lài)樣本數(shù)據(jù)表現(xiàn),如果出現(xiàn)樣本數(shù)據(jù)外的情況,模型的推廣性會(huì)變差
結(jié)果對(duì)可解釋性的要求不高。如果應(yīng)用場(chǎng)景不僅要機(jī)器能夠完成某項(xiàng)任務(wù),還需對(duì)完成過(guò)程有明確的可解釋性,這樣的場(chǎng)景就不那么適合深度學(xué)習(xí)。
中國(guó)的深度學(xué)習(xí)框架有哪些不同于歐美國(guó)家主流深度學(xué)習(xí)開(kāi)發(fā)框架的特點(diǎn)和創(chuàng)新?
從深度學(xué)習(xí)框架的特點(diǎn)來(lái)講,中國(guó)和歐美的的區(qū)分未必是一個(gè)合適的分類(lèi)方式。很多中國(guó)深度學(xué)習(xí)框架研發(fā)的主體是中國(guó)工程師,也是在中國(guó)公司成長(zhǎng)起來(lái)的,自然對(duì)國(guó)內(nèi)的實(shí)際應(yīng)用特點(diǎn)把握得會(huì)更精準(zhǔn),而且在中文文檔、中文教程以及中文模型配套上是獨(dú)具特色的。
未來(lái),框架發(fā)展會(huì)出現(xiàn)哪些趨勢(shì)?
首先,當(dāng)前仍處于深度學(xué)習(xí)研究和應(yīng)用的持續(xù)火熱期,深度學(xué)習(xí)框架及平臺(tái)在研究界和工業(yè)界的需求仍持續(xù)增長(zhǎng)。深度學(xué)習(xí)框架和平臺(tái)在產(chǎn)業(yè)界的市場(chǎng)占有還未進(jìn)入穩(wěn)定期,當(dāng)然未來(lái)一段時(shí)間應(yīng)該也不會(huì)出現(xiàn)完全一家獨(dú)大的壟斷局面。
一方面整體的市場(chǎng)需求是很大也很多樣化的,另一方面不同框架在特性及發(fā)力點(diǎn)上自然會(huì)有一些差異性的適配。隨著深度學(xué)習(xí)在各行各業(yè)的廣泛應(yīng)用,服務(wù)能力強(qiáng)的、更貼近用戶需求的框架會(huì)有更大的提升機(jī)會(huì)。
過(guò)去一段時(shí)間,動(dòng)態(tài)圖的靈活性、易用性展現(xiàn)出對(duì)科研人員極大的吸引力,更多框架開(kāi)始支持動(dòng)態(tài)圖,但需要進(jìn)一步解決動(dòng)態(tài)圖下的性能優(yōu)化問(wèn)題。因?yàn)樵诠I(yè)界,訓(xùn)練效率和規(guī)模化始終是最重要的。所以,各框架取長(zhǎng)補(bǔ)短趨同性比較明顯,前端易用性、計(jì)算高效性、框架穩(wěn)定性成為持續(xù)優(yōu)化方向。當(dāng)然,不同框架的先天基因的特性還是非常明顯的。
此外需要注意的是,AI 專(zhuān)有芯片也在快速發(fā)展,框架和底層芯片的軟硬結(jié)合一體化研發(fā)也日益引起關(guān)注。AI 應(yīng)用部署場(chǎng)景快速擴(kuò)張,框架對(duì)各硬件平臺(tái)的快速部署和高效推理能力變得非常重要。整體而言,需要支持多硬件的高效計(jì)算。這也使得框架 內(nèi)部架構(gòu)上傾向于更好的抽象分層,保持整體邏輯的統(tǒng)一性和異構(gòu)硬件執(zhí)行的高效性。
另一方面,深度學(xué)習(xí)框架的內(nèi)涵也在延展。深度學(xué)習(xí)框架的出現(xiàn)本身就是為了深度學(xué)習(xí)研究、實(shí)驗(yàn)和應(yīng)用的便利性,節(jié)省了開(kāi)發(fā)者很大的編程代價(jià)。但對(duì)于深度學(xué)習(xí)技術(shù)而言,網(wǎng)絡(luò)設(shè)計(jì)其實(shí)也是非常重要的一環(huán),基礎(chǔ)的深度學(xué)習(xí)框架是無(wú)法解決這個(gè)問(wèn)題的。所以當(dāng)下 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的自動(dòng)設(shè)計(jì) AutoDL 技術(shù)就成為新的熱點(diǎn),也和深度學(xué)習(xí)框架進(jìn)行更緊密的結(jié)合。
從便利深度學(xué)習(xí)技術(shù)應(yīng)用來(lái)講,只靠開(kāi)源框架還是不夠的,需要場(chǎng)景化組件、模塊、平臺(tái)和產(chǎn)品的組合打法,框架之上的平臺(tái)、配套組件構(gòu)成的深度學(xué)習(xí)全流程解決方案對(duì)實(shí)際應(yīng)用非常關(guān)鍵。若想深度學(xué)習(xí)框架在實(shí)際應(yīng)用中發(fā)揮更大作用,是需要 更全面的綜合服務(wù)配套建設(shè)的。
如何看待接下來(lái)的框架之爭(zhēng)?
隨著深度學(xué)習(xí)技術(shù)的普及,各家框架的成熟化,深度學(xué)習(xí)技術(shù)的門(mén)檻會(huì)越來(lái)越低。在研究場(chǎng)景中,好用、靈活易擴(kuò)展是最重要的考量因素,從目前的趨勢(shì)來(lái)看,PyTorch 在易用性上有一定優(yōu)勢(shì)。PaddlePaddle 在實(shí)際生產(chǎn)場(chǎng)景中,框架的易用性、穩(wěn)定性、生態(tài)資源的豐富度將取代技術(shù)的領(lǐng)先性成為開(kāi)發(fā)者更重要的考量因素。
未來(lái),擁有完整生態(tài)資源、有實(shí)際應(yīng)用場(chǎng)景支撐的框架會(huì)爭(zhēng)奪到越來(lái)越多的企業(yè)開(kāi)發(fā)者用戶。在國(guó)外,依賴(lài)于谷歌生態(tài)的 TensorFlow,依賴(lài)于 AWS 云生態(tài)的 MXNet,未來(lái)都有一定的機(jī)會(huì)。
想要形成自己的產(chǎn)品生態(tài),需要哪些必備條件?
想要形成自己的產(chǎn)品生態(tài),需要具備四大條件:
掌握能為最終用戶提供巨大收益的核心技術(shù)。如深度學(xué)習(xí)領(lǐng)域框架所涉及的異構(gòu)計(jì)算、并行訓(xùn)練、多路通信、多端部署及核心算法等關(guān)鍵技術(shù)。廠商需要擁有深度學(xué)習(xí)核心技術(shù)并形成自己的特色,才具備了生態(tài)號(hào)召力。
核心產(chǎn)品或服務(wù)能夠規(guī)模化地應(yīng)用和落地。在生態(tài)拓展的過(guò)程中,廠商有能力通過(guò)平臺(tái)和資源沉淀足夠多的通用解決方案。
能為最終用戶提供全面的體驗(yàn)。深度學(xué)習(xí)框架應(yīng)用門(mén)檻較高,真正在企業(yè)廣泛落地,還有很多的工作要做,比如結(jié)合企業(yè)需求的深度定制優(yōu)化、深度學(xué)習(xí)配套工具建設(shè)、細(xì)致的企業(yè)服務(wù)等等,這要求廠商能夠有效整合生態(tài)系統(tǒng)中的各個(gè)伙伴能力,為最終用戶提供更全面的產(chǎn)品體驗(yàn)。
擁有持續(xù)創(chuàng)新的能力。廠商應(yīng)該有足夠的資金和動(dòng)力讓核心技術(shù)和產(chǎn)品持續(xù)創(chuàng)新,使得生態(tài)系統(tǒng)的用戶相信核心業(yè)務(wù)能夠一直使他們受益。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132714 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5504瀏覽量
121222 -
pytorch
+關(guān)注
關(guān)注
2文章
808瀏覽量
13238
原文標(biāo)題:BAT專(zhuān)家解讀:如何選出最合適的深度學(xué)習(xí)框架?
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論