為什么這三家公司最終都不約而同地放棄 TensorFlow ,而轉(zhuǎn)向了 PyTorch?
深度學(xué)習(xí)框架 PyTorch 憑借其相對易用性,已經(jīng)滲透到了企業(yè)中。本文提到的三家公司告訴我們,為什么他們選擇 PyTorch 而不是 Google 著名的 TensorFlow 框架。
深度學(xué)習(xí) 是機(jī)器學(xué)習(xí)的一個子類別,它使用多層神經(jīng)網(wǎng)絡(luò)將歷史上很難完成的機(jī)器任務(wù)——比如 圖像識別、自然語言處理 和 機(jī)器翻譯——實現(xiàn)大規(guī)模自動化。
自 2015 年以來,TensorFlow 就從 Google 中脫穎而出,在研究和商業(yè)領(lǐng)域成為最受歡迎的開源深度學(xué)習(xí)框架。但是 2016 年從 Facebook 誕生的 PyTorch 由于社區(qū)推動的易用性改進(jìn)和越來越廣泛的用例部署,而迅速 趕上TensorFlow。
在汽車行業(yè),PyTorch 的應(yīng)用尤為廣泛——它可以應(yīng)用于 Tesla 和 Lyft Level 5 等公司的實驗性自動駕駛系統(tǒng)。該框架也被媒體公司用來對內(nèi)容進(jìn)行分類和推薦,并在工業(yè)應(yīng)用中支持機(jī)器人。
Facebook AI 的人工智能產(chǎn)品主管 Joe Spisak 告訴 InfoWorld,雖然他對企業(yè)采用 PyTorch 的人數(shù)增加感到高興,但要擴(kuò)大行業(yè)應(yīng)用范圍,還有很多工作要做。
“MLOps 和 Kubeflow 管道以及這些社區(qū)的支持將會帶來新一輪的采用浪潮,”他說。“對于那些剛起步的人來說,這些工具都相當(dāng)不錯,它們使用了托管服務(wù)和一些開源的東西,比如 AWS 的 SageMaker 或 Azure ML。”
Disney:識別電影中的動畫面孔
自 2012 年以來,媒體巨頭 Disney 的工程師和數(shù)據(jù)科學(xué)家一直在構(gòu)建該公司所謂的“內(nèi)容基因組”(Content Genome)的知識圖譜,將內(nèi)容元數(shù)據(jù)聚合在一起,從而推動 Disney 龐大的內(nèi)容庫中基于機(jī)器學(xué)習(xí)的搜索和個性化應(yīng)用。
“這個元數(shù)據(jù)改進(jìn)了 Disney 故事講述者用于制作內(nèi)容的工具;激發(fā)故事中的迭代創(chuàng)新;通過推薦引擎,數(shù)字導(dǎo)航和內(nèi)容發(fā)現(xiàn)提高用戶體驗;并實現(xiàn)了商業(yè)智能。”Disney 的開發(fā)人員 Miquel±ngel Farré、Anthony Accardo、Marc Junyent、Monica Alfaro 和 Cesc Guitart 在 今年 7 月的一篇博客文章 中寫道。
在這之前,Disney 不得不投資一個龐大的內(nèi)容注釋項目,求助于其數(shù)據(jù)科學(xué)家,利用深度學(xué)習(xí)的圖像識別模型,訓(xùn)練一個自動化標(biāo)記管道,以識別海量的人物,地點和地點圖像。
Disney 的工程師們最初嘗試了包括 TensorFlow 在內(nèi)的各種框架,但在 2019 年,他們決定將 PyTorch 與之結(jié)合起來。工程師們從傳統(tǒng)的 方向梯度直方圖(histogram of oriented gradients,HOG)特征描述器和流行的 支持向量機(jī)(support vector machines,SVM)模型,轉(zhuǎn)向了被稱為 基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(regions with convolutional neural networks,R-CNN)的目標(biāo)檢測架構(gòu)版本。在處理 Disney 內(nèi)容中常見的真人動作、動畫和視覺效果的組合時,后者更為有利。
“在動畫片中很難定義什么是人臉,所以我們轉(zhuǎn)向深度學(xué)習(xí)方法,使用目標(biāo)檢測器,并使用遷移學(xué)習(xí)。”Disney 研究工程師 Monica Alfaro 向 InfoWorld 解釋道。在僅僅處理了幾千張人臉之后,新模型已經(jīng)能夠大致識別所有三種用例中的人臉。它于 2020 年 1 月投入生產(chǎn)。
她表示:“我們現(xiàn)在只使用一種模型來識別三種類型的人臉,這對于像《復(fù)仇者聯(lián)盟》這樣的漫威電影來說是很棒的。因為在這類電影中,鋼鐵俠和 Tony Stark 或者任何一個戴面具的角色都需要被識別出。”
由于工程師要處理如此大量的視頻數(shù)據(jù)以并行地訓(xùn)練和運行模型,所以他們也希望在投入生產(chǎn)階段時,能夠運行在昂貴的高性能 GPU 上。
從 CPU 的轉(zhuǎn)變讓工程師可以更快地重新訓(xùn)練和更新模型。它還加快了向 Disney 各個小組分發(fā)測試結(jié)果的速度,將處理時間從一部長篇電影的大約一個小時縮短到今天的 5 到 10 分鐘。
“TensorFlow 目標(biāo)檢測器在生產(chǎn)環(huán)境中會存在內(nèi)存問題,并且很難更新;而 PyTorch 有同樣的目標(biāo)檢測器和 Faster-RCNN,因此我們開始使用 PyTorch 來解決所有的問題。”Alfaro 說。
對工程團(tuán)隊來說,這種從一個框架到另一個框架的轉(zhuǎn)換也出奇地簡單。“(改用 PyTorch)很容易,因為它都是內(nèi)置的,你只需要插入一些功能,就可以快速上手,所以它的學(xué)習(xí)曲線并不陡峭。”Alfaro 說。
當(dāng)他們遇到任何問題或瓶頸時,充滿活力的 PyTorch 社區(qū)隨時提供幫助。
Blue River Technology:除草機(jī)器人
Blue River Technology 設(shè)計了一款機(jī)器人,這種機(jī)器人結(jié)合了數(shù)字尋路、集成攝像頭和計算機(jī)視覺技術(shù),可以在農(nóng)作物不受影響的情況下,在近乎實時的環(huán)境給雜草噴灑除草劑,幫助農(nóng)民更有效地節(jié)約昂貴且可能對環(huán)境造成破壞的除草劑。
這家位于加利福尼亞州森尼韋爾的公司在 2017 年吸引了重型設(shè)備制造商 John Deere 的關(guān)注,當(dāng)時該公司以 3.05 億美元的價格被 收購,目的是將該技術(shù)整合到其農(nóng)業(yè)設(shè)備中。
Blue River Technology 的研究人員利用各種深度學(xué)習(xí)框架進(jìn)行了試驗,試圖訓(xùn)練計算機(jī)視覺模型來識別雜草和農(nóng)作物之間的差異,這對處理棉花植物來說是一個巨大的挑戰(zhàn),因為棉花植物不幸地與雜草相似。
Blue River Technology 的計算機(jī)視覺和機(jī)器學(xué)習(xí)主管 Chris Padwick 在他 8 月份的一篇 博客文章 中寫道,訓(xùn)練有素的農(nóng)藝師被征召來執(zhí)行人工圖像標(biāo)注任務(wù),并使用 PyTorch 訓(xùn)練 卷積神經(jīng)網(wǎng)絡(luò)(CNN),以“分析每一幀圖像,并生成像素級精度的地圖,顯示農(nóng)作物和雜草所在的位置”。
“像其他公司一樣,我們也試過 Caffe、TensorFlow 和 PyTorch,”Padwick 告訴 InfoWorld。“對我們來說,這幾乎是一種開箱即用的方法,我們既沒有收到過任何 bug 報告,也沒有出現(xiàn)過阻塞 bug。在分布式計算中,它真的很亮眼,它的性能確實比 TensorFlow 要好,TensorFlow 在數(shù)據(jù)并行方面相當(dāng)復(fù)雜。”
Padwick 表示,PyTorch 框架的普及和簡單性使得他在快速招聘新員工方面具有優(yōu)勢。話雖如此,Padwick 仍然夢想著這樣一個世界:“人們可以在自己喜歡的環(huán)境中進(jìn)行開發(fā)。”有些人喜歡用 Apache MXNet、Darknet 或 Caffe 進(jìn)行研究,但是在生產(chǎn)環(huán)境中,它們只能使用單一語言,而 PyTorch 擁有我們成功所需的一切。”
Datarock:基于云端的采礦業(yè)圖像分析
Datarock 是由一群地球科學(xué)家創(chuàng)立的澳大利亞初創(chuàng)公司,正在將 計算機(jī)視覺 技術(shù)應(yīng)用于采礦業(yè)。更具體地說,它的深度學(xué)習(xí)模型正在幫助地質(zhì)學(xué)家比以前更快地分析鉆探巖心樣本圖像。
通常,地質(zhì)學(xué)家會一厘米一厘米地仔細(xì)研究這些樣品,以評估礦物學(xué)和結(jié)構(gòu);而工程師則會尋找諸如斷層、裂縫和巖石質(zhì)量等物理特征。這一過程是緩慢的,而且很容易出現(xiàn)人為錯誤。
Datarock 的首席運營官 Brenton Crawford 告訴 InfoWorld:“計算機(jī)可以像工程師一樣看到巖石。如果你能在圖像中看到,我們就可以訓(xùn)練一個模型去分析它,就像訓(xùn)練一個人類一樣。”
與 Blue River 類似,Datarock 在生產(chǎn)環(huán)境中使用了 RCNN 模型的一種變體,研究人員轉(zhuǎn)向數(shù)據(jù)增強(qiáng)技術(shù),以便在早期階段收集足夠的訓(xùn)練數(shù)據(jù)。
“在最初的發(fā)現(xiàn)期之后,團(tuán)隊開始將各種技術(shù)結(jié)合起來,為鉆探巖心圖像創(chuàng)建一個圖像處理工作流程。這項工作包括開發(fā)一系列深度學(xué)習(xí)模型,能夠?qū)⒃紙D像處理為結(jié)構(gòu)化格式,并分割重要的地質(zhì)信息。”研究人員在一篇 博客文章 中寫道。
通過 DataRock 的技術(shù),客戶只需半小時就能得到結(jié)果,而手工記錄結(jié)果需要五、六小時。Crawford 說,這樣可以使地質(zhì)學(xué)家不再從事更繁重的工作。但是,“當(dāng)我們將更困難的事情實現(xiàn)自動化時,我們確實會受到一些阻力,不得不解釋為什么要把它們作為訓(xùn)練模型和使反饋循環(huán)轉(zhuǎn)動的系統(tǒng)的一部分。”
和許多公司訓(xùn)練深度學(xué)習(xí)計算機(jī)視覺模型一樣,Datarock 也是從 TensorFlow 開始的,但很快就轉(zhuǎn)向了 PyTorch。
Datarock 的機(jī)器學(xué)習(xí)主管 Duy Tin Truong 告訴 InfoWorld:“一開始我們使用的是 TensorFlow,但是由于某些神秘的原因它會崩潰。”他說,“當(dāng)時 PyTorch 和 Detecton2 剛剛發(fā)布,非常符合我們的需求,所以經(jīng)過一些測試之后,我們發(fā)現(xiàn)它更容易調(diào)試和工作,而且占用的內(nèi)存也更少,所以我們進(jìn)行了轉(zhuǎn)換。”
Datarock 還報告說,當(dāng)在 GPU 上運行模型時,從 TensorFlow 到 PyTorch 和 Detectron2 的推理性能提高了 4 倍,而在 CPU 上則提高了 3 倍。
Truong 列舉了 PyTorch 不斷增長的社區(qū)、設(shè)計良好的界面、易于使用和更好的調(diào)試作為切換的理由,并指出,盡管“從界面的角度來看,它們是完全不同的,但如果你懂 TensorFlow,那么切換起來是相當(dāng)容易的,特別是如果你了解 Python 的時候。”
作者介紹:
Scott Carey,經(jīng)驗豐富的多媒體記者,專注于科技、旅游、體育、文化和社交媒體。目前是記者和編輯,管理著一支由 B2B 記者組成的優(yōu)秀團(tuán)隊,并且具有豐富的數(shù)字技能,在為網(wǎng)絡(luò)和紙媒撰稿、報道事件、電視記者和電臺記者方面的經(jīng)驗。
責(zé)任編輯:lq
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28597瀏覽量
207832 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121376 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60577
原文標(biāo)題:始于TensorFlow ,終于PyTorch
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論