最近幾天在知乎上有個(gè)問(wèn)題火了:
你是什么時(shí)候?qū)?a href="http://www.1cnz.cn/v/tag/448/" target="_blank">深度學(xué)習(xí)失去信心的?
在此推薦一下知乎大V@霍華德的回答,以下為原回答。
對(duì)于深度學(xué)習(xí)的現(xiàn)狀,工業(yè)界還是很清楚的。如果沒(méi)有變革性的突破,弱人工智能時(shí)代的范式應(yīng)該基本就要確定了。
大模型 + 拖拖樂(lè)
基本范式就是 大模型 + 拖拖樂(lè),下游少量數(shù)據(jù)微調(diào),在前端表現(xiàn)為拖拖樂(lè)形成DAG,自動(dòng)生產(chǎn)模型。拖拖樂(lè)平臺(tái),各大云廠(chǎng)商都有提供,如阿里的PAI,騰訊的Ti平臺(tái)、華為的ModelArts,亞馬遜的SageMaker等等
對(duì)于大模型,各種網(wǎng)絡(luò)魔改價(jià)值很有限,因?yàn)閿?shù)據(jù)上去后,假設(shè)越少越好,偏置歸納越少越好,這就使得模型越樸素越好。
大模型也會(huì)成為各大公司的核心資產(chǎn),所有數(shù)據(jù)向大模型匯聚,試圖記下互聯(lián)網(wǎng)上的一切數(shù)據(jù)。然后,一鍵蒸餾小模型,一鍵剪枝,一鍵壓縮,一鍵部署,一鍵一條龍。
深度學(xué)習(xí)規(guī)則化
越來(lái)越覺(jué)得,深度學(xué)習(xí)變成一種數(shù)據(jù)驅(qū)動(dòng)的規(guī)則,一個(gè)模型就是一個(gè)規(guī)則。傳統(tǒng)規(guī)則引擎里各種if-else,全靠程序員啟發(fā)式完成。
深度學(xué)習(xí)規(guī)則引擎,每個(gè)規(guī)則就是個(gè)小模型。全靠算法工程師,使用數(shù)據(jù)驅(qū)動(dòng)的方式訓(xùn)練完成。
之前大家覺(jué)得,一個(gè)強(qiáng)力模型包打天下。現(xiàn)在看來(lái),更務(wù)實(shí)的方式的,無(wú)數(shù)小模型,組合沖擊,往往效果更佳。
這就使得,原本深度學(xué)習(xí)被詬病可解釋性問(wèn)題,其實(shí)不再是問(wèn)題。因?yàn)閺臉I(yè)務(wù)頂層已經(jīng)被拆分,拆分成一個(gè)個(gè)可以被人理解的因子,無(wú)法被合理解釋的因子,項(xiàng)目啟動(dòng)的評(píng)審都無(wú)法通過(guò)。
就我熟悉的視頻理解來(lái)說(shuō)吧,原本以為一個(gè)強(qiáng)大模型,學(xué)習(xí)所有數(shù)據(jù),出一個(gè)強(qiáng)力分?jǐn)?shù),然后用這個(gè)分?jǐn)?shù)搞定一切。但這樣的模型背后的黑箱,無(wú)法被接受。
現(xiàn)在,視頻被從非常多個(gè)維度切分,視頻清晰度、視頻美觀(guān)度、視頻有沒(méi)有l(wèi)og,視頻有沒(méi)有涉黃,視頻有沒(méi)有涉政,是不是ppt視頻,有沒(méi)有被剪裁過(guò),有沒(méi)有黑邊。所有這些子任務(wù)都不需要多強(qiáng)的模型,更重要的是數(shù)據(jù)。
顯著的 > 隱含的
另外一個(gè)感悟是,顯著的優(yōu)于隱含的,字幕就是優(yōu)于打標(biāo)簽,OCR識(shí)別優(yōu)于各種分類(lèi)、檢索、生成。因?yàn)樽帜痪褪亲铒@著的,其他信息都是隱含的,通過(guò)模型推測(cè)出來(lái)的。
這就產(chǎn)生了一個(gè)固有矛盾。在學(xué)術(shù)界,隱含的才是有難度的,才是有研究?jī)r(jià)值的,例如視頻動(dòng)作識(shí)別,一定要從連續(xù)的動(dòng)作中理解出到底在干啥。但在工業(yè)界,這樣的任務(wù)就非常難用。工業(yè)界喜歡顯著的,因?yàn)閱?wèn)題最少。
這樣的分野,會(huì)使得工業(yè)界和學(xué)術(shù)界關(guān)心的問(wèn)題,慢慢發(fā)生分歧,不知道是好是壞。
刀耕火種的時(shí)代過(guò)去了
過(guò)去,算法工程師們耕作著一畝三分地,或經(jīng)營(yíng)著一個(gè)個(gè)手工作坊,面向業(yè)務(wù)營(yíng)業(yè)。但顯然刀耕火種和手工作坊時(shí)代要過(guò)去了。大型收割機(jī)已經(jīng)進(jìn)入農(nóng)田,制造業(yè)工廠(chǎng)已經(jīng)拔地而起,里面是一條條模型流水線(xiàn)。這就是生產(chǎn)力的發(fā)展,勢(shì)不可擋。
但就像失去土地的農(nóng)民,失去作坊的工匠,下步又該何去何從?
技能閉環(huán),還是深耕?
我能想到的大概兩個(gè)方向。
一個(gè)是往大模型深耕,成為大模型專(zhuān)家,在公司內(nèi)守住一個(gè)領(lǐng)域的大模型。或者帶著自己大模型的技能,到其他地方去用大模型降維打擊。但其實(shí)能用起的大模型的地方,可能不會(huì)很多,訓(xùn)練的成本就很高。
一個(gè)是技能閉環(huán),或者說(shuō)就是全棧化,補(bǔ)充后臺(tái)、前端、大數(shù)據(jù)、產(chǎn)品的知識(shí),爭(zhēng)取獲得獨(dú)立打造產(chǎn)品的能力。這樣能降低被螺絲釘化的風(fēng)險(xiǎn)。
審核編輯 :李倩
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7006瀏覽量
88955 -
模型
+關(guān)注
關(guān)注
1文章
3229瀏覽量
48813 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121117
原文標(biāo)題:你是什么時(shí)候?qū)ι疃葘W(xué)習(xí)失去信心的?
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論