我們正處于AI創(chuàng)業(yè)熱潮之中,機器學(xué)習(xí)專家的薪資水平水漲船高,投資者也樂于對AI初創(chuàng)公司慷慨解囊。AI的普及成為推動社會生產(chǎn)力標(biāo)志,必將改變我們的生活。
但是,本文作者前谷歌工程師、Inovo.vc的CTORic Szopa認為,AI從業(yè)者的技能正在貶值。他從一個選擇題入手告訴我們,AI工具、數(shù)據(jù)集、資金投入以及行業(yè)+AI的優(yōu)勢正在一步步弱化單一的AI基礎(chǔ)技術(shù)優(yōu)勢。
先來做一道選擇題。
Alice和Bob是兩位AI創(chuàng)業(yè)者, 他們的公司籌集了大致相同的資金,并在同一個市場上展開了激烈的競爭。
Alice把大部分錢花來雇傭最好的工程師,請來了一批在人工智能研究方面經(jīng)驗豐富的博士。
而Bob選擇雇用資質(zhì)一般但還算能干的工程師,并將省下來的錢用于獲得更好的數(shù)據(jù)。
如果是你,你會給誰投資?
當(dāng)然是Bob。
為什么呢?
從本質(zhì)上講,機器學(xué)習(xí)的原理是從數(shù)據(jù)中獲取信息,并將其轉(zhuǎn)化為模型權(quán)重。更好的模型使得這個過程更有效(時間或者整體質(zhì)量方面),但如果假設(shè)模型訓(xùn)練相對都比較充分,更好的數(shù)據(jù)肯定會產(chǎn)生更好的結(jié)果。
為了說明這一點,讓我們再進行一個快速而簡單的測試。
假設(shè)我創(chuàng)建了兩個性能不太一樣的卷積網(wǎng)絡(luò)。“更好”的模型的最后一個全連接層有128個神經(jīng)元,而“稍微差一點”的只有64個。我在不同大小的MNIST數(shù)據(jù)集的子集上訓(xùn)練它們,并繪制模型在測試集上的準確率與訓(xùn)練樣本數(shù)的折線圖。
藍色是“更好”的模型,綠色是“稍微差一點”的模型
很顯然,訓(xùn)練數(shù)據(jù)集大小具有積極影響(至少在模型開始過擬合和準確率達到穩(wěn)定之前)。值得一提的是,在40000個樣本上訓(xùn)練的“稍微差一點”模型的準確率比在30000個樣本上訓(xùn)練的“更好”模型的準確率要高!
在我的小例子中,我們處理的是一個相對簡單的問題,而且有一個比較全面的數(shù)據(jù)集。而在現(xiàn)實生活中,我們的條件并不是如此完美。在許多情況下,增加數(shù)據(jù)集經(jīng)常會具有非常顯著的效果。
事實上,Alice的工程師不僅僅是和Bob的工程師競爭。由于AI社區(qū)的開放文化及其對知識共享的重視,他們的競爭對手其實來自谷歌、Facebook、微軟以及世界各地數(shù)千所大學(xué)的研究人員。
因此, 好的工程師雖然很重要的,但如果你是AI領(lǐng)域的話,數(shù)據(jù)的競爭優(yōu)勢會顯得更為關(guān)鍵。
然而,更加重要的問題是,你如何才能保持自己的優(yōu)勢。
AI工具正越來越簡單好用
2015年,當(dāng)我還在谷歌工作,剛開始玩DistBelief,也就是后來我們所熟知的Tensorflow。當(dāng)時這個工具太難用了,所以當(dāng)時想讓它在谷歌構(gòu)建的系統(tǒng)之外運行完全是一個白日夢。
2016年末,我進行了一個概念驗證的研究,在組織病理學(xué)圖像中檢測乳腺癌。當(dāng)時我想使用遷移學(xué)習(xí):采用谷歌當(dāng)時最好的圖像分類架構(gòu)Inception,并在我的癌癥數(shù)據(jù)上重新訓(xùn)練。我可以使用谷歌提供的一個經(jīng)過預(yù)訓(xùn)練的初始權(quán)重,改變頂層結(jié)構(gòu)來匹配我正在做的工作。
在TensorFlow上經(jīng)過長時間的反復(fù)嘗試,我終于找到了操作不同層的方法,讓它基本上運作起來。這需要很大的毅力去閱讀TensorFlow的資料。不過至少我不必太擔(dān)心依賴關(guān)系,因為TensorFlow貼心地準備了Docker鏡像。
在2018年初,多虧了Keras(基于TensorFlow的一個框架),只需幾行Python代碼就能完成這個項目,而且使用它不需要你對自己正在做的事情有深入理解。但它仍然有個痛點:超參數(shù)調(diào)優(yōu)。
如果你有一個深度學(xué)習(xí)模型,可以調(diào)節(jié)多個參數(shù),如層數(shù)和大小等。在我寫這些文字的時候(2019年初),谷歌和亞馬遜提供了自動模型調(diào)優(yōu)服務(wù)(Cloud AutoML,SageMaker)。
我預(yù)測手動調(diào)優(yōu)遲早會滅絕,工程師們也會從這項繁瑣的工作中解脫了。
總的趨勢是,將困難的事變得容易,你無需深入理解就能實現(xiàn)更多的東西。過去的那些偉大工程現(xiàn)在聽起來相當(dāng)一般,所以我們不應(yīng)該期望我們現(xiàn)在的成就在將來有多好。
聽起來很歡欣鼓舞是不是,但是,對于那些在AI技術(shù)上投入巨資的公司和個人來說,這可以是個壞消息。目前來說,掌握某些AI技術(shù)還算是企業(yè)的競爭優(yōu)勢,因為一個稱職的機器學(xué)習(xí)工程師需要花費大量的時間閱讀論文,并需要扎實的數(shù)學(xué)背景。
但是,隨著工具的改進,情況將不再如此。讀論文更多會轉(zhuǎn)向讀工具教程。如果你沒有很快意識到你該關(guān)注的重點,一個帶了數(shù)據(jù)更完備的實習(xí)生團隊就可能會搶走你的飯碗。
想長期保持競爭優(yōu)勢?難上加難!
讓我們再回到文章開頭的例子。憑借出色的數(shù)據(jù)集,Bob成功地與Alice展開競爭,推出了自己的產(chǎn)品,并穩(wěn)步增加了市場份額。他也慢慢可以開始雇傭更好的工程師,因為坊間傳言他的公司是一個好去處。
但這時候,又出現(xiàn)了一個Chuck,雖然入局晚,但他比Bob更有錢。
在構(gòu)建數(shù)據(jù)集時,錢至關(guān)重要。但通過砸錢來加快工程項目進度非常困難。事實上,使用太多新人可能會減緩進度,但構(gòu)建數(shù)據(jù)集就不同了。數(shù)據(jù)集需要大量人工操作,而你可以通過雇用更多人手來搞定它。另一種可能是有人擁有數(shù)據(jù),那么你所要做的就是支付數(shù)據(jù)使用費。
無論如何,錢能讓數(shù)據(jù)集來得更快。
但是問題來了,為什么Chuck可以籌到比Bob更多的錢?
當(dāng)創(chuàng)始人提出一輪融資時,他們會努力平衡兩個可能相互矛盾的目標(biāo)。他們需要籌集足夠的資金在市場上競爭,但也不能太多,因為這會導(dǎo)致股權(quán)過度稀釋。創(chuàng)始團隊必須在創(chuàng)業(yè)公司中保持足夠的股份,以免失去創(chuàng)業(yè)的動力。
另一方面,投資者希望投資具有巨大上升潛力的創(chuàng)意,但他們必須控制風(fēng)險。隨著預(yù)期風(fēng)險的增加,他們會為支付的每一美元要求更大比例的股份。
當(dāng)Bob籌集資金時,“人工智能確實對產(chǎn)品有所幫助”不過只是一個信念。無論他作為創(chuàng)始人多優(yōu)秀,她的團隊有多好,但有可能他試圖解決的問題根本就難如登天。Chuck的情況非常不同。他知道他面臨的問題完全可以解決!
在這種情況下,Bob的應(yīng)對方法很可能是提出另一輪融資,以便處于有利位置,因為他(暫時)仍然在競爭中領(lǐng)先。但是,如果Chuck可以通過戰(zhàn)略合作關(guān)系穩(wěn)固獲取數(shù)據(jù)呢?比如舉個癌癥診斷初創(chuàng)公司的例子,Chuck可能利用他在一家重要醫(yī)療機構(gòu)的內(nèi)部職位,與該機構(gòu)達成一份內(nèi)部協(xié)議。這時候, Bob很可能無法抗衡。
你的產(chǎn)品需具備防御性,最好是一條“護城河”
AI的杠桿效應(yīng)
對業(yè)務(wù)進行分類的一種方法是,它是直接增加價值,還是為某些其他價值來源提供杠桿效應(yīng)。以一家電子商務(wù)公司為例,增加價值就像創(chuàng)造了新的產(chǎn)品線,建立新的分銷渠道則是一個杠桿,削減成本也是杠桿。
杠桿可能比直接施力更有效。但是,杠桿僅在與直接價值來源耦合時才起作用。一個微小的數(shù)字,翻了兩倍,三倍,還是很小。如果你沒有可出售的部件,開辟新的分銷渠道也只是浪費時間。
在這種情況下我們應(yīng)該如何看待AI?有很多公司試圖將AI作為他們的直接產(chǎn)品(用于圖像識別的API等),對一個AI專家,這可能很有吸引力。
然而,這常并不是一個好的選擇。首先,你是在Google和亞馬遜等這些大公司競爭。其次,開發(fā)真正有用的通用AI產(chǎn)品非常困難。例如,我一直想使用Google的Vision API。不幸的是,我們從未遇到過客戶需求與產(chǎn)品充分匹配的情況。總是有各種各樣要么開發(fā)不夠要么開發(fā)過度的情況。
更好的選擇是將AI視為杠桿。
你可以采用現(xiàn)有的,有效的商業(yè)模式,通過AI增強它。例如,如果生產(chǎn)流程依靠人類的認知勞動,那么將其自動化可能會為毛利率帶來顯著提升。這里我能想到的例子有:心電圖分析,工業(yè)檢查,衛(wèi)星圖像分析。同樣令人興奮的是,因為AI屬于輔助后端,仍然可以利用非AI業(yè)務(wù)來保持公司的競爭優(yōu)勢。
結(jié)論
AI是一項真正的變革性技術(shù)。但是,以此為基礎(chǔ)創(chuàng)業(yè)是一件棘手的事情。你不應(yīng)該完全依賴于AI技能,因為市場趨勢就是技術(shù)會貶值。
構(gòu)建AI模型可能非常有趣,但真正重要的是擁有比競爭對手更好的數(shù)據(jù)。
保持競爭優(yōu)勢很難,特別是遇到比你資金更充足的競爭對手,這種情況在你的AI創(chuàng)業(yè)進行時很可能發(fā)生。你的目標(biāo)應(yīng)該是創(chuàng)建一個可擴展的數(shù)據(jù)收集過程,而這個過程很難被競爭對手復(fù)現(xiàn)。
AI非常適合顛覆依賴低附加值、勞動重復(fù)性的行業(yè),因為它使該工作自動化成為可能。
-
AI
+關(guān)注
關(guān)注
87文章
30757瀏覽量
268902 -
全卷積網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
7瀏覽量
2023
原文標(biāo)題:是的,你的AI技能正在“貶值”
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論