今天我們談論AI,已經很少再提及下圍棋、打游戲等“碾壓人類”式的炸裂新聞,而是更關注AI如何與各行業相結合,創造真實的產業價值與經濟效率。近期,國際咨詢公司Gartner 將“AI工程化”列為2021年度九大技術趨勢之一,這也是繼去年“AI民主化”入榜后,Gartner再次對AI技術做出預判。
作為AI 民主化技術趨勢報告的主筆分析師,Gartner高級研究總監呂俊寬認為:這兩大趨勢的核心都是讓AI逐步走向產業。從案例式的單點項目,到千行萬業的規模應用,AI走向產業其實包含了兩層含義:一是AI可以用規模化生產的方式來降低產業使用門檻,使技術成本可接受,即“AI民主化”;二是AI可以與具體的產業場景相融合,達成可靠、可見、可信的良性收益,即“AI工程化”。但對于大部分人和企業來說,“未來所有公司都是AI公司”的愿景并不容易實現,從“技術概念”到產業落地,中間還橫亙著廣袤而空曠的未知地帶。
今天,大家都希望AI會如同“水電煤”一樣推動第四次工業革命來到我們身邊,但真正惠及所有企業,讓各行業都能加上AI這個內核,仍舊任重而道遠。自2018年初,Google發布Cloud AutoML至今,AutoML成為了微軟、Facebook、AWS、BAT等巨頭爭相布局的重心,Gartner同時也將AutoML看做是AI產業化進程中不可或缺的關鍵要素。AutoML因何成為了巨頭們的“新寵”,它又在推動“AI民主化”和“AI工程化”中充當了什么角色?
AI落地難成共識但產業化之路已日漸清晰
今天,AI為各行各業帶來了效率提升、價值增長,讓所有人都看到了AI的價值和潛力。伴隨著AI技術的日臻成熟,AI正在快速進入“工業化”階段。但人才缺失、實施復雜、周期過長、成果過高等客觀因素,也造成了AI難產的局面。想讓AI真正的釋放價值,或許可以從煤的發展歷程中看出端倪。19世紀,憑借煤炭能源的挖掘,英國迅速創造了一個令世界瞠目結舌的工業社會,一躍成為世界霸主。除了儲煤量大以外,其中最關鍵便是實現了煤產業化。
具體表現為三點:1.提升了應用效率:蒸汽機等高效率工具的發明與普及,讓煤這一能源得以高效、規模化的應用。2.完善的基礎設施:鐵路、運河等的建設,讓煤炭能夠從礦區被運往更具商業價值的產業帶。3.打造產業帶:人才、工具、市場,緊密結合在技術半徑內,形成產業帶,讓高效生產成為可能。正是這些鋪陳,才讓煤得以真正成為工業革命中“動力和文明”(艾默生語)的象征。
如今,AI正有機會像煤一樣,給人類社會帶來天翻地覆的變化,這就讓AI滿足全社會規模化應用的能力,變得格外重要。在這一過程中,同樣少不了“蒸汽機”、“鐵軌”和產業帶。
AutoML讓AI價值躍點
在瓦特改造蒸汽機之前,英國煤礦普遍使用的是紐科門蒸汽機,需要消耗大量的煤來維持運轉,也讓礦區工人們不得不在嚴酷的環境中工作。改造后,新的蒸汽能效提升了四倍之多,從而讓煤進入了高效利用時代,也讓筋疲力盡的體力勞動者們得到了解脫。AutoML的價值與蒸汽機一樣。在最新發布的《AI for Everyone——AutoML 引領AI民主化之路》白皮書中,Gartner將其視為降低門檻、提升效率的利器。
簡單來說,AutoML(自動機器學習)就是可以讓企業或個人不用寫一行代碼,就訓練出一個企業級的機器學習模型的技術。只需要按照說明,把訓練數據都拖進AutoML系統里面,很快一個適用于自身應用的機器學習模型就訓練好了。讓機器學習中最耗時和最難的工作——數據清洗、特征工程,變得輕松不少,甚至無需考慮了解AI復雜的原理。
對于渴望規模化、高效率應用AI的企業來說,這意味著不需要從源頭去設計一個神經網絡或是進行復雜的調參,最大程度地降低了機器學習的編程工作量,節約了AI開發時間;同時也意味著對專業數據科學家和算法工程師的依賴程度也有所降低,緩解與科技巨頭“搶人才”的困擾。在自動駕駛、金融風控、工業制造等多個領域中,使用AutoML搭建的模型效果甚至超越了大多數算法工程師。
于是,我們看到了越多越多的企業和開發者加入到了AI產業化的行列中,以百度為例,其EasyDL已擁有70多萬開發者,覆蓋了20多個場景。更為欣喜的是,我們看到了沒有一點AI甚至是編程背景的人將AI物盡其用:婦產醫院的醫生基于AI獨角獸第四范式的AutoML技術及產品,建立了新生兒體重預測和胎膜早破的預測模型,為產婦生產方案的制定提供更多依據,這在學術界首次證明了大氣壓與胎膜早破之間的緊密相關性,填補了這一領域的空白。
這些案例意味著AI開始進入低門檻、低成本、泛用性的工業生產階段,得以快速落地企業,釋放技術價值。據Gartner的預測,2023年,40%的開發團隊會使用自動化機器學習服務來構建為其應用軟件添加AI功能的模型,而2019年這一比例不到2%。到2025年,AI將使50%的數據科學家活動實現自動化,從而緩解人才嚴重短缺問題。這也是為什么,Gartner 認為AutoML是引領AI民主化,實現“AI for Everyone”的關鍵力量。
鋪設鐵軌:通往產業智能的通衢
AutoML提升了AI的效能,但智能怎么才能夠抵達產業端,卻是一個大問題。因此也吸引了不少巨頭和創業公司爭相布局,它們的存在就像是鐵軌與運河,將源源不斷的技術能量運輸到產業土壤中去。目前來看,AutoML平臺主要分為以下幾大類:
第一種,以谷歌、微軟、亞馬遜、百度等為代表的頭部AI巨頭,具有較強的AI實力,可以提供從算法到流程全自動化的工具支持。
第二種,是一些開源技術平臺或組織。優勢是靈活、開放,比如在谷歌發布AutoML之前,2013年就出現了可以自動選擇模型并選擇超參數的AutoWEKA。
第三種則是一些技術/算法公司,除了AutoML工具之外,還會面向企業提供數據策略、業務咨詢等服務。
那么,它們都在向產業界提供哪些具體能力呢?首先是平臺和工具。比如谷歌推出的Google Cloud AutoML覆蓋了圖像分類,文本分類以及機器翻譯領域,比如用戶只需要上傳圖片到AutoML Vision上,就可以訓練和部署一個計算機視覺模型。今年還展示了能夠自動創建計算機視覺系統NASNet的能力,可以幫助自動駕駛或智能機器人開發。
微軟差不多和谷歌同時期發布了自己的AutoML平臺,涵蓋圖像、視頻、文本和語音等各個領域。國內比較領先的如百度的EasyDL,用戶可以在上面開展圖像分類、物體檢測、圖像分割、文本分類、視頻分類、聲音分類等任務。代表廠商第四范式,打造的自動化機器學習平臺Sage Hypercycle ML,也面向金融、零售、醫療、制造、能源等行業提供了多種封裝好的AutoML算法及全流程開發工具。
其次是服務和定制。近兩年來,AutoML領域也越來越注重定制化服務。比如今年1月,微軟就針對視覺能力打造了自動化平臺Microsoft Custom Vision Services(微軟定制視覺服務)。谷歌也與產業端合作,利用谷歌云的AutoML Vision技術創建了能理解古埃及文字的工具Fabricius,來達到普及AI的效果。國內如第四范式也提出了“AutoML全棧算法”從感知、認知、決策三個關鍵維度幫助企業提升關鍵場景的決策水平,同時針對不同行業、不同技術能力的企業來有的放矢地提供服務。
如果說AutoML平臺和工具降低了AI的應用門檻,加速了“AI民主化”的進程,那么服務導向的出現,則讓人們看到“AI工程化”趨勢的端倪。這一變化背后的原因也很簡單,回到第一次工業革命時期,我們會發現基礎設施的鋪設往往需要因地制宜,以龐大的工程將運河與鐵軌不斷延伸到東海岸。AI落地產業自然也不是一種平臺或工具集就能夠完成的。一方面,許多巨頭云廠商在推出AutoML平臺的同時,也希望企業用戶與自己的開發生態相捆綁,比如谷歌就要求必須在谷歌云上部署相關模型和網絡,這對于無法或無意使用谷歌云的用戶來說就成了限制。
同時,應用AI更是一個千變萬化的復雜工程。要讓毫無機器學習經驗的個人和企業借助AutoML用上AI,需要與產業應用場景的深度適配,同時解決數據收集、數據清理、打通數據孤島等等障礙,才能讓AI在業務端跑起來。這些都需要懂業務的行業人士和算法人員來共同探討、磨合,去建立符合產業需求的技術管道。只有一個充分考慮不同產業地帶客觀環境與具體訴求的“交通網絡”,才能驅動AI正在走到產業那邊去。
靠近價值:AutoML產業帶的興起
對于企業來說,應該如何考量和適時使用AutoML來提升“AI產能”呢?從企業視角出發,我們認為有三個關鍵要素是需要注意的:
1.是否具有AutoML落地的配套服務能力。每個廠商期待的自動化、智能化是不一樣的,企業在選擇AutoML平臺時需要考察其服務能力與背景。
呂俊寬認為,對于企業來說,如何幫助自己提高業務價值是關鍵,但不是每家企業都能像互聯網巨頭一樣能夠讓AI與業務深度耦合,所以需要AI廠商有強大的服務能力支撐企業客戶兌現AI的價值。對于AI企業來說,想要服務好企業,對產業服務的重視會直接決定其技術上的投入程度,對產業迫切需要的能力亦需要快速迭代;同時應當深入了解客戶的業務場景,幫助其提升關鍵的業務指標和表現。有的業務適合上云、有的適合產品化服務,AI規模化應用后如何解決計算成本上升問題,是否需要自建AI系統等等,這些需要在不同選項里找到平衡點。
Gartner的AutoML白皮書也指出,頂尖的AutoML算法相當于AI應用構建的“引擎”。而AI應用的開發是一項非常復雜的精細化工程,涉及諸多環節。假如沒有一套完整的AI開發工具,各個環節就會變成彼此割裂、互不兼容的“孤島”,不僅導致科學家在開發過程中疲于奔命,也會讓AI規模化變成“泡影”。只有打造基于AutoML算法“引擎”的“自動化工廠”,實現全面產品化,才能真正推動AI產業化落地。
擅長于個人C端市場的谷歌在AutoML上的投入程度和研發頻率相對于其他子業務(如DeepMind)就要少的多,更重視極客和工程師思維;國內如百度在推廣EasyDL時,也十分重視對開發者和企業的幫助,和服務體系的打造,支持初中生、中年個體戶、電網企業等零門檻用上AI;第四范式的策略則更加細致,根據不同技術成熟度的企業,提供不同應用的AI產品和方法論,讓AI產品得以更好使用和落地。例如,面對想要快速驗證AI效果、快速落地的客戶,可以選擇Sage HyperCycle ML,某金融企業就用這種方式讓毫無AI模型構建經驗的金融企業在幾小時內完成建模工作;而面對體量大、場景多的客戶,第四范式也可通過先知等平臺化產品,讓客戶自主、規模化、低門檻落地AI應用,同時,也嵌入了相應的AI服務支撐體系。
2.如何以較低的成本得到較好的效果。如果說“AI民主化”是讓更多人了解和感受到AI和AutoML能做什么,那么“AI工程化”則要求AI規模化落地的同時,還能夠帶來更系統性的業務價值。第四范式副總裁、主任科學家涂威威告訴我們,企業在使用AutoML時有三個考量點:業務收益和效果、成本支出、解決問題的范圍,只有這三點都滿足企業端的要求,才能讓AutoML切實有效地幫助AI加速規模化應用進程。比如算法上需要提升效果,給業務帶來實際增長點,讓模型面對各種真實復雜情況都能快速識別,而非只是停留在實驗室階段;
許多企業也會面臨一個問題,就是在線下效果好,而部署到真實環境中,效果大打折扣。這就需要注重線上線下數據一致性的問題,并做出相應的優化;成本方面,AI如何跟現有業務結合、如何部署到環境中去,計算資源怎么解決,都是需要去考慮的。AutoML在幫助AI規模化落地的同時,也帶來了巨大的算力消耗,如果采用業界常用的GPU甚至是TPU,絕大多數的企業都是負擔不起的。因此,為了讓AI更好的規模化,還需要軟硬件協同優化,讓部署AI的成本變成“可負擔”。
3.是否具有擴展性。我們知道,技術產品和架構總是會不斷迭代更新的,如果需要全盤推倒重來,無疑會給企業帶來沒有必要的損失,這也讓很多企業對AutoML等新型生產力工具望而卻步。這就需要AutoML平臺和廠商在一開始就考慮到技術的擴展性并進行應對。
比如百度EasyDL就借助百度大腦的全棧AI能力實現底層技術的全面部署與融合;第四范式通過技術解決模型的自學習問題,讓動態模型可以根據業務變化而進化,進行自動化迭代。同時,第四范式還將AutoML相關架構、技術抽象成了操作系統,這就從底層核心將技術框架穩定下來,讓各項數據和應用可以被標準化管理,后續運維也可以通過系統層來應對變化,從而讓企業可以建立更長期的AI戰略,不會因為技術變化而讓業務受到波動。當企業、技術、平臺等等都匯聚在一起,形成了完整的AutoML產業帶,生態也就開始真正建立起來,最終拉開一個恢弘的產業智能時代大幕。
從這一刻,寫下未來
如果說是煤工業的崛起,帶領人類穿越了漫長的工業童年時代,開始了一個史無前例的時代,那么隨著國家戰略的推動和產業需求的全面爆發,AutoML帶來的產業智能紅利是否會像煤炭一樣,引發一場新的產業革命?AI的產業大考暴露了人才短缺、成本高昂等問題,又推動了AutoML這樣解決方法的產生,由此帶來的AI民主化和工程化浪潮,正在將全社會帶入智能變革的疆域。其中最值得注目的,是中國企業表現出了對科技前所未有的饑餓感,依靠技術來找尋業務增長點,急切地尋找技術場景和落地,這些積極的做法都讓AI的紅利更早、更快地生長在這片土地上。
fqj
-
AI
+關注
關注
87文章
31097瀏覽量
269431 -
機器學習
+關注
關注
66文章
8424瀏覽量
132765
發布評論請先 登錄
相關推薦
評論