2016年機(jī)器學(xué)習(xí)有三大趨勢。其中,Gartner分析認(rèn)為,算法將形成一個(gè)全球性的交易市場,就像當(dāng)年的App經(jīng)濟(jì),催生出全新一代的專業(yè)技術(shù)初創(chuàng)企業(yè),并且革新機(jī)器與機(jī)器之間的交互方式;算法是創(chuàng)造智能應(yīng)用的基石。同時(shí),更多的數(shù)據(jù)將生成更好的模型和用戶體驗(yàn),進(jìn)而吸引更多的用戶以及更多的數(shù)據(jù),而這將導(dǎo)致儲(chǔ)存和計(jì)算數(shù)據(jù)的成本持續(xù)降低。
上個(gè)月,在被視為美國人工智能發(fā)展另一片新天地的西雅圖,Madrona風(fēng)險(xiǎn)投資集團(tuán)舉辦了一場機(jī)器學(xué)習(xí)與人工智能峰會(huì)。100 多個(gè)專家、研究者和記者匯聚一堂,討論人工智能的未來、機(jī)器學(xué)習(xí)的趨勢,以及如何設(shè)計(jì)更智能的應(yīng)用程序。
算法公司 Algorithmia 的 Matt Kiser 參加本次峰會(huì)后總結(jié),如今,每家公司都成了數(shù)據(jù)公司,能夠在云中使用機(jī)器學(xué)習(xí)來大規(guī)模地部署智能應(yīng)用,這得益于機(jī)器學(xué)習(xí)的三大發(fā)展趨勢。
“每個(gè)成功的新應(yīng)用程序都將是智能應(yīng)用,”Madrona 風(fēng)險(xiǎn)投資集團(tuán)的投資合伙人 Somasegar說。“智能模塊和學(xué)習(xí)功能將成為應(yīng)用的大腦。”Somasegar曾是微軟副總裁,負(fù)責(zé)軟件開發(fā)者部門,2015年離職,加入Madrona。
下面就來看看,機(jī)器學(xué)習(xí)的這三大趨勢將如何讓應(yīng)用變得更智能。
算法將形成經(jīng)濟(jì)。
Gartner副總裁兼研究員Peter Sondergaard說,“從根本上來說,數(shù)據(jù)是不會(huì)說話的,真正的價(jià)值在算法,算法決定行動(dòng)”。
Gartner副總裁:算法才是真正價(jià)值所在
如果你不去利用數(shù)據(jù),世界上的數(shù)據(jù)就不會(huì)有用。算法其實(shí)指的是如何在業(yè)務(wù)過程中有效拓展人為管理,利用數(shù)據(jù)。
“世界上所有大規(guī)模的東西都將被數(shù)據(jù)和算法所管理,”微軟機(jī)器學(xué)習(xí)和數(shù)據(jù)集團(tuán)全球副總裁 Joseph Sirosh 說。在不遠(yuǎn)的未來,“所有業(yè)務(wù)都將成為算法業(yè)務(wù)”。
而這,將催生出“算法經(jīng)濟(jì)”:算法交易將會(huì)形成一個(gè)全球性的市場,世界各地的研究人員、工程師都能在這個(gè)市場上創(chuàng)造、分享乃至合成大規(guī)模的新算法。屆時(shí),算法也將變得像集裝箱一樣,能夠任意組和擴(kuò)展,從而搭建適用于不同應(yīng)用的架構(gòu)。
也就是說,多個(gè)機(jī)器學(xué)習(xí)算法可以結(jié)合起來成為更強(qiáng)大的算法,從而更好地分析數(shù)據(jù),充分發(fā)掘數(shù)據(jù)里的價(jià)值。
在算法經(jīng)濟(jì)中,前沿的技術(shù)項(xiàng)目,無論是先進(jìn)的智能助理,還是能夠自動(dòng)計(jì)算庫存的無人機(jī),最終都將落實(shí)成為實(shí)實(shí)在在的代碼,供人使用和交易。
上圖的智能應(yīng)用列表揭示了智能應(yīng)用的抽象層級(jí):從最下一層起,先是數(shù)據(jù)基礎(chǔ)設(shè)置,接下來是數(shù)據(jù)收集和準(zhǔn)備,再來是建造模塊和服務(wù),第4層是交互界面,最后才是消費(fèi)者直接用到的服務(wù)。而要實(shí)現(xiàn)上圖中的智能應(yīng)用,無論是那一層,都離不開算法。
算法是創(chuàng)造智能應(yīng)用的基石。
至于數(shù)據(jù)國際人工智能學(xué)會(huì)Fellow、香港科技大學(xué)冠名講座教授楊強(qiáng)就試圖用遷移學(xué)習(xí)讓計(jì)算機(jī)擺脫對大數(shù)據(jù)的嚴(yán)重依賴,從而讓人工智能不再只是“富人的游戲”。也就是說,如果算法足夠強(qiáng)大,大數(shù)據(jù)并非必須。
“算法市場類似于App 商店,后者創(chuàng)造了所謂的App經(jīng)濟(jì)。”Gartner 的研究總監(jiān) Alexander Linden 說。“App經(jīng)濟(jì)的本質(zhì)是,讓各種各樣的個(gè)人能夠在全球范圍內(nèi)發(fā)行和銷售軟件,而不需要用自己的想法去說服投資人或建立自己的銷售、市場和分發(fā)渠道。”
Gartner曾發(fā)表報(bào)告,對算法經(jīng)濟(jì)可能帶來的市場影響做出評估。Gartner認(rèn)為,算法經(jīng)濟(jì)將無可避免地創(chuàng)造一個(gè)全新的市場,人們可以對各種算法進(jìn)行買賣,為當(dāng)下的公司匯聚大量的額外收入,并催生出全新一代的專業(yè)技術(shù)初創(chuàng)企業(yè)。
想象這樣一個(gè)市場:數(shù)十億的算法都是可以買賣的,每一個(gè)算法代表的是一種軟件代碼,能解決一個(gè)或多個(gè)技術(shù)難題,或者從物聯(lián)網(wǎng)的指數(shù)級(jí)增長中創(chuàng)造一個(gè)新的機(jī)會(huì)。
正如App變革了人類與機(jī)器的交互方式一樣,我們將會(huì)看到,算法經(jīng)濟(jì)將會(huì)促進(jìn)下一代機(jī)器對機(jī)器互動(dòng)演進(jìn)的巨大飛躍。
人們將會(huì)通過產(chǎn)品使用的算法來評價(jià)它的性能好壞。企業(yè)的競爭力也不僅僅在于大數(shù)據(jù),還要有能夠把數(shù)據(jù)轉(zhuǎn)換為實(shí)際應(yīng)用的算法。因此,CEO應(yīng)該關(guān)注公司有產(chǎn)權(quán)的算法,而不僅僅是大數(shù)據(jù)。
其中,最好的例證莫過于 Mobileye,這家市值已經(jīng)超過百億的以色列算法公司在2014年8月IPO時(shí),首日漲幅接近50%。此前的智駕深談中,新智元也提到過,截至2015年底,Mobileye在全球有超過1000萬裝機(jī)量,覆蓋超過20家車企的273款車型。集成度極高的解決方案,快速的市場推進(jìn)速度,無一不讓所有人覺得眼前一亮,這些成功的背后,都是因?yàn)槠涠嗄攴e累的強(qiáng)大算法在支撐。
Mobileye 為特斯拉提供的自動(dòng)駕駛系統(tǒng)是全球首個(gè)實(shí)際上路的DNN。
5月,被英特爾收購的初創(chuàng)公司 Itseez,其核心技術(shù)是一套名叫“駕駛員高級(jí)助理系統(tǒng)”的視覺算法,能讓汽車硬件識(shí)別出行人和交通標(biāo)志,探測汽車何時(shí)偏離車道,并對可能發(fā)生的碰撞提出警報(bào)。這類技術(shù)目前已應(yīng)用于高端汽車;將來當(dāng)自動(dòng)駕駛汽車實(shí)際上路時(shí),該技術(shù)或?qū)⒆兊酶又匾?/p>
差不多在同一時(shí)間,ARM 以 3.5 億美元收購了英國計(jì)算視覺公司 Apical。Apical 是全球領(lǐng)先的圖像和嵌入式計(jì)算視覺公司,擁有多項(xiàng)計(jì)算視覺 IP 模塊。不僅如此,現(xiàn)在全球有超過 15 億 臺(tái)智能手機(jī)和 3 億臺(tái)網(wǎng)絡(luò)攝像機(jī)、數(shù)碼靜態(tài)相機(jī)和平板使用 Apical 的圖像產(chǎn)品。像這樣既有數(shù)據(jù)又有算法的公司,ARM 以 3.5 億美元收購用以鞏固計(jì)算視覺和圖像處理技術(shù)壁壘,也就不令人意外了。
Magic Pony 的算法看了左邊的圖片后,自動(dòng)生成右邊的圖片。
還有剛剛過去的熱潮,Twitter 據(jù)稱用 1.5 億美元收購只有十幾個(gè)員工的英國初創(chuàng)公司 Magic Pony。根據(jù)英國專利局網(wǎng)頁,這家機(jī)器學(xué)習(xí)算法公司在圖像和視頻處理方面擁有 15 項(xiàng)專利(Magic Pony 官網(wǎng)稱擁有超過 20 項(xiàng))。其中,最有名的算法能夠利用圖像中原本沒有的信息,提高圖像的分辨率,這些新的數(shù)據(jù)是算法從以前看過的、與待處理圖像類似的大量圖像中生成的,這個(gè)算法的工作原理跟人眼類似。
數(shù)據(jù)飛輪效應(yīng)
數(shù)據(jù)和云存儲(chǔ)遵從摩爾定律:每過兩年,世界上的數(shù)據(jù)量就會(huì)翻倍,同時(shí)用于存儲(chǔ)這些數(shù)據(jù)的成本則會(huì)以同樣的速度下降。這些大量的數(shù)據(jù)使得人們可以創(chuàng)造出更多的產(chǎn)品特征和更好的機(jī)器學(xué)習(xí)模型。
Somasegar 用“數(shù)據(jù)飛輪效應(yīng)”來形容這個(gè)情形:在智能應(yīng)用的世界里,數(shù)據(jù)為王,而那些能夠產(chǎn)生出最高質(zhì)量數(shù)據(jù)的服務(wù)將獲得壓倒性的優(yōu)勢更多的數(shù)據(jù)生成更好的模型、更好的用戶體驗(yàn),進(jìn)而吸引更多的用戶以及更多的數(shù)據(jù)。換句話說,也就是形成一個(gè)閉環(huán)和正反潰
例如,Tesla 收集了 7.8 億英里的駕駛數(shù)據(jù),每過 10 小時(shí)里程數(shù)就會(huì)遞增 100 萬英里。
這些數(shù)據(jù)被喂給了 Telsa 的輔助駕駛程序 Autopilot,它使用超聲傳感器、雷達(dá)和攝像機(jī)以在不與人互動(dòng)的情況下進(jìn)行駕駛和改變車道和避免碰撞。最終,這些數(shù)據(jù)將成為他們計(jì)劃在 2018 年發(fā)布的自動(dòng)駕駛汽車的基矗
谷歌的自動(dòng)駕駛項(xiàng)目只積累了 150 萬英里的駕駛數(shù)據(jù)。與之相比,Telsa 的數(shù)據(jù)飛輪效應(yīng)更加強(qiáng)勁有力。
云端人工智能
一家公司要想發(fā)現(xiàn)其業(yè)務(wù)中的洞見,使用算法機(jī)器智能從其數(shù)據(jù)中進(jìn)行迭代學(xué)習(xí)是唯一可擴(kuò)展的方式。要知道,這一直以來都成本高昂,也不一定有產(chǎn)出。
Sirosh 說,今天的數(shù)據(jù)科學(xué)就像40年前的裁縫一樣費(fèi)時(shí)費(fèi)力。
例如,一家公司需要首先收集定制數(shù)據(jù),雇傭一個(gè)數(shù)據(jù)科學(xué)家團(tuán)隊(duì),持續(xù)地開發(fā)并優(yōu)化模型,以跟上快速改變和增長的數(shù)據(jù)的步伐而這只是工作的開始。
現(xiàn)在,當(dāng)擁有更多的數(shù)據(jù),而存儲(chǔ)數(shù)據(jù)的成本也下降之后,機(jī)器學(xué)習(xí)開始向云端遷移;在云上,可擴(kuò)展的網(wǎng)絡(luò)服務(wù)是可以隨叫隨用的 API。數(shù)據(jù)科學(xué)家不再需要管理基礎(chǔ)設(shè)施或?qū)崿F(xiàn)自定義代碼。系統(tǒng)將為他們實(shí)現(xiàn)這些功能,實(shí)時(shí)產(chǎn)生新的模型,并提供更快、更準(zhǔn)確的結(jié)果。
數(shù)據(jù)顯示,谷歌從2012年到2015年,使用深度學(xué)習(xí)技術(shù)的軟件數(shù)量每年都在急劇增長,2012年只有100個(gè)左右,到了2015年第四季度前,已經(jīng)有近2700個(gè)。
“當(dāng)用來建造和部署機(jī)器學(xué)習(xí)模型的成本大大變小,當(dāng)你可以 ‘批量生產(chǎn)’ 它時(shí),我們就可以從云端廣泛地獲取機(jī)器學(xué)習(xí)所需的數(shù)據(jù)了。”
正在涌現(xiàn)的機(jī)器智能平臺(tái)可以以“模型作為服務(wù)”的方式,托管預(yù)訓(xùn)練過的機(jī)器學(xué)習(xí)模型,從而令企業(yè)能夠更容易地開啟機(jī)器學(xué)習(xí),快速將其應(yīng)用從原型轉(zhuǎn)化成產(chǎn)品。
“當(dāng)企業(yè)們采用了微服務(wù)(microservice)發(fā)展范式后,接入并使用不同的機(jī)器學(xué)習(xí)模型和服務(wù)以提供特定功能的能力將變得越來越有價(jià)值”,Somasegar 說。
當(dāng)諸如Scikit-Learn, NLTK,Numpy, Caffe, TensorFlow, Theano, or Torch 等開源機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架在云端運(yùn)行時(shí),企業(yè)將能夠方便地利用預(yù)訓(xùn)練過的托管模型來標(biāo)記圖片、推薦產(chǎn)品和進(jìn)行一般的自然語言處理任務(wù)。
機(jī)器學(xué)習(xí)趨勢總結(jié)
“我們的世界觀是,每家企業(yè)現(xiàn)在都是一家數(shù)據(jù)企業(yè),而每個(gè)應(yīng)用都是智能應(yīng)用,”Somasegar 說,“企業(yè)怎樣才能從海量數(shù)據(jù)中獲得洞見,并從中學(xué)習(xí)?這是世界上的每家公司都需要了解的。”
當(dāng)數(shù)據(jù)飛輪開始運(yùn)轉(zhuǎn),用來獲娶儲(chǔ)存和計(jì)算數(shù)據(jù)的成本將持續(xù)下降。
這創(chuàng)造出了算法經(jīng)濟(jì),其中的機(jī)器智能基石將在云端實(shí)現(xiàn)。這些預(yù)訓(xùn)練的、托管的機(jī)器學(xué)習(xí)模型將使每家 App 都能夠大規(guī)模利用算法智能。
數(shù)據(jù)飛輪、算法經(jīng)濟(jì)和云托管智能的融合將意味著:
每家公司都可以成為數(shù)據(jù)公司;
每家公司都可以獲取算法智能。
評論
查看更多