張宏江:AI+大數(shù)據(jù)+云=企業(yè)服務(wù)的未來
?
?
首先是人工智能,張宏江博士分享了他在AlphaGoVS李世石期間贏錢的趣事,這場舉世矚目的比賽也讓大眾對AI的能力有了初步的認(rèn)知,“差不多在20年前,人工智能的機(jī)器贏過俄羅斯的國際象棋,但是這20年,人工智能走了非常長的路。”張宏江博士表示這背后其實(shí)是大數(shù)據(jù)、新算法和強(qiáng)計(jì)算的支撐。在大數(shù)據(jù)方面,張宏江拿AlphaGo舉例,它的訓(xùn)練數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過人類大師一輩子的數(shù)據(jù),再加上它900多個(gè)CPU,2800個(gè)GPU的計(jì)算能力,它的段位已經(jīng)非常接近人類的大師了?!斑@是在比賽之前,沒有考慮過其他的因素在里面,它的數(shù)據(jù)已經(jīng)非常領(lǐng)先了?!倍趪逯?,全球數(shù)據(jù)以40%的增長速率增加,沃爾瑪每4小時(shí)會產(chǎn)生2.5PB的數(shù)據(jù)量,推特每天有5億條帖子更新。
關(guān)于AI是否會取代人類,張宏江博士也給出了跟李開復(fù)類似的觀點(diǎn),人工智能的應(yīng)用是有局限的,必須具備大數(shù)據(jù)、邊界清晰、外部反饋、頂尖數(shù)據(jù)科學(xué)家和計(jì)算資源五個(gè)條件。
張宏江認(rèn)為AI+大數(shù)據(jù)的應(yīng)用會成為企業(yè)的標(biāo)配,“過去是分析、現(xiàn)在是預(yù)測、未來是認(rèn)知?!倍贏I和數(shù)據(jù)方面,都離不開云計(jì)算,它已經(jīng)成為IT主流技術(shù),云也成為了成長最快的2B產(chǎn)業(yè)。
在給出AI+大數(shù)據(jù)+云=企業(yè)服務(wù)的未來的結(jié)論后,創(chuàng)業(yè)公司該怎么做?張宏江博士也給出了建議:
AI+大數(shù)據(jù)+云會跟所有新技術(shù)出現(xiàn)后,帶來的商業(yè)機(jī)會稍縱即逝,創(chuàng)業(yè)者需要前瞻性眼光
需要很快的積累起我們的技術(shù)能力、工程能力,產(chǎn)生技術(shù)壁壘
需要有工匠精神,能夠不斷的改善我們的算法和分析能力,為企業(yè)提供更好的服務(wù)
以下為張宏江博士演講實(shí)錄:
我今天講的題目企業(yè)服務(wù)的三個(gè)階段是緊扣的,可以把它叫做3.0+或者是企業(yè)服務(wù)4.0。如果我們回憶一下2016年有什么樣的主題始終貫穿著互聯(lián)網(wǎng)、整個(gè)企業(yè)服務(wù)軟件的市場、整個(gè)IT的市場,一定是三個(gè)主題:人工智能,大數(shù)據(jù)和云計(jì)算。
為什么這么說?
人工智能是我做過很多年的領(lǐng)域,那今天就從人工智能談起,2016年的一件大事是在3月份AlphaGOvs李世石,很多人不知道AI這個(gè)詞是什么,也不知道AI到底有多厲害,但AlphaGo贏了韓國的圍棋大師,這具有里程碑的意義。
差不多在20年前,AI贏過俄羅斯的國際象棋大師,這20年間,人工智能走了非常長的路,在這個(gè)事情發(fā)生以后,很多人都認(rèn)為人工智能將會統(tǒng)治世界。我不知道在座大家在這比賽前有沒有人知道人工智能到底是怎么回事,有沒有人跟你的同事下過賭,到底是機(jī)器贏還是人能贏,我下了賭,而且贏了錢。
這塊有很重要的原因在里面,我為什么認(rèn)為AlphaGo可以戰(zhàn)勝人類的圍棋大師,很重要的是背后的深層支撐,實(shí)際上今天終于有足夠的計(jì)算能力,今天終于有足夠多的數(shù)據(jù),今天有人工智能算法(機(jī)器學(xué)習(xí)算法)。
我尤其要強(qiáng)調(diào)的是在數(shù)據(jù)和算法這塊,人類大師一輩子能下好幾千場真正的高質(zhì)量的比賽,但是AlphaGo在它的有限的生命中間,和人類的6到9段的選手下過1.6萬次,同時(shí)3000萬次的機(jī)器對局,因?yàn)樗旧頉]有所謂的感性的因素,所以自己可以跟自己下,所以這兩個(gè)數(shù)據(jù)使得它的訓(xùn)練數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過人類大師一輩子的數(shù)據(jù)。
再加上它的非常強(qiáng)的計(jì)算資源,900多個(gè)CPU,2800個(gè)GPU這樣的資源,它的段位已經(jīng)非常接近人類的大師了。這是在大師比賽之前,沒有考慮過其他的因素,也就是說它的數(shù)據(jù)量比人類大師領(lǐng)先很多了。
所以真正的在AlphaGo背后隱藏的動(dòng)力,其實(shí)是我們所說的大數(shù)據(jù)和強(qiáng)計(jì)算加上新的算法。這是今年發(fā)生的最熱的一件事情背后真正的原因。
那么我們談到大數(shù)據(jù),在過去的幾年中間談得非常多,也有人發(fā)出大數(shù)據(jù)時(shí)代是不是已經(jīng)過去的疑問,其實(shí)不是,而是剛剛開始,而且隨著人工智能的發(fā)展,大數(shù)據(jù)的應(yīng)用將會越來越廣泛。
過去的幾年間隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,人類的數(shù)據(jù)其實(shí)在爆炸性的增長,根據(jù)IDC的調(diào)查,整個(gè)人類所創(chuàng)造的數(shù)據(jù)大概是4.4Z,到了2020年這個(gè)數(shù)字會再增長10倍,如果你用一個(gè)標(biāo)準(zhǔn)的蘋果的Ipad,里面有128G的內(nèi)存,你把這44個(gè)Z存進(jìn)去的話,可以從地球到月亮來回走9次。
比如說沃爾瑪在2013年每4個(gè)小時(shí)產(chǎn)生的數(shù)據(jù)到了2.5PB,今天推特每天推的文字就5億條,微信一天在朋友圈分享的照片就是10億張,今天中國的存量照片是300億張,但是企業(yè)界的數(shù)據(jù)增長的速度同樣非??臁?br />
我還是用移動(dòng)互聯(lián)網(wǎng)的例子,現(xiàn)在手機(jī)上非常普遍的應(yīng)用就是照片,這種照片越來越多以后,你在手機(jī)上發(fā)現(xiàn)管理照片是個(gè)問題,所以兩年前大部分的手機(jī)都開始出現(xiàn)叫做照片自動(dòng)分類的云服務(wù),包括根據(jù)人臉進(jìn)行分類,當(dāng)你看到這些照片的時(shí)候,你以前只能根據(jù)地點(diǎn)和時(shí)間進(jìn)行分類,今天就可以知道根據(jù)人的面孔,把你的朋友、家人進(jìn)行分類。假如我的手機(jī)上有雷軍的照片,我就點(diǎn)一下他的照片,你發(fā)現(xiàn)所有他出現(xiàn)的照片全部都幫你找出來了,這背后用的技術(shù)是人工智能人臉識別的技術(shù),這個(gè)技術(shù)今天在所有第一線的平臺上都已經(jīng)出現(xiàn)了。
這件事情在AI的歷史上走了幾十年,以我的專利為證,這是我1997年在惠普實(shí)驗(yàn)室申請的專利,這個(gè)專利基本的核心是:當(dāng)照片進(jìn)來以后我做一個(gè)人臉檢測、人臉特征的提取,從而進(jìn)行比對,而且我20年前就已經(jīng)預(yù)測到這個(gè)體系很難在一個(gè)體系上實(shí)現(xiàn),而需要一個(gè)分布的體系,所以它是一個(gè)分布式的數(shù)據(jù)庫系統(tǒng),今天看來這個(gè)東西就是手機(jī)。
這個(gè)專利是在2000年批準(zhǔn)的。但是這件事兒至少在我看到走了20年,20年前這件事兒是非常難做的,除了算法沒有今天這么先進(jìn)之外,更重要的是我們的數(shù)據(jù)不夠。所以以我來看過去20多年,計(jì)算機(jī)對人臉識別的發(fā)展就是一個(gè)數(shù)據(jù)庫和計(jì)算能力的擴(kuò)張。90年代初的時(shí)候你用的訓(xùn)練數(shù)據(jù)就是幾百張、幾十人,到了十年前,已經(jīng)到了幾萬張或者是幾十萬張,我們能夠用的人數(shù)也是到了幾千個(gè),真正到了過去的三五年,計(jì)算機(jī)或者是人工智能開始超過人的數(shù)量,一個(gè)典型的情況就是谷歌和Facebook在2015年年初的時(shí)候開始用大量的數(shù)據(jù),包括著2億張照片,800萬人,因?yàn)橛羞@么多數(shù)據(jù)所以能支撐起非常龐大的深度學(xué)習(xí)的網(wǎng)絡(luò),從而能夠訓(xùn)練出識別準(zhǔn)確率超過99.63%的算法和人臉識別系統(tǒng)。
當(dāng)我們訓(xùn)練數(shù)據(jù)用了260萬張的時(shí)候,識別率大概在76%,用了2.6萬張的時(shí)候,識別率增長了10%,這是沒有經(jīng)過仔細(xì)的調(diào)優(yōu)的情況下你可以看到數(shù)據(jù)對于識別精度的影響,同樣當(dāng)你用到算法的復(fù)雜度和計(jì)算能力之間也一樣,只有當(dāng)計(jì)算能力不斷提高復(fù)雜度和精確度才能支撐起來。我的觀點(diǎn)還是說數(shù)據(jù)和計(jì)算能力是AI背后的主要推動(dòng)力。
在過去的兩年中國企業(yè)在這方面異軍突起,領(lǐng)先了國際市場,也領(lǐng)先了國際的學(xué)術(shù)的領(lǐng)域,這些從微軟研究院衍生出來的這些公司,他們都做到了世界上最好的人臉識別系統(tǒng),原因是他們都和微軟研究院也許,更重要的是今天他們都有大量的數(shù)據(jù),中國人口最多,中國的攝象頭最多,攝象頭密度最高。這一系列的數(shù)據(jù)使得我們能夠做到最好的識別系統(tǒng)。
除了人臉之外,我們知道只要你做了壞事兒,只要在路上任何一個(gè)角落拍了你一張照以后,你基本上插翅難逃了,除了人臉識別以外,AI在什么領(lǐng)域會超過人類,這是我們今天講的核心內(nèi)容,AI已經(jīng)在一系列的領(lǐng)域會替代人工,除了在人臉識別、下棋以外,在翻譯、新聞?dòng)浾叩牟删帲绕涫秦?cái)經(jīng)記者的采編,在行政助理、警察、出租車、股票交易員、會計(jì),包括保姆都會在今后的5到10年內(nèi)很大的程度上被AI所取代。
為什么?你問自己幾個(gè)問題,你可不可以像AlphaGo一樣一天下幾百萬盤旗,人類能不能像特斯拉那樣每天從路上超過20萬輛跑的車上收取數(shù)據(jù),能不能像所有遍布于各個(gè)機(jī)場、各個(gè)火車站的攝象頭那樣見到那么多人。正是因?yàn)檫@些無窮無盡的數(shù)據(jù)使得AI有越來越強(qiáng)的能力,從而他們不光是能夠識別出人,而且比人類聽懂更多的語言。
所以我們也同樣相信這一切也會改變我們今后的企業(yè)服務(wù)的形態(tài)。你會問一個(gè)問題,是不是AI能取代所有的行業(yè)、所有的工種,所有的任務(wù),很重要的一點(diǎn),一定是在有大數(shù)據(jù)的情況下才能做到很好的AI系統(tǒng),一定要有一撥很好的頂尖的科學(xué)家才能把這些數(shù)據(jù)形成很好的體系,從而有很好的算法,也需要有大量的計(jì)算機(jī)的資源。
其實(shí)在這里面我們也知道,無論是計(jì)算機(jī)資源,還是科學(xué)家這些你都能找打到,對于創(chuàng)業(yè)企業(yè)來說,但是大數(shù)據(jù)對創(chuàng)業(yè)企業(yè)是個(gè)挑戰(zhàn),你從哪能夠獲取這么多數(shù)據(jù)。
大家會問一個(gè)問題,到底多少數(shù)據(jù)足夠多?在大數(shù)據(jù)的分析里面,我們從來說沒有太多的數(shù)據(jù),數(shù)據(jù)從來不夠,因?yàn)楹苤匾?。用傳統(tǒng)AI的方式,性能也是隨著數(shù)據(jù)的增加而不斷的增加的,用最新的算法增加的數(shù)會更快,或者是飽和的速度會更慢。這是很重要的一點(diǎn),當(dāng)你沒有數(shù)據(jù)的時(shí)候,用的最新的算法你的性能也只會在這兒,不會在這兒,尤其是我們今天碰到的越來越復(fù)雜的場景,你所需要的數(shù)據(jù)會越來越多。重要的是說當(dāng)你的覆蓋度、數(shù)據(jù)精度這兩點(diǎn)達(dá)到一定程度以后,對于傳統(tǒng)模型的依賴才會減少,缺少數(shù)據(jù)的時(shí)候才會做出一個(gè)模型來。
今天我們看大數(shù)據(jù)對于企業(yè)有什么影響,我想用美國一個(gè)調(diào)查的數(shù)據(jù)舉例,大數(shù)據(jù)的應(yīng)用已經(jīng)非常廣泛了,60%的IT公司里面,大數(shù)據(jù)已經(jīng)成為日常中間開始使用,在商業(yè)和專業(yè)服務(wù)的公司里面也有將近一半的公司在用,金融47%的公司,最傳統(tǒng)的制造業(yè)和零售業(yè)這個(gè)數(shù)字也在逐漸的上升,所以我們知道今天在我們的企業(yè)服務(wù)行業(yè)里面,數(shù)據(jù)已經(jīng)變成下一個(gè)新的宗教。
過去傳統(tǒng)對大數(shù)據(jù)的依賴使用它來做統(tǒng)計(jì),我們知道過去發(fā)生了什么,我們很快用它來做分析,我們想知道這是為什么發(fā)生,今天更多大家在用到預(yù)測,未來會發(fā)生什么,未來我想我們會用到它,最大的會是認(rèn)知,我們對于任何一個(gè)商業(yè)決策的反饋,從簡單的知識到智能的演化過程,這個(gè)是今天大數(shù)據(jù)開始在企業(yè)服務(wù)里面發(fā)揮作用的一個(gè)核心原因。
當(dāng)你有了大數(shù)據(jù),有了先進(jìn)的算法,像一開始演示的,在手機(jī)上做人臉識別,你可能認(rèn)為手機(jī)本身有如此強(qiáng)大的功能,但是我想告訴你所有的計(jì)算都是在云端進(jìn)行的,你的照片拍完以后是把它送到云端去,在云端進(jìn)行了人臉的檢測和識別,在云端搜索了聯(lián)系人的數(shù)據(jù)庫,從而返回到照片的人臉的信息,也就是說如果沒有后端,沒有云端的大規(guī)模的存儲、大規(guī)模的計(jì)算、大規(guī)模的數(shù)據(jù)分析一系列的計(jì)算的功能,今天做不到我們說的智能。
云計(jì)算已經(jīng)成為主流技術(shù),今天已經(jīng)不像三年前,你談云計(jì)算別人會認(rèn)為你談在云里霧里是在忽悠,今天云計(jì)算已經(jīng)成為IT真正的主流,今天創(chuàng)辦一家公司,你需要大量的計(jì)算資源的時(shí)候,你想到的不是自己再去并購一個(gè)數(shù)據(jù)中心,再去買大量的服務(wù)器,而是利用今天已經(jīng)有的大量的云服務(wù)的提供商他們所能提供的云計(jì)算。
中國的云計(jì)算能力這個(gè)市場是非常廣大的,潛力是無限的,因?yàn)槲以俜窒硪粋€(gè)數(shù)據(jù),IDC在去年年底做了中國公有云市場的報(bào)告,中國公有云市場,包括SaaS、IaaS,所有的公有云的市場收入的總量只占美國同類收入總量的3%多。但
但中國的互聯(lián)網(wǎng)市場哪個(gè)領(lǐng)域我們只是美國的3%多?要么是跟美國同樣的檔次,要么比美國還要大。就算再小一點(diǎn),我們至少是美國的一半,當(dāng)你看到一個(gè)迅速成長的市場,今天市場的整個(gè)規(guī)模只有美國的3%的時(shí)候,你知道這個(gè)市場有多大,所以中國的云市場潛力無限。
最后我想總結(jié)一下,在我們談企業(yè)服務(wù)的時(shí)候,尤其在談新時(shí)代的企業(yè)服務(wù),有三點(diǎn)我們要進(jìn)行充分的考慮:
首先人工智能、大數(shù)據(jù)和云計(jì)算能力,會像以前所有的技術(shù)一樣,任何一個(gè)新的技術(shù)出現(xiàn),它的機(jī)會稍縱即逝,對于AI、大數(shù)據(jù)、云這樣的現(xiàn)象級的技術(shù)的爆發(fā),需要的是有非常前瞻的眼光,順勢而為的能力;需要很快的積累起我們的技術(shù)能力、工程能力;我們也需要有工匠精神,能夠不斷的改善我們的算法和分析能力,從而我們能夠真正的為企業(yè)提供最好的新時(shí)代的企業(yè)服務(wù)。謝謝大家!
?
評論
查看更多