人工智能正以前所未有的態勢洶涌而來,一方面是風投和創業創新,都把人工智能當做了下一個尚未被開墾的寶地;另一方面是應用,比起概念盛行的階段,現在的無人車、AlphaGo等已經把人工智能技術帶到了“看得到摸得著”的境地。
那人工智能到底是什么?這個領域包含哪些要素?它將如何改變當今世界,又面臨哪些問題和瓶頸?對于人工智能的應用和商業化,哪些領域會最快顯現效果出來?
在清華大學“清華學堂計算機科學實驗班”題為《人工智能的黃金時代》的演講中,創新工場董事長兼CEO李開復對“人工智能”進行了深入淺出的講解分析。
在講解中,這位機器學習領域的博士對人工智能追古溯源、引用知名商業案例,并結合Google等巨頭的布局和調整,為受眾勾勒了人工智能的框架、要素、商用領域和條件,并且強調了人工智能當前的瓶頸和對當前互聯網市場的影響。
值得一提的是,這位中國最知名的創業導師還給有志于在人工智能領域進行創業的創業者們提供了建議。
在這篇長達萬字的演講實錄里,關于人工智能、深度學習、Google的野心等,首次“科普式”地得以展現。
以下是李開復演講實錄:
謝謝大家!非常高興有這個機會又一次來到清華,尤其是在我最尊敬的姚期智教授的邀請和介紹之下。姚教授的姚班在全球已經享有盛名,我從Google到創新工場,看到有非常多成功的工程師,都是在姚老師的培養之下成為了計算機界的頂尖人才。
在講人工智能之前,我想向大家介紹一下我的一些可能不太為人熟知的背景:其實在進入幾個國際大公司任職之前,也就是在30多年前,我就進入了人工智能領域。我是在1980年首先做的自然語言處理,1982年做的計算機視覺,1983做的語音識別,1985年做的人機對弈,1996年做的VR/AR……但我們現在知道,那時候我的這些選擇基本上都是非?!霸愀忮e誤”的職業選擇,因為每一件事情,我都是在它的黃金時代之前、白銀時代之前,甚至破銅爛鐵都不是的時代就涉足了。從這個事情上,其實我也想說,做計算機研究這個領域,本身的素質能力當然都非常重要,但是還要在正確的時候選擇正確的事情。我在錯誤的時候太過狂熱的跳進了人工智能領域,與此同時,過去的三四十年人工智能也是起起伏伏,一下很火,一下又跌入谷底。
但現在是人工智能的黃金時代??赡芨魑灰矔?,憑什么這次說是人工智能的黃金時代?為了說明這個問題,這次我肯定不只用一些理論來說服大家,畢竟我過去也做了這么多“錯誤的選擇”——我今天還帶一些實際的數據來跟大家分享為什么我對今天的人工智能充滿信心。人工智能有很多分支,其中之一是機器學習,機器學習里面還有一個分支是深度學習,今天我更多的會用深度學習作為案例。
人工智能是一種工具
最近人工智能成為全球熱門新聞話題,很多是因為大家看到AlphaGo在幾個月前擊敗了李世石,最近在網上還傳出年底之前它要挑戰柯杰的消息。但在這個新聞的熱度之下,有一點讓我覺得很可惜:大家對這個話題討論的重心都放在了人工智能是不是在模仿人腦,“奇點”是否即將來臨這樣的問題上,卻沒有真正關注人工智能對我們的現實影響。
“奇點”認為未來機器將有各種的智能、人類必須做一些事情來保護自己。我們在座的沒有任何一個人能夠證明或否定“奇點”,但就我個人而言,我認為人工智能要取代人還是一個非常遙遠的事情。我覺得我們需要更關注的事情是人工智能是今天能夠拿來用的工具,它能幫助人類解決問題,能取代重復性的工作,能創造商業價值。正因為這個理由,我認為我們今天進入了人工智能的黃金時代。
隨便舉幾個例子:今天很多的工作以后大部分都會消失,比如說翻譯,雖然現在還不是做的那么完美,但是每年進步的都很快,再過幾年人工的翻譯可能就會非常難找到工作了。記者也同樣如此,如今90%美聯社的文章都是用機器來寫的。幾乎所有思考模式可以被理性推算的工作崗位,在有足夠數據支撐的時候,都會被取代。有人說十年之內一半的工作會消失,有人說十五年之內一半的工作會消失,我覺得這些都是合理的揣測。
我想在座大部分都會相信這個理論,而如果你對此還有懷疑,你可以想想,為什么AlphaGo這么厲害?就是因為它可以動用到幾千臺機器每天和自己對弈上萬盤的圍棋,而這人是做不到的;以后為什么自動駕駛會這么厲害呢?因為它可以用它的各種的sensor在路上搜集數據,這不是任何一個司機可以匹敵的。所以這些都是一些必然的過程。
何為人工智能
到底什么是人工智能呢?我覺得大概來說可能是有幾個部分。
首先是感知,感知就是包括視覺、語音、語言;然后是決策,剛剛講的做一些預測,做一些判斷,這些是決策層面的;那當然如果你要做一套完整的系統,就像機器人或是自動駕駛,它會需要一個反饋。
什么是人工智能?
在這些例子上可以看到,感知可能更多的是幫助識別圖里面一個嬰兒在沙發上抱著泰迪熊這種。在推薦上面,我舉的例子是一個用Google now通過你過去做的一些事情推測你下面要做什么,在最下面的例子你會看到有一個無人駕駛的汽車,它有各種的sensor,它捕捉的信息可以用來做最后的決策,比如怎么去操作方向盤、油門、剎車等等的。其實這三件事情的總和就是今天所被歸納為的人工智能。
再從博弈、感知決策以及反饋四個方面回顧一下人工智能的發展歷程。博弈今天就不講太多了,但是基本上我可以看到從我在大學做的Othello到Checkers再到DeepBlue chess,經過很長的一段時間,終于有了今天AlphaGo打敗了圍棋世界冠軍。我們從中可以看到,這是一條長達三十多年的路程。
人工智能的各階段發展里程碑事件
在感知方面,從我的博士論文發表到Nuance成為一個頂尖的公司,從中國誕生了科大訊飛到美國的Deep Face、中國的Face++等等做得越來越好的企業,這些年也有很多的進步。還有一些很特殊的例子,比如最近看到一些搞笑的比較Microsoft Tay在Twitter上開始跟人家交流一下子就講了一堆不堪的話,就被Microsoft撤回了,所以這里有很多的成功例子,也有很多有趣的事件。
決策方面,從早期Microsoft Office里的工具到Google廣告的推薦,然后到金融行業的很多智能決策公司的出現,進步迅速。Google auto mail可能大家還沒有看過,但是如果你現在還在用gamil的話,會發現你有時候收到email,Google會跳出來問要不要發回復,有時候它連回復都幫你寫好了,而且寫的很精確。這也是人工智能的體現??赡芤院笪覀冎v話都不用,助理能幫我們搞定,人工智能的助理肯定也是一個方向。
最后是反饋,從CMU Boss早期的無人駕駛到Amazon用Kiva推動物流,再到最近的Pepper、Google car,我們可以看到這個領域過去三四年特別的熱,有很多看起來商業化已經做的非常好。
科普深度學習
在這里,我要稍微深度講一下深度學習。
深度學習是一種神經網絡,與但與之前的相比,它的特點是使用了多層網絡,能夠學習抽象概念,同時融入自我學習,而且收斂相對快速。收斂快速可能是一種技巧,不見得是一個理論,但是有一批人通過它解決了很多重要的問題。
簡單的來說,如果我們有很多笑臉,然后我們把笑臉的像素輸入到一個神經網絡里面去,最后你那兒希望讓機器能識別這是姚明,那是馬云,但是因為你這個深度學習的網絡很深,要一次性學會這么多也會比較困難,所以就需要用到一個比較快速收斂的技巧——自我學習。通過自我學習,機器會逐步從大量的樣本中逐層抽象出相關的概念,然后做出理解,最終做出判斷和決策。
比如它可以有好幾層的nodes和connection,經過這些nodes和connection,它在每一個層次會感知到不同的抽象特征,且一層比一層更為高級。這些都是通過自我學習實現的,而不是人教的。經過自我學習,從一個臉輸進去再從同樣的一個臉輸出來,它就從里面抽象的學習到了一個人的臉重要特征。
深度學習的分層無監督訓練
經過這個學習之后,我再去做監督訓練,看機器是否能夠識別他們,如果不能,就在訓練之后做微調。例如,如果我輸入了馬云的臉,出來的卻是王寶強,那訓練系統就會告訴你的網絡說這個是錯誤的:這不是王寶強,這是馬云。那接下來就是要進行微調,以便于下一次機器看到這個臉時,能識別出是馬云的概率高一些,出來王寶強的概率低一些。
分層無監督訓練
但是這么一調也不能調的太過火了,要不然就會有overtraining的問題,我們就對整個數學公式做一點微調,用大量的數據,不斷重復的去教它,經過不斷微調,那么它就很可能在多次之后降低識別錯誤。
其實這一整套理論在二三十年前就已經有了,我在做我博士論文的時候,很多我的同事就在做訓練神經網絡的工作。
深度學習在最初的時候訓練速度特別特別慢,所以比較難進入工業級別或者是應用級別,比如,你的手機是做不來這個的,因為它的速度實在太慢了。但經過這么多年,我們的計算機變的越來越快,另外也有了更多取巧的訓練和識別做法,深度學習的應用可能性也發生了變化,它能被應用的領域越來越寬。多年前,我過早的進入了這一領域,但是現在,人工智能大規模應用的時機已經到了。
憑什么這么說?一個很簡單的評估標準就是,我們的深度學習或者是任何的機器學習,它是不是超越人類的能力表現,如果超越的話,可能很多應用就會產生。比如在機場,如果機器識別人臉的準確度超過人,那么我們那些邊防的人就可能不需要那么多。這并不是說機器不會犯錯,而是說既然人不能比機器做的更好,那我不妨就用機器取代。
深度學習的應用領域
在過去的五年,深度學習的準確度從75%多提升到了97%左右,而人的表現準確率大概是95%。從95%到97%聽起來只進步了2%,但實際上是把錯誤率降低了40%,這是很大的進步。如果這種進步持續,未來人工智能必然會超過人類的表現,同時也將可以進入一些可應用的領域。這就是今天我講人工智能進入黃金時代的證據:在很多領域,也包括我們在face++做的人臉識別,包括了Apple、Google,科大訊飛的語音識別,它們的認知水平將在未來幾年的時間內超過人類,而一旦超過人類,應用就會快速的增加。
深度學習的應用領域舉例
深度學習首先可以應用于識別,包括人臉識別和語音識別等,這些可以用于安防,安檢等。
人臉語音的數據來之不易,但是BI,商業的流程、互聯網的數據卻非常豐富。Google、百度很早就已經在搜索,在廣告以及推薦系統里面充分使用了類機器學習技術,解決該推薦什么商品,一個商品怎么定價,在什么位置會賣的最多,應該把這樣的產品賣給誰等問題。這一類的推銷可以直接產生經濟價值,而社交媒體營銷,整個互聯網廣告,這每一個領域都是幾十億,幾百億甚至更大的市場。
將智能用于炒股其實也是一個不錯的選擇。在國內在國外,很多人都在做這方面創業的工作。利用智能,我可以隨時來算一籃子股票和期貨應該如何對沖,以尋求最大的利潤。頂尖金融分析師也會做這個,但是他不可能把所有的股票的排列組合都考慮一遍,但是機器可以二十四小時不睡覺,每天都在算怎么能賺最多的錢。除此之外,deep learning深度學習的技術可以把各種的因素都融合進來,比如這個公司的高管有沒有變動,今天出了什么新聞,行業里還有沒有什么變動……甚至你可以對一個智能系統說如果明天巴西發生了地震,什么股票該被購買,甚至你可以說發生了地震不要問我,你直接去買它就可以了。
銀行保險方面,比如說貸款該不該審批,則無論是銀行的貸款,還是P2P的貸款,都可以通過機器來判斷,而且數據未必要來自銀行內部。
醫學方面,因為我自己生過病,也深深的受過這方面的痛苦,我也感覺到在今天的醫生的判斷真的不是最完善的。一方面醫生有好有壞,頂尖的醫生是非常少的;第二方面比如在癌癥方面,它每一年都有新的藥出來,那每個醫生每天忙著看病人,就不見得有時間去研究這些藥物,那些藥物也不是每個國家都可以使用的。還有就是每一個人,他的各種特質,不見得就適合用這個藥。這些其實都是可以用機器學習來做出來的。
前一陣我在美國碰到了一些科學家,他們正在用機器學習的方法來發明新藥。我們的科學研究方面當然要有聰明的頭腦和很好的實驗,但是其中有一個很關鍵的部分,就要是一定的程度去排列組合:試很多東西,對小白鼠先試試這個有沒有用,再試試看那個有沒有用,然后再在猿猴身上實驗,再進行人體實驗。在以前,這整個過程都是由人腦完成,但是這個交給機器來做也許會更精準。甚至有一家公司它養了非常多的白老鼠,他里面所有的實驗都是通過機器學習精準進行:每天白老鼠活了幾只,死了幾只,什么藥可以進到下一步……這些都是靠機器學習加上非常精密的系統來做。
我們發明的很多新的材料,都不是靠純粹的科學方法推出來的,也是去試一試,把這個碰到那個,就產生了有很特殊效應的材料。這些知識都可以輸入我們的信息學習系統,通過它我們可以幫助發明新的事物。
在教育方面也有應用。在學習的過程中,如果基礎沒有打好,下一個層次根本學不下去。智能化的教育系統會識別你的學習水平,然后根據你的水平確定學習內容。比如,你的乘法沒有學好,機器就不可能讓你去學除法。
當然學習外語也是很好的例子,我們今天的語音識別做的這么好,為什么我們學外語還是一定要找外教,為什么語音識別不能再上一層樓呢?所以,當你的技術一提高了,語音識別應用就不會只是我的講話進去然后文字出來,它還有可能用在教育領域。
在這么多機會之下,這個人工智能會重塑億萬級別的領域。當然這個不是明天就會發生,因為我覺得人工智能在很多方面還是相當大的欠缺……
人工智能將重塑億萬級別的領域
人工智能會重塑很多億萬級別的領域。當然這個不是明天就會發生,因為今天我們在很多相關方面仍存在相當大的欠缺。
比如,在我們的計算架構上面,現在還是需要時間去做算法的改進提升,需要去研究如何部署云端架構,另外深度學習用時仍太長,這些還都是需要探索的內容,而且并沒有一個標準化的答案。
另外,算法框架也非常重要。我們可以看到有一些重要技術的推進,實際上是因為有了開源或者API或者標準的出現,但現在仍有很多方面還沒有出現相關標準。當然我們知道Google的TensorFlow等提供了一些開源的方法,但是其實他們還沒有真正的平臺化,比如你把TensorFlow丟給一個沒學過機器學習的人,哪怕是清華大學頂尖的計算機系學生,他也很難用其創造價值。如果清華的學生都不能,那它的普及性就有問題了。
為什么iOS、安卓能夠做的很好,就是因為它產生了平臺化效應,使得很多人能夠比較容易的介入。然后我們可以看到像Hadoop這樣七八年前很多人覺得很高深的東西現在也慢慢變得平臺化了。今天,如何使得整個機器學習的體系平臺化,以便于讓更多的非專業人士能夠使用,這個是目前面臨的一個很大的瓶頸,需要一定的發展時間才能得以突破。
在一些領域中,很多技術性問題可以在兩三年內得到解決,但是還有很多問題并非如此簡單,比如說語義。我們說語音識別是相對簡單的:音進來,字出去,這個非常明確,一個API就可以調動。但是音進來,確定是何種情境的語義出去就很難。這些我覺得兩三年遠遠還不夠,還需要更多的時間去理解。
傳感器一定程度來說是價格的問題、如何普及的問題?,F在我們看到Google Car雖然做的很牛,但是正如馭勢科技的吳甘沙說的,Google Car實際商業化的一個巨大瓶頸就是價位的問題:傳感器實在太貴了。因此要把這件事做下來就是一個雞和蛋的問題——降低價格就需要量,但量怎么起來?價格不下去量也起不來。要解決這個問題也需要一定的時間。
最后還有很多機械方面的問題??刂茩C械運動的算法,硬件運動后給出的回饋等等在機械部門也還需要一些開發。
整體來說,雖然我認為機器學習、深度學習在突破人類的精確度方面已經做的非常好,但是以上幾個領域還是需要一些時間才能取得突破。但是這一天肯定是會來臨的,我們怎么知道會來臨呢?
Google的野心
我們知道,不久前Google重新組織了公司架構,將搜索業務和其他前沿項目子公司都放進了控股公司Alphabet公司。很多分析師說,Google把搜索和其他的業務分開來做Alphabet,是為了優化它的股價,其實這種說法太表面了,他們沒有了解一個真正有野心的公司在做什么。
一定程度上,Google之所以成立了Alphabet,是因為Google經過搜索和廣告業務的積累,逐步發展了一套我們可以簡稱為GoogleBrain的模式。Google Brain其實就是機器學習的大腦,這個機器包括了平臺也包括了專家,如果它用在搜索領域就是一個搜索引擎,如果它能夠用在醫學領域,那它可能就是一個癌癥診斷系統,它也可以用于人類壽命的延續以及智能家電等各種不同領域。所以Google的野心就是把機器學習作為一個核心,然后用它去解決非計算機非互聯網領域的各種問題。
當然它現在還不是一個整體平臺,但Google 就會找一些極聰明的人來進軍這些領域,有平臺的用平臺,平臺未成形的就用聰明才智來想辦法?,F在看來,Google這種模式也做成了很多有意義的事情。所以,對于Google,我們千萬不要低估了它的能力,因為這家公司可能是未來推動人工智能平臺化的最大力量。
怎么證明這是真的呢?從最近Jeff Dean演講的一張圖我們就可以看到Google內部有多少項目在用深度學習。
Google內部對深度學習的大量應用
我們可以看到,從2012年到今天,Google對深度學習的利用在快速增長,應用領域也極為廣泛。從這張圖我們就可以看到Google,也就是現在的 Alphabet在人工智能方面是多么的有野心。
再回到我原來的問題,我們現在是不是生逢其時,可以在正確的時候選擇進入人工智能這個領域呢?如果我們相信Google這幫人很聰明,如果我們相信Google對深度學習的使用邏輯,我們也要相信人工智能的應用期即將來臨。
深度學習的挑戰
深度學習也面臨挑戰
但是深度學習以及機器學習還面臨很多挑戰。這里有幾個問題。
第一個問題,就是我剛剛提到的:目前仍然沒有一個統一的平臺。在深度學習方面,現在的人懂就是懂,不懂就是不懂。這就是為什么Google最近花了重金不斷在挖業界頂尖的人才,給年輕人開出的年薪甚至超過200萬美元。這些人也就是二十來歲,博士剛畢業不久,怎么會這么值錢呢?
其實就是因為兩個理由,第一,這些人進入了公司之后,會被投入到健康、醫療、預防等等各個領域的研究。他們雖然每年拿走公司的兩百萬美金年薪,但是也許兩年后他們就能在相關領域創造出兩億美金的價值,所以對Google公司而言,這些人才實際上不貴,是非常劃算的。
第二個理由就是Google多雇一個,Facebook就得少雇一個。這不是開玩笑。因為在美國有三個大公司在瘋狂挖人工智能的人才——Google、Facebook和Microsoft,他們之間競爭激烈,對人才的吸引力也不相上下。
第二就是深度學習的網絡太大,需要海量的數據。
第三,因為數據太多,所以計算特別的慢,所以需要非常大的計算量。
第四點有點奇怪但也合理:機器無法用人的語言告知做事的動機和理由。即便機器訓練做了很棒的深度學習,人臉識別、語音識別做的非常棒,但它不能和人一樣,它講不出來這是怎么做到的。雖然有人也在做這方面的研究,但是在今天,如果一個領域是不斷需要告訴別人該怎么做,需要向別人去解釋為什么的,那這個領域對于深度學習來講還是比較困難的。比如Alpha Go打敗李世石,你要問Alpha Go是為什么走這步棋,它是答不上來的。
即便有如此多的局限,我們還是認為人工智能在很多領域可以迅速應用,并且可以幫助企業打造競爭壁壘。
人工智能如何幫企業打造競爭壁壘?可以從如下四個方面思考:
第一,如果你有壟斷性的大數據,你就會有很大的優勢。關于數據需要注意的幾點是,首先壟斷性大數據不是公開的數據,不是剽來的數據,也不是買來的數據,因為這樣的事情你能做競爭對手也能做。其次,無標簽的數據也不會給你帶來優勢。再次,如果是人工標簽的數據也不行,因為人工標簽太慢了。最好的數據是閉環的數據,所謂閉環的數據就是在你應用的時候可以捕捉到數據并且知道最終你根據數據做出的抉擇對或不對。我們投資的face++,它有和美圖、阿里的合作,就一定程度形成了特別大的數據的優勢。
第二,擁有龐大的機群。機群是很重要的,包括需要什么處理系統的支持,怎么去部署,用什么樣的計算架構等等。
第三,你要有一批特別懂的人。沒有平臺的時候,你就只能把一批人丟進去,讓他們去解決特別大的問題。
第四,當你沒有平臺的時候怎么辦?我們就可以找一批特別聰明的人,讓他們不斷的調節算法——當然這構成一個短期的競爭優勢,從長期看,一旦大的人工智能平臺出來,這種優勢就不存在了。所以現在來做人工智能,抓到這個先機是特別特別重要的。
人工智能如何快速商業化?
人工智能如何快速商業化
第一,不要用人工智能去取代人。
機器不一定要取代人,很多情況之下他只要能輔助人就可以了。我談到了很多工作會消失,但醫生會全部失業嗎?一定不會,應該是最高明的醫生創造很多機器人給他人使用。記者就不再需要了嗎?寫深度文章還是需要的,但簡單拼拼湊湊的文字就不需要了。所以這些工具一定程度上是在輔助人而不是取代人。
第二,要聰明的找到容錯的用戶界面。
想想搜索引擎,搜索引擎的精確度其實是很低的,你想一想,當你去百度,Google搜索的時候,它們給出的第一條就是你要的答案的情況有多少?我估計不會超過50%,但是為什么我們都說搜索引擎聰明,不說他笨呢?第一個理由當然是因為它博學,第二個則是因為它的界面做的非常的聰明:它給用戶提供很多結果,而用戶只要能找到他滿意的那個,就會認為搜索引擎很棒,因為沒有它的話,用戶可能什么也找不到。這一類的容錯的界面,即便它的識別率很低,給你很多結果,讓你在一定時間里得到滿足,其實還是達到了一定的可用度。
第三,讓用戶提供自然的大數據。
當Siri推出的時候很多人都說“這就是個玩具而已”,認為它沒有真實的用處,但是蘋果靠Siri收集了很多人的真實語音,收集了大量數據。
很多人把Siri當成一個搞笑工具,會問它諸如“你是男是女”這種無聊問題,蘋果就把這些無聊的問題深度分析了一下,去了解人們最常問的都是什么問題,然后他們就考慮能不能優化Siri,讓它對正常問題的解答能讓人們在一定程度上得到滿足。人們滿足了以后,就會繼續的問,如此問題越問越多,蘋果也就可以得到更多的數據。
蘋果的這種數據收集方法非常聰明,值得借鑒。我們以前在學語音對話的時候,問的都是非常正經的問題,到最后分析來分析去,不過是那固定的幾萬句,一直沒有跳出這個框框,得到的結果也就不會讓人滿意。但用一種有趣的方式,你就可以像草船借箭一樣,去“借”到幾億個數據。這些數據哪怕不精確也無妨,因為整體來說深度學習非常聰明,能把那些不精確不精準的東西忽略掉。
第四,關注局限領域。
Google很偉大,它要做全天候全路況的無人駕駛,它想把全部競爭對手都擊敗,最后就剩一個Google。這個計劃很宏偉,但是是不是一定要這么做呢?我覺得不見得。其實我們完全可以先做一個用于局限領域的無人車,把這樣的一個產品先做起來,然后我們通過它獲取數據,學習教訓,不斷改進。
想想無人駕駛叉車。這個叉車是產生價值的,因為它取代了一個叉車工人去開叉車;它技術難度相對低,因為它只要知道從A走到B;它不上路,不用擔心政府的法律法規,不需要考慮撞到人怎么辦,是不是要停下。
Google Car能在高速公路上比99%以上的人都開的更好,但是它碰到一些極端的情況,比如大風大雨的漆黑天,它就沒轍了,因為它不知道該怎么辦,從來沒看到過這種情況。這種情況下只有把車子停下來,但那一停會發生什么呢?當然就追尾了。
既然這種情況連Google也避免不了,為什么我們不先考慮做一些可控環境下的商業駕駛項目?這也是一個值得思考的問題,不是說Google的路線不對,而是說有兩種路線可以走。
總結:人工智能的未來藍圖
李開復:人工智能的未來藍圖
上圖是我認為的人工智能的未來藍圖,這是我們創新工場現在對這一領域的理解,以及可能會發生的順序。
大數據應用方面,現階段我們已經看到很多互聯網應用,BI、商業自動化馬上也會使用相關的技術,未來幾年,離錢最近、產生用戶最多、產生價值最大的領域可能就是金融、醫療、教育,當然也包括任何有大數據的行業。
在感知方面,今天的人臉識別、語音識別已經做的蠻好。對于VR/AR,我們在短期還不是太樂觀,但是隨著它三五年以后慢慢得到普及,一定需要非常多的新的自然語言的界面。此外,我們大膽預測三到五年之內會有一個人工智能平臺出現。
我們并不認可家庭機器人會很快出現,理由是消費者的期望值是最高的,今天機器人的技術還不行,犯錯也太多,而且有時候會看起來太傻,另外價格也太貴,感應器不夠靈敏?;谶@些理由,我們對家用機器人的投資還只限于一些給小朋友的玩具,或者小魚在家這種用于溝通的工具,這一類的家庭應用我覺得還是合理的,但要一個能夠在家里幫你掃地做菜的機器人出現,恐怕還是一個非常長期的事情。任何行業都要有經濟理由來投資這個領域,不斷迭代優化它的技術,再進入下一個階段,所以機器人簡單來說應該是工業、商業,最后普及到家庭,所以今天很多對家庭機器人過火的觀點和做法我們是不認可的。
關于無人駕駛,我們的觀點是雖然Google Car很偉大,但是因為它要去適應各種路況,所以要到應用階段也還需要很長的時間。我們認為可以先在局限環境中慢慢推進無人駕駛。
從長期看,未來人工智能會在所有的領域徹底改變人類,產生更多的價值,取代更多人的工作,也會讓很多現在重復性的工作被取代,然后讓人去做人真正應該去做的事情。短期來說,人工智能商業價值也很大,短期在很多領域都能產生價值。
李開復和清華大學姚期智院士
演講后問答實錄:
問題一:剛才聽到了人工智能的介紹,真的認為人工智能給我們帶來了很多的便捷,的確是快要步入到一個黃金時代,很多人可以從勞動密集型的工作中解放出來。我的問題是,如果很多事兒都可以交給機器來完成,那么剩余的勞動力是否會催生另一個黃金產業,比如服務業等等?
李開復:這個問題很好,我曾經寫過一篇文章《如果十年之后有一半的人失業了,下面該發生什么》,講過這個問題。悲觀的預測是,因為現在的95后,00后大部分成長在虛擬世界里,現實世界只是他們一個小小的補充,所以他們可能深陷其中而不能自拔了。反正人工智能讓他們失業,也找不到工作,同時政府也可以養著他們,他們不需要工作,那么干脆每天帶著虛擬眼鏡起來就玩游戲,不思進取就好了。這個是我特別擔心的,也是可能發生的。
樂觀的是上天讓我們來到這個世界,本來就不是讓我們來做中介、助理這類勞力的工作,我們被生為有感知,有大腦,應該是有更高的目標。那么,是不是上天讓人工智能來到我們面前,就是讓一批有思考能力的人幫人類找到一條新的出路,讓我們每個人能夠找到自己的更高目標,讓一半失業的人找到他們的歸宿,有自我實現的機會呢?
我對年輕人的建議是做最有熱情的事情,要不然機器肯定取代你,要做就要做頂尖最棒最有創意的事情,要不然你肯定會被取代。
問題二:您講了很多前景中的事情,我們都覺得美好,但是在實現前景的道路上,最大的幾個技術瓶頸在哪里?在解決瓶頸的過程中,您看到的大公司解決這些瓶頸的方案是什么?
李開復:最大的瓶頸就是人工智能的平臺。平臺化會帶來井噴的效應,但這個平臺是什么我今天也無法描述。你可以看到iOS的平臺,安卓的平臺等等,每一次都造成了井噴式的效應,所以平臺化是必然的也是必須的。對于無人駕駛和機器人方面,主要是感應器的價格等問題,一旦問題解決,這些領域也會發生井噴效應。這些都需要聰明的大腦試著去解決。
問題三:第一個問題,您剛才提到人工智能的黃金時代到來了,那么您能舉一個到三個導致這種黃金時代到來的創新明星嗎?第二個問題,當人工智能呼嘯而來的時候,大家很快意識到人工智能第一個急需解決的問題是人,如果人類把持不住,可能人的時代就過去了。
李開復:今天有四位CEO,分別代表了芯片領域、金融領域、視覺識別領域和無人駕駛領域,這四個公司雖然目前領域不同,但在到達下一個階段后,一定會做平臺,一定要擴張。任何一個領域都是先做一個切入的應用,做好了之后再擴大,變成一個平臺,最終獲利最多的就是那些有上下平臺連接的公司。
關于你的第二個問題,即人類將面臨的下一個挑戰問題,不是機器人占領了世界,我們被機器統治這樣的問題。雖然我不排除這些事情發生的可能性,但是我呼吁大家先要應對一個現實問題——下一階段50%的人可能失業的問題。這可能是一個最大的問題,畢竟在過去的工業時代也好,信息時代也好,失業率從來沒有這么高過,今天的政治經濟體系也不能承擔這么高的失業率。所以我覺得聰明的人應該趕快解決這個問題,這個問題可能十年后就要到來了,當這個問題解決完了之后,我們再去想下一個問題。
問題四:您講到的人工智能在各個領域都會以極快的速度超過人的領域,但是它是不是只在某些領域做的更好,在某些人類沒有開拓的領域,它有沒有自我開拓的能力,根據已有的領域和問題,開拓新的領域?“奇點”真的出現,是不是就說明人工智能有跨領域思考學習的能力?
李開復:從過去已經發生的事情來看,還不存在人工智能的自我開創,未來有沒有可能,這其實是一個蠻有意思的話題。我想即便是一些人類未曾進入的領域,只要你能把它量化,變成一個input/output,我覺得機器還是可以學成的。但是我也相信大部分人類的偉大創意都不是那么容易量化的。
第二個關于奇點的問題,回到剛才講的,機器學習并不知道它自己在干什么,它只是一個非常聰明的input/output而已。另外它沒有自我意識。科幻小說和現實生活很大的差別是因為科幻小說里面的機器都有自我意識,所以我覺得,由于機器的自我意識和自我創造力,還有自我解釋的行動能力,這三者都不存在,奇點來臨也就不是那么容易的事情。我相信在未來的一百年,這三點都有可能被克服,也會給人類帶來機會和災難,但是我們現在真正面臨的問題還是50%的人可能失業的問題。
評論
查看更多