2010年8月的一個(gè)下午,在舊金山灣,一個(gè)34歲的倫敦人大步流星地走上舞臺(tái)。他深吸一口氣,放松緊繃的神經(jīng),露出一個(gè)蹩腳的微笑,開口講道:“今天,我要講述如何用一個(gè)完全不同的方法去構(gòu)建......” 空氣突然安靜,好像在等待著一個(gè)意欲改變世界的人吶喊出自己重大的野心——“ AGI ” Demis Hassabis說道。
AGI指通用型人工智能,是一種擁有與人類相同智力水平或甚至超過人類的理想化計(jì)算機(jī)程序。AGI能夠出色地完成離散型任務(wù),例如識(shí)別照片或翻譯語言等,這與我們手機(jī)和計(jì)算機(jī)中所見到過的人工智能(AI)本質(zhì)上是相同的。
但除此之外,它還會(huì)做加減運(yùn)算、下棋、說法語;可以解物理論文、撰寫小說、制定投資策略、陌生人進(jìn)行愉快的交談;它甚至可以監(jiān)測(cè)核反應(yīng)、管理電網(wǎng)和交通流量,毫不費(fèi)力地在各個(gè)領(lǐng)域獲得一個(gè)又一個(gè)的成就——AGI將使當(dāng)今最先進(jìn)的AI融合成一個(gè)袖珍計(jì)算器。
目前,人類是唯一擁有完成所有這些任務(wù)能力的智慧生物,但人類的智力受限于身體所能提供的能量;而AGI是在計(jì)算機(jī)上運(yùn)行的,所以它不會(huì)受到這些限制,AGI的能力上限僅由處理器的數(shù)量決定。
AGI將從完成監(jiān)測(cè)核反應(yīng)任務(wù)開始,按照其一秒閱讀上萬篇物理論文的速度吸收知識(shí),不久便可以具備發(fā)現(xiàn)新能源的能力,而這一速度是人類經(jīng)過千年進(jìn)化也比不上的。當(dāng)人類智能可以被計(jì)算機(jī)的速度和可擴(kuò)展性輔助,目前看似不可解決的問題將被輕松解決。
Hassabis曾向英國報(bào)紙《Observer》的記者描述,他希望AGI能夠掌握“癌癥、氣象、能源、基因組學(xué)、宏觀經(jīng)濟(jì)和金融系統(tǒng)”等學(xué)科知識(shí)。
Hassabis發(fā)言的這場(chǎng)大會(huì)被稱為奇點(diǎn)峰會(huì)。根據(jù)未來學(xué)家的說法,“奇點(diǎn)”指的是由于AGI出現(xiàn)引發(fā)的結(jié)果。由于AGI將以高速處理信息,很快它就將變得“聰明絕頂”。自我改善的快速循環(huán)將導(dǎo)致機(jī)器智能的“爆炸”,使人類窒息于“硅塵”之中。那么這個(gè)奇點(diǎn)將帶來烏托邦還是地獄?這已經(jīng)成為了一個(gè)宗教信仰一般的問題。
“如何建立人造思維”、 “ AI解決老齡化問題”、“取代我們的身體”、 “改變生與死的界限”……從會(huì)談的標(biāo)題來看,這場(chǎng)大會(huì)的與會(huì)者傾向于將人工智能視為救世主;相比之下,Hassabis的發(fā)言似乎沒有那么大的噱頭——“基于神經(jīng)科學(xué)的研究方法探究AGI架構(gòu)”。
Hassabis語速飛快,踱步于講臺(tái)和屏幕之間。他身著一件栗色套頭衫和一件白色系扣襯衫,像極了一個(gè)在校的大學(xué)生,但他瘦小的身材下卻蘊(yùn)藏了極高的智慧和無限的力量。Hassabis解釋道:到目前為止,科學(xué)家已從兩個(gè)大方向上探索AGI。
一條支路可以稱為基于規(guī)則的人工智能。在這一支路上的研究人員試圖描述出一個(gè)可以像人類一樣思考的系統(tǒng)所需的所有規(guī)則,并通過編程加以實(shí)現(xiàn)。這種方法在20世紀(jì)80年代和90年代很流行,但沒有產(chǎn)生預(yù)期的結(jié)果。Hassabis認(rèn)為形成人類認(rèn)知的神經(jīng)結(jié)構(gòu)太過于精妙,根本無法以這種方式描述。
另一條支路的研究人員試圖數(shù)字化復(fù)現(xiàn)大腦的神經(jīng)網(wǎng)絡(luò)。這雖然有一定的道理,畢竟腦是人類智慧的所在;但Hassabis認(rèn)為這些研究人員的這一企圖就像想要繪制宇宙中的每一顆恒星,也走在了一個(gè)歪路上。更根本的問題是,這一研究方法就像試圖通過鑿開計(jì)算機(jī)檢查晶體管的相互作用來了解Microsoft Excel的工作原理,他們所關(guān)注的大腦加工水平是錯(cuò)誤的。
Hassabis提出了一個(gè)中間立場(chǎng):AGI應(yīng)該從大腦處理信息的宏觀方法中獲取靈感——而不是物理系統(tǒng)或它在特定情況下的應(yīng)用規(guī)則。換句話說,它應(yīng)該專注于理解大腦的軟件,而不是硬件。
現(xiàn)有如功能性磁共振成像(fMRI)這樣的新技術(shù),使得研究人員可以探究人類在特定活動(dòng)下的大腦活動(dòng),說明這一方向具有一定的可行性。他告訴觀眾,最新的研究表明,大腦會(huì)在睡眠期間通過重播經(jīng)驗(yàn)學(xué)習(xí)一般原則,研究人員應(yīng)該嘗試模仿這種系統(tǒng)構(gòu)造AI。
在演講幻燈片的右下角出現(xiàn)了一個(gè)圓形的藍(lán)色漩渦,緊貼的兩個(gè)單詞DeepMind赫然出現(xiàn)在Logo之下——這是該公司第一次正式出現(xiàn)在公開場(chǎng)合。
這次發(fā)言遠(yuǎn)遠(yuǎn)沒有看起來那么簡單,Hassabis為了這個(gè)邀請(qǐng),努力了一年之久。他真正的目的是與硅谷億萬富翁彼得·泰爾(Peter Thiel)的一分鐘會(huì)面,而Thiel正是這場(chǎng)會(huì)議的贊助方——Hassabis想要Thiel的投資。
Thiel似乎比Hassabis本人對(duì)AGI更有熱情。在2009年奇點(diǎn)峰會(huì)的一次演講中,Thiel曾表示,他對(duì)未來最大的恐懼不是機(jī)器人起義(他在新西蘭內(nèi)陸地區(qū)擁有一個(gè)末日避難所,他其實(shí)比大多數(shù)人做好了充足的準(zhǔn)備)。相反,他擔(dān)心奇點(diǎn)來得太晚,世界更需要新技術(shù)來抵御經(jīng)濟(jì)衰退。
DeepMind最終總募資200萬英鎊,其中Thiel投資了140萬英鎊。當(dāng)Google以6億美元的價(jià)格在2014年1月收購該公司時(shí),Thiel和其他早期投資者的投資收益率高達(dá)5,000%。
對(duì)于許多創(chuàng)始人來說,這是一個(gè)圓滿的結(jié)局。他們可能會(huì)放慢發(fā)展速度,甚至退后一步,花更多的時(shí)間和錢打交道。但對(duì)于Hassabis來說,谷歌的收購只是他建造AGI帝國的另一步進(jìn)展。2013年,他花了很多時(shí)間談判交易的條款,使DeepMind獨(dú)立于Google運(yùn)營,DeepMind在不失去控股權(quán)的前提下獲得了Google提供的現(xiàn)金流和計(jì)算能力。
Hassabis認(rèn)為DeepMind將是一個(gè)混合體:它作為創(chuàng)業(yè)公司擁有強(qiáng)大的自我驅(qū)動(dòng)力,又匯集了來自各大頂尖大學(xué)的聰明頭腦,同時(shí)擁有世界上最有價(jià)值公司之一的雄厚資金支持——這些因素都將加速AGI的到來,解決人類所面臨的難題。
01
有著中國血統(tǒng)的天才圍棋少年
Demis Hassabis于1976年出生于倫敦北部,是三個(gè)兄弟姐妹中最大的一個(gè)。父親是生活在塞浦路斯的希臘人,經(jīng)營著一家玩具店;母親是生活在新加坡的華人,在英國百貨公司約翰·劉易斯工作。
他從小便體現(xiàn)出驚人的才能——在他四歲時(shí),旁觀了一場(chǎng)父親和叔叔的國際象棋比賽,從此迷上了國際象棋,沒過幾周他竟然在棋局上擊敗了許多成年人,等到他13歲時(shí),他已在世界同齡棋手中位居第二。而且在他八歲時(shí),他已經(jīng)可以在一臺(tái)計(jì)算機(jī)上實(shí)現(xiàn)自己的代碼,僅通過自學(xué)掌握了編程技術(shù)。
1992年,Hassabis比原計(jì)劃提前兩年完成了他的A-levels課程。他找到一份在Bullfrog Productions的電子游戲編程工作。Hassabis編寫了一個(gè)名為主題公園(Theme Park)的游戲,在這個(gè)游戲里,玩家可以設(shè)計(jì)并運(yùn)營了一個(gè)虛擬游樂園,這個(gè)游戲的銷量高達(dá)1500萬份。之后這家公司優(yōu)化并開發(fā)了更大規(guī)模的虛擬城市游戲,Hassabis編寫的主題公園(Theme Park)成為這個(gè)大規(guī)模游戲的一部分。
除了編寫游戲外,他還很擅長玩游戲,比如國際象棋、拼字游戲、撲克和西洋雙陸棋。1995年,在劍橋大學(xué)學(xué)習(xí)計(jì)算機(jī)科學(xué)時(shí),Hassabis多次在學(xué)生圍棋錦標(biāo)賽擊敗對(duì)手。圍棋比國際象棋要復(fù)雜得多,玩家只有通過長期訓(xùn)練才能獲得足夠多的經(jīng)驗(yàn)進(jìn)而熟練制定游戲戰(zhàn)略。沒有人知道Hassabis以前是否玩過圍棋。
Hassabis很快稱霸了初學(xué)者的比賽,然后又擊敗了經(jīng)驗(yàn)豐富的圍棋專業(yè)玩家,那位專業(yè)玩家對(duì)于自己敗給一名19歲的新手頗為震驚。劍橋圍棋大師Charles Matthews看了Hassabis的比賽后,決定開始培養(yǎng)他。
Hassabis一次又一次在圍棋比賽上展現(xiàn)他的天賦,漸漸地,他開始好奇計(jì)算機(jī)是否可以像人類一樣通過不斷積累的經(jīng)驗(yàn)來學(xué)習(xí)。游戲提供了一個(gè)現(xiàn)實(shí)世界無法比擬的學(xué)習(xí)環(huán)境。游戲雖然是從現(xiàn)實(shí)世界中發(fā)展而來,但它們可以在沒有外界干擾的情況高效進(jìn)行。與現(xiàn)實(shí)世界相比,在游戲里,時(shí)間可以過得比現(xiàn)實(shí)生活中快很多:幾天內(nèi),玩家就能組建一個(gè)團(tuán)體,并在幾分鐘內(nèi)就能進(jìn)行戰(zhàn)斗。
1997年的夏天,Hassabis去日本旅游。那年5月,IBM的Deep Blue計(jì)算機(jī)擊敗了世界象棋冠軍Garry Kasparov。這是計(jì)算機(jī)第一次在國際象棋比賽中擊敗了一位大師。這場(chǎng)比賽引起了全世界的關(guān)注,同時(shí)還引發(fā)了人們對(duì)計(jì)算機(jī)不斷發(fā)展和潛在威脅的擔(dān)憂。
Hassabis遇到日本棋盤游戲大師Masahiko Fujuwarea,他談到了一個(gè)將戰(zhàn)略游戲和人工智能結(jié)合起來的想法:有一天他會(huì)建立一個(gè)計(jì)算機(jī)程序,這個(gè)程序會(huì)擊敗全世界最厲害的人類圍棋玩家。20歲的Hassabis認(rèn)為,他目前的能力還不足以支持他實(shí)現(xiàn)自己的夢(mèng)想,但他心中已經(jīng)有了一個(gè)藍(lán)圖。
1998年,他創(chuàng)辦了一個(gè)名為Elixir的游戲工作室。Hassabis專注于開發(fā)一個(gè)名為共和國革命(Republic: The Revolution)的政治模擬游戲。當(dāng)Hassabis還在上學(xué)時(shí),他告訴他的朋友Mustafa Suleyman,這個(gè)世界需要一個(gè)能模擬復(fù)雜的社會(huì)動(dòng)態(tài)并解決棘手社會(huì)問題的模型。現(xiàn)在,他嘗試在游戲中這樣做。
事實(shí)證明,這很難。Elixir最終發(fā)布了這款游戲的精簡版,但這款游戲沒有火起來。其他類似的游戲也相繼失敗(比如一個(gè)名為Evil Genius的邦德惡棍模擬器)。2005年4月,Hassabis關(guān)閉了Elixir。Matthews認(rèn)為,Hassabis創(chuàng)立公司只是為了獲得管理經(jīng)驗(yàn)?,F(xiàn)在,在Hassabis開始尋求AGI之前,他還不夠了解一個(gè)至關(guān)重要的領(lǐng)域——人類的大腦。
2005年,Hassabis在倫敦大學(xué)學(xué)院(UCL)獲得神經(jīng)科學(xué)博士學(xué)位。他在博士期間進(jìn)行了記憶和想象力方面的研究。一篇被引用超過1000次的論文表明,健忘癥患者很難進(jìn)行想象,這表明記憶和創(chuàng)造心理圖像之間存在聯(lián)系。為了解決AGI,Hassabis正在嘗試?yán)斫獯竽X。他的大部分工作最后都回到了一個(gè)問題:人類大腦是如何獲得并記住概念和知識(shí)?
Hassabis于2010年11月15日正式成立了DeepMind。該公司的使命宣言與現(xiàn)在一樣—— “解決智能(solve intelligence)”,然后用它來解決其他問題。正如Hassabis告訴Singularity Summit的參會(huì)者,這意味著讓計(jì)算機(jī)像人類大腦一樣理解并執(zhí)行任務(wù)。
Hassabis并不覺得科學(xué)已經(jīng)完全了解人類的思想。他認(rèn)為不能簡單地從數(shù)百項(xiàng)神經(jīng)科學(xué)研究中提出AGI藍(lán)圖。他自信地認(rèn)為以他現(xiàn)在的水平足夠支撐他進(jìn)行AGI的研究。然而,事實(shí)并非如此。我們對(duì)大腦的實(shí)際運(yùn)作方式仍然知之甚少。2018年,一群澳大利亞研究人員對(duì)Hassabis的博士論文研究結(jié)果提出質(zhì)疑。他們認(rèn)為文章的統(tǒng)計(jì)數(shù)據(jù)很糟糕。雖然質(zhì)疑是針對(duì)一篇論文,但也足夠表明DeepMind還有很長的路要走。
Suleyman和Shane Legg是兩個(gè)癡迷AGI的新西蘭人,Hassabis在倫敦大學(xué)學(xué)院認(rèn)識(shí)了他們,他們后來成為了DeepMind的聯(lián)合創(chuàng)始人。
Hassabis很有天賦,DeepMind在他的帶領(lǐng)下發(fā)展地越來越快。DeepMind前運(yùn)營經(jīng)理Ben Faulkner說:“Hassabis有點(diǎn)像磁鐵,吸引著越來越多的人才?!痹S多人拒絕了谷歌和Facebook等硅谷巨頭的offer,選擇進(jìn)入DeepMind。也許DeepMind最大的成功就是聘請(qǐng)并留下最聰明和最優(yōu)秀的人才。DeepMind在布魯姆斯伯里的羅素廣場(chǎng)(Russell Square)里開設(shè)了商店,地址在倫敦大學(xué)學(xué)院(UCL)的馬路對(duì)面。
DeepMind所關(guān)注的一種機(jī)器學(xué)習(xí)技術(shù)——強(qiáng)化學(xué)習(xí)(reinforcement learning),源于Hassabis對(duì)游戲和神經(jīng)科學(xué)的雙重?zé)釔邸_@種程序是為收集相關(guān)環(huán)境信息而建立的,通過重放積累的經(jīng)驗(yàn)來進(jìn)行學(xué)習(xí),就像Hassabis在Singularity Summit lecture講座中給出的人類大腦活動(dòng)的描述一樣。
計(jì)算機(jī)在強(qiáng)化學(xué)習(xí)領(lǐng)域還是一片空白。該程序展示了一個(gè)虛擬環(huán)境,和國際象棋或視頻游戲的模擬一樣,只有規(guī)則是已知的。該程序包含至少一個(gè)稱為神經(jīng)網(wǎng)絡(luò)的組件,它由多層計(jì)算結(jié)構(gòu)組成,這些計(jì)算結(jié)構(gòu)可以篩選信息并識(shí)別特定的特征或策略。
每個(gè)層都以不同的抽象級(jí)別對(duì)環(huán)境進(jìn)行檢查。起初,這些網(wǎng)絡(luò)的成功率很低,但重要的是,它們會(huì)不斷的積累經(jīng)驗(yàn)。在嘗試不同的策略時(shí),它們會(huì)變得越來越復(fù)雜,如果它們成功,就會(huì)獲得獎(jiǎng)勵(lì),而且一旦犯過一次錯(cuò)誤就不會(huì)再犯。人工智能的最牛逼的地方在于重復(fù)做任務(wù)的速度。
2016年,DeepMind吸引了全世界的目光,它建立了一個(gè)結(jié)合強(qiáng)化學(xué)習(xí)和其他技術(shù)的AI程序來玩圍棋。
這就是廣為人知的AlphaGo。2016年,AlphaGo在首爾的五場(chǎng)比賽中擊敗了世界冠軍,全世界都為之震驚。次年,改進(jìn)版的AlphaGo擊敗了中國圍棋冠軍。
像1997年的Deep Blue一樣,AlphaGo改變了人類對(duì)自我成就的看法,人類世界的冠軍,已經(jīng)不再是地球上最智慧的存在了。Hassabis在將他的野心告知了Fujuwarea近20年后,實(shí)現(xiàn)了這一目標(biāo)。Hassabis說,這場(chǎng)比賽讓他幾乎要喜極而泣。傳統(tǒng)來說,AlphaGo的學(xué)生回報(bào)它的方式就是在一場(chǎng)比賽中擊敗它,而Hassabis就是通過贏得整場(chǎng)比賽來感謝Matthews的。
DeepBlue是通過蠻力和高速運(yùn)算的優(yōu)勢(shì)贏得的勝利,但AlphaGo卻風(fēng)格迥異,它看起來就很有藝術(shù)性,很具人性化。它的優(yōu)雅和精致,及其超強(qiáng)的計(jì)算力,都表明在疾病治療和城市管理的項(xiàng)目設(shè)計(jì)方面,DeepMind要比其競(jìng)爭對(duì)手更進(jìn)一步。
02
結(jié)緣谷歌,走向世界
Hassabis堅(jiān)信DeepMind將會(huì)改善世界。但AGI具有很大的不確定性,即使有一天它實(shí)現(xiàn)了,我們也不知道它是好是壞,又或者它是否會(huì)服從人類的控制?即使它能被控制,那又應(yīng)該由誰來控制它?
從一開始,Hassabis就一直試圖保護(hù)DeepMind的獨(dú)立性,他堅(jiān)持認(rèn)為DeepMind應(yīng)該留在倫敦。2014年,當(dāng)谷歌要收購該公司時(shí),控制權(quán)問題變得更加緊迫。Hassabis其實(shí)不需要向Google出售DeepMind,他手頭上有大量現(xiàn)金,而且他還想出了一個(gè)商業(yè)模式,可以讓公司設(shè)計(jì)游戲來資助研究。
但是,就像許多創(chuàng)始人一樣,他沒能抵擋谷歌的巨額的資金吸引。Hassabis并不愿交出他所精心創(chuàng)立的公司,因此作為交易的一部分,DeepMind制定了一項(xiàng)計(jì)劃,來阻止谷歌單方面控制公司的知識(shí)產(chǎn)權(quán)。據(jù)知情人士透露,在收購前一年,雙方簽署了一份名為“道德與安全審查協(xié)議”的合同。
審核協(xié)議規(guī)定,作為DeepMind的核心技術(shù)AGI,無論其合何時(shí)能夠研究成功,都將被一個(gè)稱為道德委員會(huì)的理事會(huì)掌控。根據(jù)同一消息來源,道德委員會(huì)不僅僅是谷歌表面的讓步,它還為DeepMind提供了堅(jiān)實(shí)的法律支持,以控制其最有價(jià)值和最危險(xiǎn)的技術(shù)。
小組成員的名字尚未公開,但另一個(gè)與DeepMind和Google關(guān)系密切的消息人士表示,DeepMind的三位創(chuàng)始人都是委員會(huì)成員。(DeepMind拒絕回答有關(guān)審核協(xié)議的一系列詳細(xì)問題,但表示“道德監(jiān)督和治理從一開始就是我們的首要任務(wù)。”)
Hassabis能決定DeepMind命運(yùn)的還有其他方式,那便是忠誠。無論是過去的老員工還是現(xiàn)在的新員工,都認(rèn)為Hassabis的研究課題是DeepMind最大的優(yōu)勢(shì)之一。他的課程吸引了世界上數(shù)百名最有才華的專家,使其放棄自己的學(xué)術(shù)研究并心甘情愿地加入他的團(tuán)隊(duì)工作。DeepMind在巴黎、阿爾伯塔和阿姆斯特丹均設(shè)有分公司。
許多員工認(rèn)為與Hassabis和DeepMind的關(guān)系比與谷歌的關(guān)系更為親密,畢竟谷歌收購DeepMind就是為了獲益。他們都認(rèn)為只要自己保持個(gè)人忠誠度,Hassabis相比其唯一的股東就擁有較大的權(quán)力。對(duì)于谷歌來說,通過代理服務(wù)的DeepMind吸納AI人才比從Facebook或Apple挖人更好。
DeepMind有另一個(gè)杠桿來源,就是其公眾影響力,但這是需要不斷的增加曝光的。該公司最擅長的就是這一點(diǎn),其中AlphaGo就是一場(chǎng)公關(guān)演出。自被谷歌收購以來,該公司一再引起全球關(guān)注。
其中一款火爆的應(yīng)用產(chǎn)品,可以在眼睛掃描中發(fā)現(xiàn)作為黃斑變性指標(biāo)的圖案。另一個(gè)軟件則學(xué)會(huì)了使用與AlphaGo相似的架構(gòu)從頭開始下棋,并成為了有史以來最偉大的國際象棋選手,僅用了9個(gè)小時(shí)它就可以對(duì)抗自己。2018年12月,一項(xiàng)名為AlphaFold的計(jì)劃比其他競(jìng)爭對(duì)手更準(zhǔn)確地預(yù)測(cè)了復(fù)合材料清單中蛋白質(zhì)的三維結(jié)構(gòu),這很大程度上為治療帕金森氏癥和阿爾茨海默氏癥等疾病提供了契機(jī)。
DeepMind對(duì)其開發(fā)的算法感到特別自豪,該算法可以計(jì)算出最有效的方法來給谷歌的數(shù)據(jù)中心制冷,其數(shù)據(jù)中心包含大約250萬臺(tái)計(jì)算機(jī)服務(wù)器。DeepMind在2016年表示,他們將谷歌的能源費(fèi)用減少了40%,但一些內(nèi)部人士表示,這種吹噓行為過于夸張。
早在DeepMind存在之前,谷歌就一直在使用算法來優(yōu)化其數(shù)據(jù)中心。一位谷歌的員工表示“他們只想擁有一些所謂的在Alphabet中有價(jià)值增值的Prso”。谷歌的母公司Alphabet為這些服務(wù)支付了DeepMind費(fèi)用。2017年,DeepMind向Alphabet公司收取了5400萬英鎊。與DeepMind的管理費(fèi)用相比,這個(gè)數(shù)字相形見絀。而那一年,它僅在員工身上花費(fèi)了2億英鎊??偟膩碚f,DeepMind在2017年損失了2.82億英鎊。
這對(duì)現(xiàn)金充裕的巨人來說雖然微不足道,但其他出現(xiàn)赤字的子公司卻引起了Alphabet的首席財(cái)務(wù)官Ruth Porat的注意。作為互聯(lián)網(wǎng)服務(wù)提供商的谷歌光纖(Google Fibre)就陷入了財(cái)務(wù)困境,因?yàn)槠涿鞔_表示需要數(shù)十年之后才能獲得投資回報(bào)。私下里人工智能研究人員都知道DeepMind最后是否會(huì)成為獨(dú)立的公司。
DeepMind在人工智能推進(jìn)方面很謹(jǐn)慎,這是其管理戰(zhàn)略的一部分,這也向當(dāng)權(quán)者表明了其聲譽(yù)價(jià)值。在谷歌被指控侵犯用戶隱私和傳播假新聞的時(shí)候,這一點(diǎn)特別有價(jià)值。
DeepMind也很幸運(yùn)能夠獲得最高級(jí)別的認(rèn)可——Larry Page,他是谷歌兩位創(chuàng)始人之一,現(xiàn)在是Alphabet的首席執(zhí)行官。Page是Hassabis唯一的交集可能就是 Page的父親Carl在20世紀(jì)60年代研究過神經(jīng)網(wǎng)絡(luò)。Page表示在他的職業(yè)生涯早期,他就是為了建立一家人工智能公司而建立的谷歌。
DeepMind對(duì)發(fā)刊管理的嚴(yán)格控制并不符合公司普遍存在的學(xué)術(shù)精神。一些研究人員抱怨說,發(fā)表他們的作品很困難:他們必須先進(jìn)行內(nèi)部審批,然后才能將工作提交給會(huì)議和期刊。
DeepMind認(rèn)為,它需要謹(jǐn)慎行事,以避免嚇跑公眾,并破壞AGI的前景。但過于緊張可能會(huì)開始惡化學(xué)術(shù)氛圍并削弱員工的忠誠度。在谷歌收購之后的第五年,誰控制DeepMind的問題顯得至關(guān)重要。
該公司的創(chuàng)始人和早期員工即將獲得分紅,他們可以通過收購獲得的經(jīng)濟(jì)補(bǔ)償離開(Hassabis的股票價(jià)值約為1億英鎊)。但一位與該公司關(guān)系密切的消息人士表示,Alphabet已將創(chuàng)始人的收益發(fā)放推遲了兩年。鑒于此,Hassabis不太可能跳槽。
他只對(duì)金錢感興趣,因?yàn)殄X可以幫助他實(shí)現(xiàn)自己的人生。但是有些同事已經(jīng)離開了,自2019年初以來,已有三名AI工程師離職。全球最著名的安全工程師之一Ben Laurie現(xiàn)已返回其前任雇主谷歌。這個(gè)數(shù)字雖然很小,但DeepMind提供了如此寶貴且令人振奮的工作機(jī)會(huì)和豐厚的薪酬情況下,任何人其實(shí)都應(yīng)該不會(huì)離職的。
直至目前,谷歌都沒有過于干涉DeepMind。但近期的一件事情使人們開始懷疑DeepMind還能保持多久的獨(dú)立性。
03
DeepMind遭遇瓶頸
DeepMind一直計(jì)劃使用AI來改善醫(yī)療保健。2016年2月,它成立了一個(gè)新部門:DeepMind Health。該部門由該公司的聯(lián)合創(chuàng)始人之一Mustafa Suleyman領(lǐng)導(dǎo)。Suleyman的母親曾是一位NHS護(hù)士。他希望創(chuàng)建一個(gè)名為Streams的程序,當(dāng)患者的健康狀況惡化時(shí),該程序會(huì)警告醫(yī)生。
DeepMind從中獲得基于程序效果分成的費(fèi)用。由于這項(xiàng)工作需要訪問有關(guān)患者的敏感信息,Suleyman建立了一個(gè)由英國醫(yī)療保健與科技行業(yè)精英組成的獨(dú)立審查小組(IRP)。DeepMind這樣謹(jǐn)慎行事是非常明智的——英國信息專員隨后發(fā)現(xiàn)其中一家合作醫(yī)院違反了處理患者數(shù)據(jù)的法律。盡管如此,截至2017年底,Suleyman已與四家大型NHS醫(yī)院簽署了協(xié)議。
2018年11月8日,谷歌宣布創(chuàng)建了自己的醫(yī)療保健部門Google Health。五天后,又宣布DeepMind Health將被納入其母公司。
DeepMind似乎沒有收到什么預(yù)警。根據(jù)信息自由要求(Freedom of Information Act)所得到的信息,它僅提前三天向合作醫(yī)院發(fā)布了變更通知。DeepMind拒絕透露有關(guān)合并的討論是何時(shí)開始的,但表示從通知到發(fā)布正式公告如此短的實(shí)踐是為了保證信息透明度的。
Suleyman在2016年寫道:“在任何階段,患者數(shù)據(jù)都不會(huì)與谷歌的賬戶、產(chǎn)品或服務(wù)相關(guān)聯(lián)?!彼某兄Z似乎已被打破。(回應(yīng)1843雜志的問題,DeepMind說“在這個(gè)階段,我們的合同都沒有轉(zhuǎn)移到谷歌,而且只有得到我們合伙人的同意后他們才能轉(zhuǎn)移合同。Streams成為Google服務(wù)并不意味著患者數(shù)據(jù)......可被用于提供其他Google產(chǎn)品或服務(wù)?!埃?/p>
谷歌的吞并激怒了DeepMind Health的員工。據(jù)知情人員表示,一旦吞并完成,更多員工將計(jì)劃離開公司。IRP的一名成員Mike Bracken已經(jīng)離開Suleyman了。據(jù)多位知情人士透露,Bracken于2017年12月辭職,是因?yàn)閾?dān)心該獨(dú)立審查小組更多的是為了裝飾門面而并非真正為了應(yīng)對(duì)信息隱私方面的漏洞。
當(dāng)Bracken問Suleyman是否會(huì)給小組成員賦予非執(zhí)行董事的問責(zé)制和治理權(quán)時(shí),Suleyman發(fā)出了嘲笑。(DeepMind的一位發(fā)言人表示他們“并不記得存在”此事件)。IRP負(fù)責(zé)人Julian Huppert認(rèn)為,該小組的管理“比Bracken預(yù)期更為激進(jìn)”,因?yàn)槌蓡T能夠公開發(fā)言而不受保密義務(wù)的約束。
這一事件顯示DeepMind的外圍運(yùn)營容易受到谷歌的影響。DeepMind在一份聲明中表示,“我們都同意,將多方力量凝聚一起共同努力能夠增加資源?!边@就引出了一個(gè)問題,即Google是否會(huì)將相同的邏輯應(yīng)用于DeepMind的AGI工作。
大體上看,DeepMind看起來已經(jīng)取得了很大的進(jìn)步。它已經(jīng)搭建了可學(xué)習(xí)執(zhí)行超人類任務(wù)的軟件。Hassabis經(jīng)常引用Breakout,這是Atari游戲機(jī)上的視頻游戲。玩家控制一個(gè)可以在屏幕底部水平移動(dòng)小平板,用它將一個(gè)球反彈到懸停在屏幕上方的方塊,球撞擊到方塊時(shí)會(huì)摧毀它們。當(dāng)所有塊都被摧毀時(shí),玩家獲勝。
如果平板沒有接到球那么玩家就輸了。在沒有人工指導(dǎo)的情況下,DeepMind的程序不僅學(xué)會(huì)了玩這個(gè)游戲,而且還研究了如何將球反彈進(jìn)方塊背后的空間中,利用多次反彈來打破更多的方塊。Hassabis說,這證明了強(qiáng)化學(xué)習(xí)的力量和DeepMind計(jì)算機(jī)程序超越自然的能力。
這個(gè)演示非常令人驚訝,但Hassabis還是有所保留。如果虛擬平板略微往上移動(dòng)一點(diǎn)點(diǎn),程序就會(huì)失敗。DeepMind程序所學(xué)到的技能是如此受限制——它甚至無法對(duì)環(huán)境的微小變化(比人類走路時(shí)對(duì)環(huán)境產(chǎn)生的微小影響還小)作出反應(yīng)——至少在沒有數(shù)千輪強(qiáng)化學(xué)習(xí)的情況下既是如此。但是現(xiàn)實(shí)世界已經(jīng)內(nèi)置了這樣的應(yīng)對(duì)系統(tǒng)。
對(duì)于智能診斷來說,沒有兩個(gè)身體的器官是完全一樣的。對(duì)于智能機(jī)械,沒有兩個(gè)引擎可以以相同的方式進(jìn)行調(diào)整。因此,將在虛擬空間中完善的程序發(fā)布到現(xiàn)實(shí)世界其實(shí)充滿了困難。
DeepMind很少談到的第二個(gè)問題是,虛擬環(huán)境中的成功取決于獎(jiǎng)勵(lì)功能的存在:允許程序衡量其進(jìn)展的信號(hào)。該程序?qū)W習(xí)到,發(fā)射小球到方塊上方的空間使其多次反彈能夠使得分上升。DeepMind與AlphaGo的大部分工作在于構(gòu)建與這種復(fù)雜游戲兼容的獎(jiǎng)勵(lì)功能。不幸的是,現(xiàn)實(shí)世界并不提供如此簡單的獎(jiǎng)勵(lì)。
進(jìn)展很少能夠通過單一分?jǐn)?shù)來衡量。即使在存在此類度量的情況下,政治挑戰(zhàn)也會(huì)使問題復(fù)雜化。將氣候問題的獎(jiǎng)勵(lì)信號(hào)(大氣中每百萬的二氧化碳顆粒數(shù))與石油公司的獎(jiǎng)勵(lì)信號(hào)(股價(jià))相協(xié)調(diào),需要同時(shí)滿足許多有沖突動(dòng)機(jī)的人。獎(jiǎng)勵(lì)信號(hào)往往非常弱。在身臨其中時(shí),人類大腦基本無法接收任務(wù)成功度的直接反饋。
04
DeepMind的強(qiáng)化學(xué)習(xí)之路
DeepMind花費(fèi)了大量的計(jì)算機(jī)電力后找到了解決這個(gè)問題的方法。為學(xué)習(xí)任何東西,AlphaGo都需要數(shù)千年的人類游戲時(shí)間。很多AI研究者對(duì)此提出質(zhì)疑:這種解決方案是不可持續(xù)的。DeepMind承認(rèn)存在這種含糊之處。它最近專注于星際爭霸2,一款策略計(jì)算機(jī)游戲。
在游戲早期做出的決定會(huì)在后期產(chǎn)生影響,這更接近于那些類似許多現(xiàn)實(shí)世界任務(wù)的錯(cuò)綜復(fù)雜的延遲反饋。1月份,DeepMind軟件在一場(chǎng)演示中擊敗了一些世界頂級(jí)的人類玩家;雖然許多功能依然受到大量限制,但這仍然令人印象深刻。該程序也開始通過遵循人工任務(wù)主管的反饋來學(xué)習(xí)獎(jiǎng)勵(lì)功能。但是,將人類指令置于流程循環(huán)中可能會(huì)喪失無人計(jì)算機(jī)處理所帶來的規(guī)模與速度紅利。
DeepMind和谷歌的現(xiàn)任和前任研究人員(由于嚴(yán)格的保密協(xié)議而要求匿名)對(duì)于DeepMind通過這些方法達(dá)到AGI的可能性表示懷疑。這些人認(rèn)為,過于關(guān)乎在模擬環(huán)境中的優(yōu)秀表現(xiàn)使得獎(jiǎng)勵(lì)信號(hào)問題難以解決。然而,這種方法是DeepMind的核心。它有一個(gè)內(nèi)部排行榜,互相競(jìng)爭團(tuán)隊(duì)的程序爭奪對(duì)虛擬域的掌控。
Hassabis一直將生活視為一種游戲。他的職業(yè)生涯的很大一部分都致力于制作游戲,而他休閑時(shí)間的很大一部分都花在了打游戲上。DeepMind是他選擇開發(fā)AGI的工具。就像他的軟件一樣,Hassabis只能從他的經(jīng)歷中學(xué)習(xí)。
追求AGI可能最終會(huì)導(dǎo)致失去方向——即使他們已經(jīng)發(fā)明了一些有用的醫(yī)療技術(shù),還超越了世界上最偉大的棋盤游戲玩家。這些確實(shí)是重大成就,但并非他渴望達(dá)到的。但他仍然可以將AGI引入現(xiàn)實(shí)應(yīng)用——就在谷歌眼前卻遠(yuǎn)超其掌控。如果Demis Hassabis這樣做,他將贏得的是最艱難的比賽。
-
谷歌
+關(guān)注
關(guān)注
27文章
6164瀏覽量
105311 -
AI
+關(guān)注
關(guān)注
87文章
30763瀏覽量
268906 -
DeepMind
+關(guān)注
關(guān)注
0文章
130瀏覽量
10851
原文標(biāo)題:萬字長文解讀DeepMind與谷歌的AI拉鋸戰(zhàn)
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論