許田,遺傳學家,生長調控領域的主要創始人,西湖大學教授,美國耶魯大學兼職教授。當生物醫學遇到人工智能會發生什么事情?許田教授認為,生物醫學+人工智能,這將是人類歷史上,最猛烈的一次科技革命。這可能要徹底改變所有人的生活和命運,回避不掉。
本次許田教授代表西湖大學到貴陽參加未來杯 AI 挑戰賽啟動儀式暨未來科技主題講座,發表了《生命科學與人工智能》的主題演講。
許田:今天,非常榮幸到貴州師范大學來跟大家見面。過去二十五年,我在耶魯大學上課都是用英文的,這是第一次因為能夠到這里來用中文講學。我剛剛把耶魯大學的教職辭掉了,加入了西湖大學(籌)。
今天,來跟大家討論這個題目,就是當生物醫學遇到人工智能會發生什么事情?
我們先來看一看,喬布斯臨終遺言,跟他的兒子講說“你要學一點生物醫學”。為什么?我們來看看,這是2000年的時候,法國的經濟學家總結科技和經濟和社會發展的關系。你看到了什么呢?看到了在人類近代歷史上,人類社會有一波又一波的科技革命來推動社會的變化。從1771年瑞秋歐可萊在英國紡織推動工業革命開始,然后奔馳的汽車、石油工業,到現在標志的計算機革命。我們現在聽到的看到的都是計算機革命,微軟、谷歌、阿里巴巴都是。為什么?這些在改變我們的生活,改變我們的生命。那么下一波是什么?下一波就是生物科技。1976年兩位科學家發明基因克隆開始標志著生物科技革命的開始。所有的這些科技革命都有個特點,三十年緩慢的孵化,三十年以后快速推動經濟發展和社會發展。大概六十年左右,這個技術已經老化,已經不大產生新的推動力了,沒有例外。那么計算機的話大概還有十到十五年是快速的。
生物科技已經過了三十年的緩慢增長期,進入了十年的快速增長期。再下一波革命是什么?再下一波革命就是以深度學習為標志的人工智能。已經從八十年代初開始三十年,正好你們可以看到現在開始熱門起來。特別是當這兩波科技革命連到一起的時候,生物醫學和人工智能連到一起的時候,這個力量是無與倫比的力量。
大家可能都知道,深度學習已經把圍棋冠軍給打敗了。我最早關注深度學習人工智能的事情是在2012年,當時美國的新聞報道斯坦福大學教授做了新的計算機,自己可以學習認識到一只貓。當時我一聽,覺得這簡直是最激動人心的事情。雖然我是搞生物的,沒有學過計算機,數學基礎也很差,但我覺得這是我一定要做的東西,所以重新回去學數學,學計算機。學下來的結果,我跟大家分享一下,是不是因為深度學習打敗了圍棋世界冠軍,是因為它算得快,是因為它容量打,不完全是這個原因。因為要能夠完全計算的話,要圍棋窮盡計算法的話,要10的10萬次方,我們的宇宙最多是10的80次方左右。有了徹底的改變。因為現在深度學習這個東西,更像人的智能了。
我們來看看怎么回事。現在深度學習人工智能是模擬了哺乳動物視神經系統處理信息的方法。哺乳動物怎么處理信息?當一個光子打我們眼睛上的時候,在我們的視網膜上投視,視網膜上有幾層神經細胞,最后面的神經細胞接受光子的信號,然后把這個信號傳到二級神經細胞,成為雙級細胞,雙級細胞又把信號匯總傳到基細胞,然后才到腦子里面。這個過程是信息簡化的過程,合并簡化,不是把所有光子的信息直接傳到大腦,要不然太多了,而是在視網膜的地方就處理信息,然后往后傳。這個處理信息的方法,以及這些神經細胞連接的權重的改變還可以實現很多其他對信息的處理。比如說對重要信息的抽提,比如邊界效應,比如你看我這個衣服,這里都是黑的不太重要,哪里重要?黑的和襯衫的邊緣這非常重要,把這個邊界效應都提出來了,把重要的信息給提出來了。
所以在八十年代初,有計算機學家說,我們能不能把芯片按照視神經網絡的神經細胞的方法連接起來,看看能做什么事情。當時搞計算機的人不屑一顧,說解決不了問題。在2006年的時候杰弗瑞亨頓發表了一篇文章,他說把計算機按哺乳動物視神經連接起來的計算機芯片,能夠處理復雜信息,能夠簡化。所以這之后,最敏感的是谷歌。他們就用深度學習深神經網絡的方式來處理圖像。用計算機神經網絡怎么樣構建出來的?很簡單的話,可以說神經網絡或者是基點有一定的權重,可以用數學模型模仿出來。
但是,如果說這個計算機神經網絡非常復雜的話,沒有辦法用簡單的數學模型來模擬。這怎么做呢?
接下來就牽涉到另外一個重要的準則,人的智能的重要準則。我們來看看人的智能有幾個簡單的特性。哪幾個簡單特性?第一,要感知外面的信息,感覺到。第二,要能夠處理信息并進行學習。第三,要把學到的東西記住。第四,新的信息進來的時候,通過你學到的原則來處理新的信息進行判斷。這是人類智能的基本特征。這個基本特征還有幾個重要的過程,怎么來獲得?
第一,學習。第一類學習是叫知道學習。你小的時候開始老師告訴你一加一等于二,你就記住了,你也不問為什么,一加二等于三,做大量的練習來記住這個準則。你父母告訴你不要亂穿馬路,為什么,你就記住了,你穿馬路就撞死了,基因傳不下去,所以不穿馬路就記住了。這是什么,這是知道的學習。接下來,當你年紀比較大一點的時候,你開始自學。開始自己學習歸納出規律來,然后在實踐中不斷總結,說這個東西對不對,這是自己學習。在這個過程中,有知道的學習和自學的過程中,還有一個重要的原則就是獎懲原則,你學得對了得到獎勵。學校里面考試考得成績好了,父母給你做點好吃的,正好你加強了。你學得不對了,會受到懲罰。這是人類學習的基本準則。
要構造計算機神經網絡怎么做呢?一模一樣。第一,用大量的習題來練習、學習,然后用大量的數據來驗證學得對不對,學得對了,把這個傳輸固定下來,學得不對就改了,不斷地學習來構成神經網絡。最后,谷歌在2014年構建了24層的神經網絡來處理信息,開始圖像,當信息一層層傳上去的時候,邊界效應出來了。再往后傳,整個圖像出來。所以,谷歌發現用這個方法已經能夠打敗人的識別。
所以在這之后,馬上最敏感的產業界,IT屆現在蘋果手機就是用這個來識別。
可以看到,語音識別已經包括用來進行圖像識別的人臉識別等等。現在你們已經看到了許多應用,我今天來講講生物醫學的應用。
我們先是做什么?我們先是來研究出這個小寶寶(圖片),你們為什么覺得小寶寶很有吸引力。大家知道為什么小寶寶看起來就很有吸引力?我已經聽到有說眼睛比較大,非常對。小寶寶一定要長得有吸引力,大家才會保護,才會呵護,他才能有健康的環境成長。眼睛大,面孔上的比例眼睛大。可以看到迪士尼卡通片的藝術家們非常明白這個道理,卡通片里都是大眼睛。我們最可愛的國寶,也是有大眼睛。我們這里很多在座的,他也知道這個原理,眼睛要大的話就有吸引力。
我們研究生物體的尺寸。生物體所有的器官都有一定的尺寸,為什么?對它的功能非常重要。如果你兩條腿,一條腿,如果你撿一張紙板放在一條腿下,馬上感覺就不一樣。即使差別只有一厘米,影響都很大。發育過程中,怎么樣使兩條腿怎么樣一模一樣長,不一樣長,你就跑不快,在以前你就會被吃掉。你要追男女朋友的時候也追不上,以前就是用腿追的,現在是用智力來追了。生物學的問題,為什么長一模一樣長。
另外,看看在蕓蕓眾生,我們這個世界一眼望去都有不同的尺寸。螞蟻再給它吃也長不成大象。所以我們實驗室研究,到底什么生物學過程決定了它的尺寸?如果這些控制尺寸的基因生長找到了,如果這些基因突變,如果生長調控失調會怎么樣,就長腫瘤。這是我的一個學生和博士后,他們當時發現了調控這個東西是直接引起腫瘤的原因。
接下來,我講講,用識別圖像的神經網絡。另外還有一類神經網絡,來處理語言和信息文字。這兩類能不能利用到生物醫學上,圖象處理顯然能,眼睛的疾病也是圖象識別就可以了。但是絕大多數的生物醫學的信息并不是圖像。比如說基因的表達,分子,就不能用圖像識別和語言識別。怎么辦?最近我們實驗室有了突破,新的類的神經網絡可以來處理這些分子生物學的復雜信息。
我們建了一個,把兩萬個人的樣本,每一個樣本都有基本表達,有24000個基因表達,乘上2萬,這就是數據量。我們建立這個來進行訓練,想辦法要把人類基因表達的形狀能夠抽提出來,能夠簡化,能夠分析這個復雜數據。這個結果是非常成功的。
第一,這個神經網絡建了之后,它能不能有效還原這個數據?結果發現能夠。這是沒有發表的結果,希望大家也不要拍照,這都是沒有發表的。你可以看到它的還原結果非常好。
第二,如果說這個信息處理非常成功的話,那么如果一個樣本是從皮膚細胞來的,另一個樣本是從肝臟細胞來的,它應該能夠區別這兩者的差別。如果兩者都是從皮膚細胞來的,它們應該非常類似。當我們用神經網絡把這個信號變成三四維時,我們把它投影到二維圖像時,看到確實如此,一樣的組織來的細胞,同樣顏色,在同一個位置,不一樣的在不同位置。接下來我們問,能不能把癌癥細胞區別開來?確實如此,能夠區分開。
接下來,我們又做了什么?我們又做了,有指導的訓練,告訴他這是腫瘤,能夠做癌癥的鑒定。做出來的結果非常好,可以看到90%以上的準確度。這是非常厲害的。耶魯病理系的教授,十年工作經驗,對癌癥的診斷準確度大概80%。可以看到人工智能的力量是非常強的。
我們又另外做了一個東西,在其他的深度學習過程中,大家知道如果你能夠把前面訓練抽提特征的網跟后面的鑒定網連接起來,能從頭到尾不斷訓練的話,能更加提高準確度,我們如此做了,結果是更加的好,96%的準確度。這是我們現在稱為癌癥診斷的神經網絡。
稍微總結一下,我們發現了新的神經網絡可以來處理其他復雜的生物醫學大數據,以前沒有辦法用現在的方法來做的。人類基因組的基因表達神經網絡建起來的話,非常有用,對診斷癌癥有用,對其他的一系列診斷都有用。
跟大家講一下,這是我們基礎的研究。在應用方面,我講幾個案例。這是我們當年在我們實驗室解決了一個罕見病的致病原因以及信號轉導通導以及可能的治療藥物,這個病叫TSC。我這個朋友和他的孩子有這個病,在我們兩人住的鎮上建立了一個研究所,這個研究所想干什么?希望能夠把前沿的科學研究和產業結合起來,因為科學研究非常好非常前沿非常靈活,但它的缺點是目標性很差,做到哪里是哪里,發一篇文章算數。第二,團隊能力很差,聯合起來解決問題的動力沒有。這后面兩點恰恰是工業界的優勢。但是工業界對前沿對靈活很差,所以在這里,我們把它結合起來。這個結果是非常滿意的。其中一個,你們可能不大知道,在2003年時,非典大爆發時,我們說要來做點事情,當時我們想了各種各樣的辦法,其中一條我們找到計算機科學家一起討論時,他們說可以把計算機連接起來,共同來設計藥物。這實際上是2003年,實際上是云計算實踐的一個最早的案例之一。當時我們沒有申請專利,也沒有成立公司,因為這是非常緊急的事情。而且我們拿出一百萬美金懸賞,來解決問題。
其他還有什么?這個團隊研發出了世界第一臺測序儀。現在你聽到的基因測序產業以及用基因測序來進行研究,都是基于最早的這個測序儀。第二代測序儀也是我們研發的,這直接在半導體芯片上進行測序,不用拍照,DNA合成的時候不一樣,直接感受出來。這個意義非常重大,為什么?人類基因組計劃,15年時間,30億美元,全世界人來做,把它拼了一個人類基因組,但不是每個人的個人基因組的測序,怎么樣?應用不能應用,太貴了。現在的情況是,如果一輛寶馬車以前10萬美金能買一輛,那么現在這個價格是一美分就可以買一輛寶馬車。這是現在個人基因組測序的價格的改變,因為測序儀的發明。所以徹底改變了這個現狀,使測序技術可以在各方面進行應用。不單單在理論研究方面進行應用,而且產業化應用程了一個新興的產業。
這是2016年科學家到美國白宮授予科技獎,非常有幸我陪他一起去領獎。剛才提到我們的實驗室發現了TSC進行癌癥治療,他們發現有的病人有效,有的病人沒效。比如膀胱癌的病人里45人只有一個有效,美國提出這是神奇反應者。那時有測序儀了給他測序,發現他果然有TSC圖片。后來美國展開了測序計劃,奧巴馬提出要根據每個人基因表達不一樣來進行針對性的治療,這一定是未來生物醫學的方向。
接下來再來講講其他的。2013年我們就成立了公司,要來應用AI進行生物醫學的診斷和治療的應用。其中之一就是現在到醫院去,醫生用聽診器來聽,聽診器是兩百年前發明的技術,我們說這一定要改變。我們想做什么呢?我們想直接做一個成像儀,直接能夠看你有沒有感染,如果你頭暈,后面的腦血管有沒有堵塞,心臟有沒有問題。我們這個團隊做了一個高分辨的新型的超聲波芯片,手提的,直接連在手機上可以看可以診斷。這是人類第一款在手機上的健康產品。美國國家FDA去年年底批準上市。這也是第一款AI用于大健康的產品。為什么?首先它用來可以幫助你采樣。以前所有的醫學儀器怎么樣采樣,后面的頸動脈,角度不一樣拍出來的圖像不行,要有經驗,但我們可以用人工智能幫助你告訴你那個角度是對的。采完樣后要進行判斷,你有沒有疾病是不是正常,所以要深度學習,這是不是有疾病。這樣一來,徹底改變了醫學診斷。為什么?護士也可以用了,不一定要醫生。以前的醫生用這個超聲波要專門超聲波的醫生,其他的醫生看不懂。美國一百家醫院都用了這個儀器,他們感到非常激動,每個醫生自己可以看自己可以查。不單單醫生可以查,護士也可以查,不單單護士可以查,我們每個人自己都可以買一臺放在家里自己查,查出問題再去找醫生。2000美金一臺,徹底改變了。而且是遠程醫療,因為圖像可以傳過去,這是醫療的革命。
另外,我們還有一家公司,用人工智能是核磁共振。核磁共振儀非常貴,而且還不能有金屬,我們研發了一臺可移動的核磁共振儀,直接可以看。當然是人工智能來幫助診斷。
另外,研發藥物。這是爾摩定理。生物醫學研發藥物每年過去,錢又更加貴了,研發時間更加長了,現在是14年200億美元平均研發一個藥,太貴,時間太長,那就用人工智能。因為以前所有研發藥物都要一個個試,時間又長成本又貴,但是用人工智能的辦法,我們可以先進行學習和選擇。這個東西有可能有用,專門針對有可能有用的來做實驗,這個效果是非常驚人的。
這是我和我的朋友一起開的兩個公司,我們四年時間現在有四個藥在臨床進行二期和一期,非常驚人的速度和時間成本。這是一個案例。這個病人有淋巴癌,已經七次化療,醫生告訴他一共只有兩個月存活時間了。用了我們的藥之后,腫瘤全部消失。當你看到這樣的圖片時,你就知道這都是值的。不管你再辛苦,最大的滿足感,除了我上課之外,這是最大的滿足感。另外,我們公司剛剛找到一個新的藥可以治療漸凍癥,開始上臨床,非常可惜,霍金今年過世了,就是治療他這個病。非常可惜!但是告訴你們,人工智能非常強大。
另外,我和我的朋友有另外一個公司,今天我們在你們學校聽取了你們茶葉的基因組測序和大數據的分析,這是要來做天然產物,用人工智能做天然產物,然后研發藥物,也非常激動人心。
回過頭來講一講,人工智能為什么這么厲害?可以看到,知識競賽2012年就被人工智能打敗了,很容易解釋,搜集數據。2015年,人工智能團隊玩游戲也把人類打敗了。2016年AlphaGo也打敗了圍棋團隊。現在大家又興奮又有危機感。有沒有道理?完全有道理。可以看到,第一,深度學習的原理是模擬了人的大腦,這是通過幾億年進化過程中選出來的最厲害的計算機。這個路子對了,而不是靠計算機學家過去一小部分人拍腦袋拍出來的。第二,它的信息處理的方式也是跟人學習,它通過學習,就像我們人一樣。再來講講這個學習有什么不一樣呢?當時AlphaGo這個團隊打敗圍棋冠軍時我就去問他們學習怎么樣,因為我小時候下過圍棋。我下圍棋在嘉興圍棋隊時,一天最多訓練學習十盤圍棋,再下去不行了,腦子不夠用了。我問AlphaGo這個團隊,AlphaGo這個機器一天訓練多少盤棋,他說一百萬盤棋。怎么樣?這個學習的速度不可同日而語。所以開始的時候AlphaGo打敗歐洲圍棋冠軍時,李世石以及包括我們的聶衛平和馬曉春都說,這不在話下,歐洲的圍棋冠軍算什么,來跟世界圍棋冠軍差遠了。可是四個月后,把李世石打敗了。為什么?他以為四個月是很短的時間,他一天可以學一百萬盤棋,四個月的學習速度已經不可同日而語。這是第一。第二,我們的視神經網絡,最前面是三到四層,在這里處理。后面加上去大概就五六層。那么你看看谷歌的神經網絡,它2014年的時候24層,2015年60層,2016年的時候我問他們,大家猜猜多少層?1000層。怎么樣?我們肉體的進化是沒法達到這個速度的,說再加一個腦子也不行。它可以不單單突破,不單單學習速度不一樣,它物理的突破也可以,可以馬上增加。所以為什么這個東西特別厲害。
接下來,稍微講講我對未來的看法。霍金當時2014年寫了兩封公開信,呼吁人類應該終止深度學習人工智能方面的研究。為什么他寫了這兩封信呢?第一封他是和MIT的天文學家一起寫的,這個天文學家六個月后變成了我們公司的顧問,霍金非常憤怒,他自己年底再寫了一封信來呼吁這個東西。為什么?他認為這個東西是人類文明的終結者。這個態度你們已經知道了,我認為合理應用,所有人類的技術出來,從來沒有一次是放棄過的。技術本身無所謂好壞,怎么樣用才是核心。
當然,里面有很多非常有意思的問題。回過來看看,感知外界信息,處理信息,學習,記住學到的原則,然后用于新的信息,基本的人類智能的過程。但是我們還有其他很多復雜的人類智能的過程,要不要都研究?要不要都模擬?這是一個很大的問題。現在這個智能機器還是單功能的,專門來做一件事情,但是我們人是多功能的,很多事情都可以做,要不要研究多功能的?最后的話,要不要研究情感?我認為這個最好也不要研究也不要模擬,這太復雜了。可是后來我在做一個計劃,來做機器人醫生。我夫人就給我提出這是一個偽命題,因為醫生不單單要鑒定疾病,而且要跟病人沒有情感豈能做醫生,我說有道理,也要研究。但最終,自我意識要不要研究?要不要模擬?這是一個非常本質的問題。那么如果說我們研究出來說這個神經網絡是怎么樣來實現自我意識?這是一個非常有意思的東西。要不要模擬,我不知道,但是我們實驗室開始在研究什么樣的神經網絡能夠自我意識。
因為我的時間要到了,還有一分鐘,所以我跳過了幾張幻燈片。我講講一個信息,生物醫學+人工智能,這是人類歷史上以來最猛烈的一次科技革命,這是不得了的,這是要徹底天翻地覆,改變所有人的生活和命運的,逃不掉的,你回避都回避不掉。這是最猛烈的!怎么樣?投身到里面去進行研究,進行應用,甚至你覺得應該把它限制,你學哲學的也應該研究了解這個東西,因為這是最猛烈的一波科技革命。
最后,我來講講西湖大學。這是西湖大學新的校園,馬上就要開工。西湖大學是一所非營利的全新的研究性大學。西湖大學將會集社會的力量和政府的力量,一起來辦。歡迎大家來做學生,歡迎大家來做博士后,歡迎大家來應聘做教授,歡迎大家以各種各樣的方式來支持這樣一個新生的事情。四十年前,當中國開始走市場經濟的時候,第一家私有企業建立的時候,沒有人會認識到說今天中國天翻地覆的變化。是不是?五億人脫離貧困,整個經濟天翻地覆的變化。那么,我們希望西湖大學也是這樣一個好的開始。需要大家的支持和呵護,包括講好話,包括你有一塊錢也歡迎你們來捐贈,我們一定會把它用到最需要的學生身上。為什么?因為這是需要整個社會、政府以及大家一起支持來做的一件事情。另外,我們來做的話,怎么樣和其他的大學可能會不一樣,怎么樣做世界一流?比如說多學科的交叉,人工智能這個東西,計算機學家模擬了視神經網絡,相互學習產生了。但是老的 學校計算機系在一個地方,搞神經生物的在一個地方,很難進行交叉,但是西湖大學可以,因為我們是新的大學,因為我們從一開始就把整個設計使它們進行交流,可以看到讓不同學科的人每天有機會能夠碰到,每天有機會能夠進行交流。另外,我們也會想方設法在新的地方打破所有的壁壘,來使研究成果進行產業化轉化,來影響社會。但最終,能不能成功,需要大家一起來努力。
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238259
原文標題:遺傳學家許田:當生物醫學遇到AI
文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學術圈】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論