由中國人工智能學(xué)會主辦,廣州易間網(wǎng)絡(luò)科技有限公司承辦的2018第八屆中國智能產(chǎn)業(yè)高峰論壇11 月17-18日在成都完美收官,論壇在兩天的會議里帶來了多場精彩報告。
此次小編為大家整理的是來自清華大學(xué)電子工程系副主任吳及主題為《知識與智能——從醫(yī)考引擎走向智慧醫(yī)療》的精彩演講。
吳及
清華大學(xué)電子工程系副主任
以下內(nèi)容根據(jù)速記進(jìn)行整理
經(jīng)過吳及本人校對
本次論壇覆蓋到了人工智能+的幾個方面,包括智慧醫(yī)療、智慧金融、智慧司法和商業(yè)智能。我的題目《知識與智能》是借了論壇的名字,很高興有機(jī)會介紹一些我們的工作和思考。
人工智能第三次浪潮大家很熟悉,有一個標(biāo)志性的事件就是AlphaGO,通過一系列的人機(jī)對決,人們終于認(rèn)識到在圍棋這個領(lǐng)域,人已經(jīng)不是機(jī)器的對手。不管以前大家怎么樣去看待個圍棋,計算機(jī)的獲勝最終證明圍棋就是一個計算問題。AlphaGO采用的主要策略包括蒙特卡洛搜索樹、策略網(wǎng)絡(luò)、價值網(wǎng)絡(luò),采用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。Deepmind在強(qiáng)化學(xué)習(xí)上下了很多功夫,在很大程度上推進(jìn)這方面的研究。
人工智能不僅能下圍棋,還能玩游戲。這是一個彈球游戲,看機(jī)器達(dá)到了什么樣的水平?如果擋板能擋住小球,反彈起來就可以繼續(xù)得分,次數(shù)越多,得到的分?jǐn)?shù)就越高。迭代次數(shù)越多表現(xiàn)越好,擋板的移動速度越來越快,預(yù)測越來越準(zhǔn)確。而到600輪迭代后,就從量變產(chǎn)生了質(zhì)變。人工智能系統(tǒng)找到一個有效的策略,把球彈到上面,在上面不斷的得分,只要不掉下來,下面的板根本不用動。每次小球從上面掉下來時,它就試圖把這個球反彈到上面去,經(jīng)過600輪迭代優(yōu)化實(shí)現(xiàn)了這個能力,這是典型的強(qiáng)化學(xué)習(xí)。在這樣的學(xué)習(xí)過程中,其唯一需要就是游戲規(guī)則,規(guī)則決定只要不把這個球漏掉,只要不斷反彈就可以不斷得分,于是它就學(xué)習(xí)到了這個策略。在這個游戲中,人工智能系統(tǒng)進(jìn)行600次迭代用不很長時間,然后就可以把游戲玩得這么好;而人類,無論哪個游戲高手想在短時間內(nèi)練到這個水平,都是很困難的。
Deepmind寫了篇論文,發(fā)表在Nature上,題目就是《機(jī)器掌握下圍棋的游戲不需要人類知識》。實(shí)際上他們確實(shí)做到,不需要任何知識,只是通過機(jī)器的自我學(xué)習(xí),機(jī)器在圍棋上已經(jīng)超過所有下圍棋的人類高手。我舉這個例子,實(shí)際上是提出了一個問題,就是從實(shí)現(xiàn)人工智能的角度,知識有沒有用,有多大用?這在學(xué)術(shù)上其實(shí)有不同的觀點(diǎn),并不是很一致。有人認(rèn)為有數(shù)據(jù)就夠了,也有人認(rèn)為有數(shù)據(jù)加一小部分知識就夠了,也有可能像我們今天這個論壇,在座的大部分人可能都認(rèn)為知識很重要。
舉一個例子。假設(shè)有兩個人在聊天,第一個人和第二個人說我想上廁所,第二個人說街角有個肯德基。大家都不難明白他想表達(dá)的是什么意思。但是如果我們不具備生活常識,假設(shè)從宋代抓一個人來,他肯定理解不了。理解不僅依靠這句話本身,還需要有世界知識。想實(shí)現(xiàn)自然語言理解,很多時候只依靠自然語言的句子本身是做不到的,必須要有足夠的背景知識。
現(xiàn)在很流行穿越小說,但這真的只能當(dāng)小說讀。我們?nèi)绻岩粋€人扔到古代去,他可能連一天活不了,所以知識是非常重要的。人工智能本質(zhì)上就是一門關(guān)于知識的學(xué)科,涉及到怎樣表述知識、獲得知識和使用知識。我們這里討論知識與智能,相信在絕大多數(shù)實(shí)際生活的場景下,沒有知識就不會有智能。
自從AlphaGO的成功之后,人工智能有很多進(jìn)一步研究是關(guān)于考試的。日本國立情報學(xué)研究所和東京大學(xué)等機(jī)構(gòu)想合作研發(fā)一個高考機(jī)器人,目標(biāo)是2020年考上東京大學(xué)。它在2015、2016年兩次參加了日本的高考,分?jǐn)?shù)超過了日本高考學(xué)生平均成績,但是離考上東京大學(xué)還有很大差距。經(jīng)過兩年的嘗試,他們放棄了后續(xù)的嘗試。主要原因是,第二次參加考試比第一次只進(jìn)步了十幾分,有一些理解的問題并沒有有效的路徑去解決,因此放棄了考上東京大學(xué)的設(shè)想,轉(zhuǎn)而到工業(yè)界去尋找可能的應(yīng)用。
另一個例子是美國有一個研究所AI2,是由微軟的聯(lián)合創(chuàng)始人保羅·艾倫創(chuàng)辦的。他們嘗試做的一個工作,就是開發(fā)人工智能系統(tǒng)去參加美國中小學(xué)的生物考試。美國大學(xué)前教育是12年制,這個智能機(jī)器的水平,我們了解到的是已經(jīng)通過了四年級的考試,但還沒有通過八年級的考試。我國“863”計劃也有個項目是研究高考機(jī)器人,希望能在2020年考上清華大學(xué);中國成都的一個公司研發(fā)了名為“學(xué)霸君”的系統(tǒng),去年用高考的數(shù)學(xué)考試進(jìn)行了測試。
現(xiàn)在機(jī)器玩游戲的水平已經(jīng)很高,下圍棋人類已經(jīng)不是機(jī)器的對手,機(jī)器的下一個目標(biāo)就是在考試上挑戰(zhàn)人類。考試是以標(biāo)準(zhǔn)程序和方式考核學(xué)生特定范疇知識的方法,以往的考試都是面對人的。在很多應(yīng)用中,人和機(jī)器是相互協(xié)作的,我們在淘寶上買東西就是這樣,系統(tǒng)希望你有很好的購物體驗(yàn),你希望能順利買到滿意的商品,所以你們是完全的合作關(guān)系,目標(biāo)一致。但考試不是,考試是有限合作,考試要考出學(xué)生之間的差距來,要有區(qū)分度;而學(xué)生想盡量考出一個好成績。因此在考試這件事情上,人和AI是部分協(xié)作的關(guān)系。
我們前幾年開始進(jìn)入智慧醫(yī)療的領(lǐng)域,作為階段性的研究目標(biāo),想研發(fā)一個人工智能系統(tǒng)去參加國家執(zhí)業(yè)醫(yī)師考試。醫(yī)學(xué)考試的知識量非常大,我們當(dāng)時購買了大量的醫(yī)學(xué)教材。一個醫(yī)學(xué)院的學(xué)生在5~8年的學(xué)習(xí)過程中,有大量的知識需要學(xué)習(xí);而且僅有書本知識還不夠,任何一個只讀過書但沒有經(jīng)歷過臨床實(shí)踐鍛煉的醫(yī)生都不實(shí)際具備看病的能力。所以要成為合格的醫(yī)生既需要理論知識,又需要實(shí)踐經(jīng)驗(yàn)。國家執(zhí)業(yè)醫(yī)師考試是一個高利害的考試,在我國要想成為真正的醫(yī)生,就必須通過這個考試,否則就不具備行醫(yī)資格。這個考試分兩級四大類。考試分為臨床、中醫(yī)、口腔和衛(wèi)生四類。其中,70%的考生選擇臨床,臨床筆試覆蓋面非常寬,考試大綱里公布了2 700多個知識點(diǎn)。
國家執(zhí)業(yè)醫(yī)師考試的報考門檻是醫(yī)學(xué)本科畢業(yè)加上一年以上的臨床實(shí)踐,或者專科畢業(yè)加上兩年以上的臨床實(shí)踐,因此這個考試必須是學(xué)醫(yī)的人并且經(jīng)過實(shí)踐才可以參加,而且考試總的通過率并不高。當(dāng)然這里面差異也很大,比如北京協(xié)和,北醫(yī)畢業(yè)的學(xué)生通過率應(yīng)該在99%以上,但是從全中國的范圍來看,通過這個考試對很多人來說,難度是挺大的。這也反映了中國優(yōu)質(zhì)醫(yī)療資源的緊缺和分布上的極不平衡。
國家執(zhí)業(yè)醫(yī)師考試的形式是兩天四場,每場150道題,時間是150分鐘。國家醫(yī)學(xué)考試中心這個機(jī)構(gòu),最重要的任務(wù)就是出考題組織各種醫(yī)學(xué)方面的考試。一個上崗的醫(yī)生是否合格,對社會和老百姓太重要了,如果我們的醫(yī)學(xué)水平不夠,那我們實(shí)際上都很危險。國家執(zhí)業(yè)醫(yī)師考試的考題分為兩類,一類是知識題,需要理解掌握醫(yī)學(xué)知識;另一類是案例題,題目就是一個實(shí)際的案例,一個什么樣的病人出現(xiàn)了什么樣的癥狀,問你應(yīng)該怎么診斷怎么治療。這類考題的比例,從這幾年的趨勢來講是越來越高了,現(xiàn)在臨床執(zhí)業(yè)醫(yī)生考試中案例題已經(jīng)超過了50%。我們可以把這個考試任務(wù)同機(jī)器閱讀的一個著名任務(wù)SQuAD做比較。SQuAD是斯坦福大學(xué)發(fā)布的一個機(jī)器閱讀任務(wù),現(xiàn)在有很多研究機(jī)構(gòu)經(jīng)常刷榜,誰的成績領(lǐng)先就可以證明自己的機(jī)器閱讀能力很不錯。這個任務(wù)和我們中小學(xué)做語文,英語的閱讀理解題一樣。回答這個題目所需要的知識都包含在這個文章里,并不需要額外的知識。只要閱讀理解能力夠,就可以通過閱讀文章來回答這些問題。這個任務(wù)就可以衡量機(jī)器對語言的理解能力。
但這個任務(wù)和國家執(zhí)業(yè)醫(yī)師考試是兩個完全不同的任務(wù),國家執(zhí)業(yè)醫(yī)師考試600道題,參加考試的人需要利用過去5年,8年,甚至10年學(xué)習(xí)到的理論知識和實(shí)踐經(jīng)驗(yàn)來做題。因此,如何讓機(jī)器具備學(xué)習(xí)掌握并且運(yùn)用知識來回答考題的能力,是這個任務(wù)最大的難點(diǎn)。具體來說就是兩個方面,一個是知識的表達(dá);一個是知識的推理。把電子文本存在計算機(jī)里,不叫做表達(dá),因?yàn)橛嬎銠C(jī)并沒有辦法直接使用;而讓機(jī)器來做推理更是非常困難的事情。很多人可能會有個疑問,大家每天都用搜索引擎,它的搜索能力那么強(qiáng),是不是做一個針對考題的搜索引擎就可以了?其實(shí)這是不行的,醫(yī)考?xì)v年的考題都是絕密,即使考試結(jié)束也不會有考題流出來。其次國家執(zhí)業(yè)醫(yī)師考試并不依賴與固定的題庫,每年國家醫(yī)學(xué)考試中心都要組織很多專家出題,為了出這600道考題,投入的時間精力都是非常驚人的。
知識圖譜方面已經(jīng)有很好的研究工作,在很多領(lǐng)域也發(fā)揮了很大的作用。但知識圖譜也存在一些不足,主要表現(xiàn)在它的描述能力有限,擴(kuò)展維護(hù)也比較困難。所以對醫(yī)學(xué)領(lǐng)域很多復(fù)雜知識,僅靠知識圖譜難以被有效描述。因?yàn)獒t(yī)生看病過程是一個過程性的事情。比如一個人感冒發(fā)燒,并不能確定就一定是上呼吸道感染。
在這個研究中,我們主要做了兩方面工作,一個是知識表達(dá);一個是知識運(yùn)用。知識表達(dá)主要有符號表達(dá)和向量表達(dá)兩種形式,符號表達(dá)容易人類理解;向量表達(dá)更利于機(jī)器計算。我們在表達(dá)方面做了兩個工作,現(xiàn)在流行的詞語義潛入(word embedding)是無監(jiān)督訓(xùn)練得到的,所以實(shí)際上有模糊性。我們一方面引入了詞的多語義表達(dá),另一方面把無監(jiān)督訓(xùn)練得到的表示向量作為種子,通過引入一些監(jiān)督來進(jìn)一步學(xué)習(xí)和調(diào)整。
在推理方面我們做了多尺度的推理,主要是三個層次,首先是點(diǎn)對點(diǎn),比如某些癥狀是某種疾病的金標(biāo)準(zhǔn),這樣就容易建立起來詞和詞之間的關(guān)系;而在很多時候一兩個詞不足以得到疾病的診斷,所以就要引入句子和段落層面的證據(jù),這個方法的基礎(chǔ)是雙向LSTM,然后我們疊加了雙路的注意力機(jī)制,一路是從證據(jù)看考題,一路是從考題看證據(jù),然后再連接池化層和決策層;還有一些醫(yī)學(xué)問題比較復(fù)雜,單個證據(jù)還沒有辦法證明什么是正確答案,因此我們把多個證據(jù)連接起來,選擇合適的部分和特征,去評估答案的正確性。
2017年8月27號我們研發(fā)的人工智能以系統(tǒng)參加了國家執(zhí)業(yè)醫(yī)師考試臨床筆試的測試。我們的人工智能系統(tǒng)跟與所有考生的考試過程完全同步,考生在全國各地的考場參加考試,我們的系統(tǒng)在國家醫(yī)學(xué)考試中心單獨(dú)設(shè)立的考場中參加考試。斷開互聯(lián)網(wǎng),全程監(jiān)控錄像,兩位國家醫(yī)學(xué)中心的監(jiān)考老師和兩名公證人員全程監(jiān)考,嚴(yán)格按照考試流程做。每一場考試,考生的時間是150分鐘,我們的系統(tǒng)都在不到18分鐘的時間內(nèi)完成了答題。去年11月公布成績,考試總分600分,及格線360分,我們的系統(tǒng)取得了456分的成績,百分位點(diǎn)是96.3%。不僅大幅超越及格線,而且超過96.3%的人類考生。
2018年10月,我們關(guān)于醫(yī)考引擎的學(xué)術(shù)論文發(fā)表在《自然.通訊》上,這是對我們學(xué)術(shù)成果的一個認(rèn)可。國內(nèi)外媒體的宣傳報道也很多,《麻省理工科技評論》2017年3月介紹了我們的工作,并在其6月主辦的創(chuàng)新科技香港峰會上邀請我作了報告。
考試以后,很多人都問我們,取得這么好的成績,是不是說今后機(jī)器人可以給人看病了。我說不能,千萬不要以為考試考得好就可以看病了,考試跟真正看病有很大差別,我們只不過是邁出了萬里長征第一步。
Gartner每年都會發(fā)布技術(shù)成熟度曲線,把技術(shù)的發(fā)展分為幾個階段,包括技術(shù)觸發(fā)、期望頂峰、幻滅低谷、緩慢復(fù)蘇、生產(chǎn)力成熟。我們實(shí)驗(yàn)室在語音識別方面做了很多年的工作,1998年在國家“863”計劃組織的語音識別測試中,我們對標(biāo)準(zhǔn)口音新聞的識別率就達(dá)到了94%。但如果把訊飛輸入法月活躍用戶過億作為語音識別技術(shù)進(jìn)入老百姓實(shí)際生活的標(biāo)志,這就要到2016年,兩者之間是18年。一個技術(shù)從開始的性能提升到最后實(shí)際應(yīng)用將是一個漫長的過程,技術(shù)的發(fā)展和成熟不可能一蹴而就。
我們最近啟動了一個國家研發(fā)計劃項目——大眾醫(yī)療健康醫(yī)學(xué)人工智能管理服務(wù)模式。智慧醫(yī)療不是一個單點(diǎn)技術(shù),而是涉及到整個體系的提升。在這個體系中,人工智能技術(shù)可以在各個層面發(fā)揮作用,幫助大家做健康管理,幫助大家做全科診斷,幫助大家做專科診療。前幾年衛(wèi)計委就提過要開展基層首診和雙向轉(zhuǎn)診,但在實(shí)踐中遇到了很大的困難,主要因?yàn)榛鶎幽芰Σ粔颍瑳]有高水平的全科大夫做首診。現(xiàn)在隨著人工智能技術(shù)的發(fā)展,讓我們看到這樣一種可能性,就是讓人工智能系統(tǒng)來幫助提升基層醫(yī)生的全科診斷能力。
這是我們做的另一個工作,是和北京大學(xué)口腔醫(yī)院合作的。在我國,中老年人群中缺牙是常見情況,可摘局部義齒是最常用的解決方案。但全國不同醫(yī)院在可摘局部義齒的方案設(shè)計上,水平差別很大。我們這個工作的目標(biāo),就是給定患者的口腔情況,我們的系統(tǒng)能夠自動設(shè)計出可摘局部義齒的方案來,希望起到拉高整體水平的作用。初步驗(yàn)證情況表明,在絕大多數(shù)情況下,我們給出的方案是可以直接使用,或者稍加修改就可以使用的;能夠幫助基層醫(yī)生設(shè)計出更合理的方案,也能提升高水平醫(yī)生的工作效率。
人工智能在醫(yī)學(xué)領(lǐng)域的推進(jìn),離不開知識有效表達(dá)和應(yīng)用。在很多領(lǐng)域都可以有大數(shù)據(jù),但在醫(yī)學(xué)領(lǐng)域的大多數(shù)場景,數(shù)據(jù)量都是不充分的。只能靠一部分的數(shù)據(jù)加上專家知識,協(xié)同起來推進(jìn)醫(yī)學(xué)人工智能的水平。醫(yī)療是及其復(fù)雜的領(lǐng)域,從健康,、亞健康、慢性病,到全科的診斷和專科的治療,每一種疾病的處理手段都不一樣,這方面的研究是一條漫長的道路,需要學(xué)者和研究機(jī)構(gòu)一起攜手才能往前推進(jìn)。在人工智能的發(fā)展道路上,知識是我們重要的力量源泉!
-
人工智能
+關(guān)注
關(guān)注
1791文章
47200瀏覽量
238270 -
智慧醫(yī)療
+關(guān)注
關(guān)注
9文章
1064瀏覽量
46480
原文標(biāo)題:CIIS2018演講實(shí)錄丨吳及:知識與智能——從醫(yī)考引擎走向智慧醫(yī)療
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論