近來,微軟對于提示工程能力的最新研究1(鏈接詳見文末)再次吸引了一眾媒體的目光:“無需額外微調(diào)、無需專業(yè)策劃,僅憑提示GPT-4就能化身專家!”報道中這樣描述道2。
基于最新提示策略Medprompt,GPT-4在醫(yī)療專業(yè)領(lǐng)域MultiMed QA的九個測試集中,均取得最優(yōu)結(jié)果。不僅如此,在MedQA數(shù)據(jù)集(美國醫(yī)師執(zhí)照考試題)上,Medprompt還令GPT-4的準(zhǔn)確率首次超過了90%,超越了BioGPT和Med-PaLM等微調(diào)方法。
圖為Artificial Intuition作者Carlos E. Perez在社交媒體上坦言“出色的提示策略可以更勝微調(diào)一籌”,相關(guān)內(nèi)容還獲得沃頓商學(xué)院教授Ethan Mollick等的轉(zhuǎn)發(fā)
基于上述報道,全新AI技術(shù)對醫(yī)療領(lǐng)域的顛覆式影響可見一斑。事實上,早在ChatGPT發(fā)布之初,微軟創(chuàng)始人比爾·蓋茨(Bill Gates)就曾有言:以GPT為代表的技術(shù)革命將改變世界3。醫(yī)療健康作為現(xiàn)代社會中人類最關(guān)心的領(lǐng)域,必將出現(xiàn)革命性的變化,創(chuàng)新式技術(shù)、方法的不斷涌現(xiàn)將更有利于提高診療水平、降低疾病風(fēng)險、改善生活質(zhì)量。
對于技術(shù)之于醫(yī)療的關(guān)系,OpenAI創(chuàng)始人薩姆·奧爾特曼(Sam Altman)也曾表示——運用AI提高人類健康水平,將為全世界帶來巨大的益處。
但前進(jìn)之路并非坦途,AI醫(yī)療或?qū)⒚媾R多方考驗。本期專欄文章,我們基于《The AI Revolution in Medicine: GPT-4 and Beyond》(中譯版名為《超越想象的GPT醫(yī)療》)一書,探討AI大模型與未來醫(yī)療前景。
專欄導(dǎo)讀
“2023年是具有里程碑意義的一年。這一年,如同蒸汽機之于工業(yè)革命,人工智能已然成為顛覆世界的新生產(chǎn)范式。隨著Copilot時代的到來,AI工具躍升成為人們工作、生活不可或缺的部分,全面提升著全球生產(chǎn)力水平,為人類應(yīng)對那些最緊迫的挑戰(zhàn)提供著支持。
GPT技術(shù)的最新突破對醫(yī)療健康等領(lǐng)域產(chǎn)生了深遠(yuǎn)甚至顛覆性的影響,專業(yè)人士有必要抓住AI帶來的機會,獲得更高的效率,完成更有意義的工作。微軟希望通過持續(xù)創(chuàng)新,讓全球80億人都能夠享受到更加個性化的智能醫(yī)療服務(wù),讓不可能成為可能。”
張祺
微軟全球資深副總裁
當(dāng)AI與醫(yī)療相遇
?AI輔助醫(yī)療創(chuàng)意圖 由New Bing生成
當(dāng)AI與醫(yī)療相遇,究竟會發(fā)生什么?首先,讓我們一起看看來自《超越想象的GPT醫(yī)療》引言部分的一個GPT醫(yī)療場景。(*注:該示例并非現(xiàn)實,因GPT-4尚未在醫(yī)院中廣泛應(yīng)用,但所描述的情景完全符合OpenAI GPT-4系統(tǒng)的現(xiàn)有能力。)
圖為《超越想象的GPT醫(yī)療》中文版封面,該書的作者之一彼得·李(Peter Lee)系微軟全球資深副總裁,領(lǐng)導(dǎo)微軟研究院及新技術(shù)孵化業(yè)務(wù),包括如今快速發(fā)展的醫(yī)療和生命科學(xué)領(lǐng)域
患者的病情突然惡化。他的心率急速上升至每分鐘 160次以上,但血壓卻降至危險的80/50毫米汞柱。患者面龐蒼白,略帶青紫,并急促地喘息著。然而,這并不像是他患有的囊性纖維化的典型癥狀。作為二年級的醫(yī)學(xué)住院實習(xí)生,克里斯騰一邊撥打緊急號碼,一邊與其他團隊成員一起迅速采取行動,將一支又一支注射器插入患者的靜脈輸液器,試圖通過注入升壓藥物來提高血壓,但這并未奏效,用于增強心肌收縮力的藥物同樣沒有效果。
克里斯騰拿出手機,打開GPT-4應(yīng)用程序,說道:“患者胡安對血壓支持沒有反應(yīng)。他的病歷顯示,他最近接受了諾氟沙星第二階段研究引發(fā)的血液感染治療。我不知道發(fā)生了什么,也不知道怎么辦。”
▲AI輔助醫(yī)療創(chuàng)意圖 Getty
GPT-4回復(fù): “胡安所使用的實驗性抗生素與5% 的患者白細(xì)胞減少有關(guān),這一結(jié)論源于最近發(fā)表的一篇第二階段研究論文。在過去兩天內(nèi),他的白細(xì)胞計數(shù)在連續(xù)三次抽血檢測中呈下降趨勢。研究發(fā)現(xiàn),G-CSF(粒細(xì)胞集落刺激因子) 在恢復(fù)白細(xì)胞數(shù)量方面具有很好的效果。這是一個值得考慮的策略。”
克里斯騰立刻明白了其中的意思,由于胡安的白細(xì)胞減少,他變得易感染,導(dǎo)致了敗血癥的發(fā)生。她致電藥房,要求發(fā)送一劑 G-CSF 輸注液,同時準(zhǔn)備詳細(xì)核查這項新研究結(jié)果,對GPT-4說:“讓我看看那篇第二階段研究報告。”
研究概述和相關(guān)論文都出現(xiàn)在她的手機屏幕上,她請求GPT-4 為她概括這些信息。果然,感染病學(xué)雜志上的報道印證了 AI所言,并且最新的實驗室數(shù)據(jù)顯示,患者的白細(xì)胞數(shù)量甚至低于她在接觸化療的時候。克里斯騰實施了輸注,看著胡安被送往了重癥監(jiān)護(hù)室。
她對GPT-4說道:“給他注射了 G-CSF,希望能見效。”
▲AI輔助醫(yī)療創(chuàng)意圖 Getty
GPT-4回應(yīng)道: “面對患者病情如此迅速地惡化,確實壓力很大。先前的研究表明,在其他患者中也觀察到類似的狀況,而且G-CSF 的療效始終穩(wěn)定。請放心,你已竭盡所能,你的團隊會與你同在。”
她對著手機說:“胡安需要更換一種更昂貴的抗生素。我得向他的保險公司申請預(yù)先授權(quán)。請幫我寫一段理由,我將把它填入表格中。”
“好的。”幾秒鐘后,一段300 字的文本出現(xiàn)在她的手機屏幕上,這是為保險公司預(yù)授權(quán)申請表格而準(zhǔn)備的。文本概述了胡安曾使用過的所有其他抗生素及其對這些藥物的耐藥性記錄。同時,它簡要介紹了關(guān)于他所需的新抗生素的7項研究,并估計了如果保險無法支付這種藥物的費用,可能導(dǎo)致的因長期住院而產(chǎn)生的翻倍費用。
“請將這段文字和預(yù)授權(quán)表格的鏈接發(fā)送至我的收件箱,”克里斯騰邊走邊說,走向下一個患者。
摘自《超越想象的GPT醫(yī)療》
在這個虛擬案例中,GPT-4 可以根據(jù)可靠的信息來源回答患者或?qū)I(yè)人士的醫(yī)學(xué)問題;能運用自然語言生成技術(shù)從醫(yī)療記錄或文獻(xiàn)中提煉摘要或報告;還能借助自然語言理解技術(shù)幫助醫(yī)護(hù)人員進(jìn)行臨床決策或記錄,減輕煩瑣的文書工作。
更讓人振奮的是,想象已經(jīng)照進(jìn)現(xiàn)實,這樣的故事正在真實上演4。
4歲男孩Alex在某次運動后,身體開始劇痛。Alex的母親Courtney在三年時間里帶他看了17名醫(yī)生,從牙科、兒科、骨科到各種專家,先后進(jìn)行了磁共振成像(MRI)等一系列檢查,但沒一個真正找出病因。
?
醫(yī)療創(chuàng)意圖 Getty
直到不抱太多希望的母親Courtney注冊了一個ChatGPT賬號,整個事件出現(xiàn)了180度大逆轉(zhuǎn)。Courtney將Alex的癥狀和MRI報告中的注釋一并輸入對話框,其中有一個細(xì)節(jié),就是Alex無法完成盤腿坐的動作。ChatGPT給出了診斷——脊髓栓系綜合征(TCS)。
Courtney帶著這一結(jié)論和Alex的MRI報告,找到了神經(jīng)外科醫(yī)生。這次終于找對了人,神外醫(yī)生看了一眼MRI就給出了和ChatGPT一樣的結(jié)論,并指出了栓系的具體位置!后來Alex接受了手術(shù)治療,目前正在進(jìn)行康復(fù)。
在上述的兩個案例中,GPT-4似乎擁有異常豐富的醫(yī)學(xué)知識,或許有不少讀者會心存疑慮,GPT-4真有這么厲害嗎?
就GPT-4目前的表現(xiàn)看來,它,確實強大得令人驚嘆。
3大技能疊加
AI能力實測
技能1:學(xué)富五車,無所不知
在醫(yī)療領(lǐng)域應(yīng)用大模型前,我們首先感興趣的是,大模型的醫(yī)學(xué)知識是否足夠。美國職業(yè)醫(yī)師資格考試是美國醫(yī)學(xué)界對具有執(zhí)業(yè)醫(yī)師資格的醫(yī)學(xué)生和畢業(yè)生進(jìn)行的一種標(biāo)準(zhǔn)化考試,通過考試后,才可以獲得在美國執(zhí)業(yè)的資格。當(dāng)使用一整套美國職業(yè)醫(yī)師資格考試問題對GPT-4進(jìn)行測試時,GPT-4的正確率超過90%。作為目前最先進(jìn)的大模型代表,雖然GPT-4并非專門為醫(yī)學(xué)領(lǐng)域打造,但其展現(xiàn)出的醫(yī)學(xué)知識能力已經(jīng)非常出色,將大模型應(yīng)用于醫(yī)療領(lǐng)域讓許多人非常看好。
技能2:醫(yī)護(hù)人員的智能助手
在傳統(tǒng)醫(yī)療健康領(lǐng)域,醫(yī)護(hù)人員和患者是該領(lǐng)域中的兩個重要組成部分。對醫(yī)護(hù)人員來說,大模型是一種能夠與人合作、提升工作效率的智能助手。
大模型擁有強大的自然語言處理能力,借助語音識別等技術(shù),能夠根據(jù)醫(yī)生和患者之間的交流,自動幫助醫(yī)生生成電子健康記錄,以及填寫保險的事前授權(quán)等,把醫(yī)生從這些繁瑣的工作中解放出來。這具有十分重要的現(xiàn)實意義,使得醫(yī)護(hù)人員有更多的時間用于關(guān)愛患者,從而在親自從事護(hù)理時獲得更高的成就感。在治療方面,大模型可以幫助醫(yī)生對病人的病歷和醫(yī)學(xué)數(shù)據(jù)進(jìn)行更加全面和深入的分析,給出相應(yīng)的治療建議,幫助醫(yī)生制定更加精準(zhǔn)的治療方案,提高醫(yī)生的診斷水平和治療效果。
技能3:患者的超級醫(yī)療顧問
對于患者來說,大模型可以作為高級的醫(yī)學(xué)知識搜索引擎,充當(dāng)患者的超級醫(yī)療顧問。當(dāng)今全球有一半的人口,約40億人缺乏足夠的醫(yī)療保健服務(wù)(書中第119頁),AI大模型豐富的醫(yī)學(xué)知識,在很大程度上可以填補醫(yī)療保健服務(wù)的空白,這對于偏遠(yuǎn)貧窮地區(qū)的人們格外重要,并能為貧窮人員節(jié)省許多就醫(yī)費用。
?
AI輔助醫(yī)療創(chuàng)意圖 Getty
同時,GPT-4等大模型本身具有強大的自然語音理解和對話能力,在和患者聊天的過程中,GPT-4不僅回答內(nèi)容條理清晰,還能對一些伴有主觀情緒的問題做出有效回復(fù),讓人感覺到它充滿同情心,能夠與患者共情。雖然大模型不是人,不具備人的情感,但能在一定程度上緩解、減輕患者的焦慮,這本身就具有十分重要的意義。
因此,微軟公司前副總裁格雷格·穆爾博士認(rèn)為,AI 醫(yī)學(xué)正朝著一個全新的醫(yī)療體系演進(jìn),在傳統(tǒng)的“醫(yī)生-患者”關(guān)系中引入AI實體,作為三角關(guān)系的第三支柱。不管是從醫(yī)生還是患者的角度,大模型都是一個全新的AI伙伴,能夠與人密切協(xié)作。
但是,不得不提的是,目前的AI遠(yuǎn)非完美,它既需要繼續(xù)學(xué)習(xí),也需要被有效監(jiān)管。
機遇與挑戰(zhàn)并存,
AI修煉還需“仁心”
首先,作為AI研究人員,我們需要思考的是,如何充分利用大模型的能力,來暢想和構(gòu)建未來的醫(yī)療。
生成式的大模型,并不總是提供真實的信息,因此需要對結(jié)果進(jìn)行仔細(xì)審查。醫(yī)療錯誤一直以來都是個頑固的問題,技術(shù)的進(jìn)步與危險錯誤信息的增加總是相伴相生,新技術(shù)的運用需要盡可能地避免加重這一問題。微軟總裁布拉德·史密斯在《工具,還是武器?》一書中提到,當(dāng)一個技術(shù)或工具能力非常強大時,它所帶來的幫助和危害同時也是巨大的。作為計算機科學(xué)的研究人員,需要始終考慮,如何以負(fù)責(zé)任、安全和有效的方式利用大模型。
正因為如此,微軟成立了專門的研究部門“人工智能道德委員會”,以保證人工智能技術(shù)和大模型應(yīng)用的公平性、可靠性和安全性。
在中文語境下,我們形容德才兼?zhèn)涞尼t(yī)者“妙手仁心”,AI想成為“妙手”或許不難,但要習(xí)得“仁心”卻任重道遠(yuǎn)。從臨床醫(yī)學(xué)的角度,應(yīng)用AI 大模型帶來的不可避免的問題在于,大模型缺乏一個明確的人來衡量價值體系,因此難以檢驗醫(yī)療過程中的人性化關(guān)懷。
?
AI輔助醫(yī)療創(chuàng)意圖 Getty
例如,大模型沒有明確指標(biāo)來表示,一位鋼琴家寧愿冒著死亡的風(fēng)險,也不愿因糖尿病引發(fā)的壞疽癥而截取手指。大模型的回答目前還無法周全考慮患者的偏好、價值觀、對風(fēng)險的態(tài)度以及人類的眾多偏見。縱然GPT-4能夠在執(zhí)業(yè)資格考試中取得優(yōu)異成績,但這是否就足以讓患者和醫(yī)生對大規(guī)模應(yīng)用GPT-4這樣的大模型感到安心?答案恐怕不盡如人意。
要讓大眾對大模型做出的醫(yī)療決策有足夠的信心,需要我們對大模型進(jìn)行更深入、更全面的研究和探索,需要我們對安全利用大模型有更深層的思考和更有效的掌控,只有這樣,最終大模型在醫(yī)療領(lǐng)域才能夠真正落地,造福人類。
問題重重,答案寥寥。如微軟(中國)公司首席技術(shù)官韋青所言,盡管當(dāng)下AI領(lǐng)域時有日新月異的突破,但是沒有答案的問題遠(yuǎn)多過有答案的問題。如何塑造我們的AI未來,以期實現(xiàn)單憑人類或AI無法實現(xiàn),而人類與AI結(jié)合卻可以完成的目標(biāo),達(dá)到更高的成就,是我們當(dāng)下需要重點思考和著手研究的問題。
LLM專欄作者:房磊
微軟(亞洲)互聯(lián)網(wǎng)工程院
高級研究員
[1]https://arxiv.org/pdf/2311.16452.pdf
[2]https://mp.weixin.qq.com/s/l5WJnpF9sY6htciztYUEnQ
[3]https://www.cnbc.com/2023/02/10/bill-gates-says-ai-like-chatgpt-is-the-most-important-innovation.html
[4]ChatGPT Diagnosed A Boy's Pain. 17 Doctors Over 3 Years Could Not (today.com)
本文為《AI觀察》專欄系列文章之一
專欄介紹:AI大航海時代,前沿技術(shù)無疑為行業(yè)革新、企業(yè)增長與創(chuàng)意變現(xiàn)提供了新機遇,一場創(chuàng)新模式的革命已如箭在弦,這正是我們策劃此專欄系列文章的初衷。在此,來自微軟(亞洲)互聯(lián)網(wǎng)工程院的首席應(yīng)用科學(xué)家以及高級、資深研究員們,將在系列專欄文章中分享他們對人工智能、大語言模型及其應(yīng)用領(lǐng)域如何實現(xiàn)技術(shù)賦能的洞察及前瞻。更多專欄內(nèi)容,敬請期待!
-
微軟
+關(guān)注
關(guān)注
4文章
6591瀏覽量
104032
原文標(biāo)題:AI觀察 | 今年最火的GPT-4,正在締造科幻版妙手仁心!
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論