回顧性數據為臨床提供支持、推出標準數據庫,上市后臨床、技術黑箱、產品重大變更申報、中美審批差別,中國新一代醫療AI產品審批道阻且長。令人高興的是,標準測試數據庫正在建立,標準數據集(眼底部分)用時3個月就已經建設完成,部分企業很快將拿到中檢院出具的注冊檢驗結果。肺結節標準數據庫也已經啟動。
進入2018年,醫療人工智能行業的發展速度依舊迅猛。在第一季度,匯醫慧影、推想科技、深睿醫療、Airdoc、視見醫療等企業都宣布完成了新一輪的融資,金額幾乎都在億元級別。聯影也發布了自己的開放的智能AI平臺,全面滲透醫療AI領域。
據了解,雖然行業發展迅猛,但是有個問題一直制約著行業的發展,那就是國內還沒有一家公司的新一代醫療AI產品獲得醫療器械注冊證。這一方面是由于醫療AI作為一種全新的產品,擁有一定的智能,但是之前并無審批此類產品的經驗和標準數據庫。另一方面,國內醫療AI企業的產品還在打磨階段,醫療是一個嚴謹的行業,事關民眾安全。
值得說明的是,之前拿了認證的產品大多是基于之前CAD產品審批方式獲得的,與最近流行的新一代醫療AI產品有些不同(本文探討新一代醫療人工智能產品)。
沒有認證就沒有市場準入資質,雖然各個創業公司有自己合理合法的營收渠道和高額的融資,但是AI公司數據、人才、算力、運營成本昂貴,如果以醫療AI產品為主營業務的公司遲遲拿不到市場準入資質,那公司的長遠發展必將面臨挑戰。
利用深度學習技術研發的醫療AI產品為何拿不到認證,問題出在哪里,獲得認證還需要解決那些問題,各家醫療AI公司,監管部門等機構做了哪些準備,中美的審批有何區別。動脈網試著去解開這些謎題。
1、中國為什么不能像美國那樣發放認證
2018年4月初,FDA批準通過了IDx公司研發的首個應用于一線醫療的自主式人工智能診斷設備——IDx-DR 的軟件程序,它可以在無專業醫生參與的情況下,通過查看視網膜照片對糖尿病性視網膜病變進行診斷。
動脈網了解到,這個看似簡單的診斷,IDx 卻整整走了21年。IDx 是一家專注于開發臨床自主診斷算法的公司,單就和 FDA 在如何評估系統并確保其準確性和安全性方面的溝通,IDx就花了7年。
西門子醫學影像分析首席專家周少華博士曾向記者介紹,美國的監管體系是這樣的。
FDA分三類監管醫療設備,其根據是設備的可能使用及其給病人帶來的風險。第一類class I是低風險設備如醫用手套;第二類class II是中等風險設備如CT機;第三類class III是最高風險設備如支架。
Al影像系統有兩種:computer-aided detection (CADe) 和 computer-assisted diagnostic (CADx) 。CADe 用于檢測不正常狀況abnormalities,而CADx評估疾病的存在與否,如疾病的嚴重性、分類或預測。
FDA 對于監管CADe軟件有很多經驗,并提供510(k) 的指示標準,如何做臨床表現評價。但是,FDA歷來把CADx系統作為class III。
(510(k)文件是向FDA遞交的上市前申請文件,目的是證明申請上市的器械與不受上市前批準(PMA)影響的合法上市器械同樣安全有效,即為等價器械(substantially equivalent)。申請者必須把申請上市的器械與現在美國市場上一種或多種相似器械對比,得出并且支持等價器械的結論。)
但是據了解目前獲得FDA審批的醫療AI 產品多是走的class II。也就是說通過降低門檻來過審批。而中國從目前的情形來看是將新一代醫療AI定位為三類醫療器械,所以審批上會有不同。
2、建議各家公司考慮認證三類醫療器械
匯醫慧影聯合創始人郭娜表示,美國近期批復的幾款AI產品全都是走的ClassII的認證流程,通過跟傳統CDSS(臨床決策支持系統)做等同對比證明安全有效性。中國藥監局的法規相對來說更嚴格,對臨床評價的路徑控制非常嚴格,按目前法規,基本上國內的AI產品都得走臨床試驗這條評價路徑,耗時會比較長。目前藥監局沒有發出這種降低審批標準的信號,按新的分類目錄,直接給出診斷治療建議的輔助決策軟件都屬于三類,如果僅僅給出量化數值,像骨密度,那就是按二類醫療器械來管理,市場上大部分的AI產品都屬于三類。
雅森科技告訴動脈網,雖然經過近兩年的工作已取得了二類證,其仍在根據最新規定的變化在籌備三類證的許可。2017年9月4日,CFDA發布的新版《醫療器械分類目錄》醫用軟件中包含的輔助診斷,主要是針對之前已經出現的輔助診斷產品,比如CAD系統等。但這類并不包含自動診斷系統,對最近流行起來的人工智能軟件產品的界定并不完善。
這個分類目錄是相關部門根據之前輔助診斷類產品的分類、審批、發證的經驗和問題重新制定的。而對于新一代醫療人工智能產品,之前并沒有先例可尋。現階段雖然有人工智能公司申報藥監局認證,但是目前還沒有一家公司拿到三類醫療器械。
動脈網從各家公司了解到,目前雅森、匯醫慧影、推想、深睿、Airdoc、依圖醫療等幾個大公司都在積極進行三類醫療器械的申報。依圖醫療表示,他們的全產品矩陣都在做三類認證。另外,Airdoc送檢了中國第一臺裝載待檢人工智能AI軟件的服務器。
3、用于審批的標準數據庫正在逐步建立
醫療人工智能產品沒有獲得審批的一部分原因是用于審批的標準數據庫還在建設中。
由于各個地區、醫院的數據標準并不同。一家公司在北京兩家大醫院做的臨床實驗即使完美,但是并不代表產品可以在某縣級醫院中使用,甚至由于過擬合的現象,導致在其他醫院無法使用。而如何驗證醫療AI產品的魯棒性(普遍適應性),建立標準測試數據庫是現階段監管部門正在做的事情。
目前的標準測試數據庫建設是按照病種進行的。據中檢院官方微信發布的信息顯示,2018年3月26日,標準測試數據集(眼底部分)建設完成。肺結節的標準數據庫建設方案也已經定稿,近期就可以建設完成。
動脈網與企業交流和統計了解到,目前行業內有9家公司參與了標準測試數據庫的建設。以肺影像為例,肺結節圖像數據采集將不少于5家醫院,每家企業2000張,圖像采集設備統一為GE,西門子等大廠商符合DICOM3.0協議標準圖像,必須取得倫理委員會許可使用。采取二輪背對背主治醫師標定方式。預計圖像數量超過1萬例。
某從事眼底糖網病研究,并參與中檢院眼底數據庫建設的醫療AI公司告訴動脈網,他們很快將拿到中檢院出具的注冊檢驗結果。
參與標準測試數據庫建設的第二軍醫大學長征醫院影像醫學與核醫學科主任劉士遠介紹,標準測試數據庫建設為了保證公平性,使建立的數據庫能夠得到大多數企業和機構的認可,在建設過程中會遵循以下三個原則:
第一是廣泛性,數據要來自全國各地不同的醫院,不能只局限于北上廣深這些大城市的醫學數據。
第二是兼容性,以肺部圖像為例,目前建立標準測試數據庫的時候會考慮不同層厚的CT圖像,有5毫米圖像,也有1-2毫米圖像,甚至亞毫米圖像。
第三是醫學圖像的標記要標準化。劉士遠教授表示,搜集一定數量的圖像并不難,難的是為數據打標簽。從事標準測試數據庫標注的醫生都是從做過醫療AI研究的醫生中招募。招募以后按照標準的標注方案對醫生進行培訓,然后再去標注。最終形成沒有公司痕跡、沒有機器痕跡的標準檢測數據庫。
4、重新定義重大變更來解決快速迭代問題
醫療AI產品面臨一個情況,就是產品性能,算法模型,應用界面都會快速更新,這種情況下,傳統增項或者升級審批,顯然無法滿足行業的發展需要。
如果新的認證規則沒有出現,按照傳統的審批流程,醫療影像AI產品迭代周期是3-5天,企業每周都要去政府機構報備,企業和政府都會受不了。這種情況下難免會出現“偷懶”現象,企業雖然在不斷的更新系統,但是不按照正規程序報備,這是行業不愿意看到的現象。
華光創新(北京)技術服務有限公司副總經理索娜告訴動脈網,當前的審批技術指導原則給出了一個明確的版本命名的舉例。一般命名為S、Y、Z、B四個代碼,S指重大增強,Y指輕微增強,Z指糾正更新和構建,B指輕微的缺陷修補。如果是S、Y、Z發生變化,需要注冊的變更,如果是B發生變更,這是不需要修補的。企業可以依照這樣的規則,命名自己的表更,來適應法規的要求,從而不被頻繁的變更所累。
我們認為,這個問題的核心是重大變更的定義。我們沿用重大變更需要報備的傳統,但是把重大變更做一下規范。
第一,數據庫的變更。如果產品的數據庫出現10%-20%(具體規范沒有出來以前這個數字尚不確定)的變更,那么研究結果出來以后,企業可以去相關部門報備,提出變更需求;
第二,算法的變更。如果算法框架變化,那就可以提出變更請求。目前很多企業的算法都是基于開源的算法進行優化升級得到的,為了做好本地化也包含有一些前處理軟件等周邊系統。由于算法的變更很難量化,目前這一條還在商討之中。
5、人工智能的技術黑箱問題有待進一步商榷
經常在一些場合聽到,深度學習技術存在黑箱的嫌疑,輸入與輸出結果之間原因無法解釋,而按照科學論證的觀念,存在技術黑箱的話在認證過程中會相對困難一些。
目前國內很多公司用的是國際上開源的技術,國內一些優秀的人工智能公司是可以解釋其中的一些原理,一共用了多少層,每層在做什么。但是相當一部分公司還不具備這樣的能力,這也可以從側面看到同行之間的一些差距。
索娜表示,沒有建立審查指導原則的產品主要依靠主審人員個人的知識和監管部門組成的專家委員會的經驗知識對產品進行技術審評,主要審查產品安全性和可靠性。
我們認為,審批部門并不一定要特別在意這個問題,但是企業要做好回答的準備。對于傳統的軟件系統,質監部門也沒有要求必須把每一步都要講清楚,質檢部門優先考慮的是安全和有效。質檢部門摸清技術原理是為了確定黑盒測試的方案,所以企業要知道如何回答相關問題。
6、除了標準數據庫外,還需要注意的幾個問題
是否可以考慮先上市后臨床
目前大多數醫療人工智能公司的發展都卡在了審批這個地方。醫療軟件注冊審批的流程大概是這樣的:
從這個流程圖,我們可以看到,在獲得藥監局認證之前,要先獲得體系認證,體系認證需要3-6個月。三類醫療器械認證需要2-3年,在審批之前要等到標準數據庫的建立,數據庫的建立需要一定的周期。
以糖網為例,2017年12月24日,中檢院官方微信公眾號公布關于召開AI標準測試數據集(眼底部分)建設會議通知,2018年3月26日,中檢院官方微信公眾號公布,標準測試數據集(眼底部分)建設完成,一個病種共花費了3個月的時間。從中檢院的官微發布的信息推測,他們是按照病種進行來建立數據庫,與 FDA 在如何評估系統并確保其準確性和安全性方面的溝通,IDx就花了7年時間相比,審批部門的速度已經非常快了(中間還有一個春節)。
但是每個公司涉及的病種一般在10個左右,算上臨床實驗的時間,審批的過程在3-4年的時間。這個過程是由于醫療和AI本身的嚴謹、安全性質決定的,這是審批機構和企業無法改變的現實。可是又有多少企業可以等待這么長時間呢?我們是否可以考慮一種新的市場準入方式?
為了企業和行業的持續發展,在保證安全性和穩定性的前提下,是否可以學習藥企走先上市后臨床審批的方式,讓行業先發展起來。
(廣義上講,藥物上市后所開展的所有臨床研究均稱為上市后研究,狹義講,上市后臨床研究是由生產企業、醫療機構或社會團體自行組織與藥品有關的應用研究。)
回顧性數據為臨床提供支持
動脈網了解到,根據數據收集方式,我們可以將臨床研究分為前瞻性數據收集的研究和回顧性數據收集研究。所謂前瞻性數據收集的研究就是指預先制定研究方案,并且根據研究方案收集未來的數據。回顧性數據收集的研究則是指制定研究方案后,回顧性地收集過去的數據。換而言之,二者的區別主要在于到底手機的是將來的數據還是過去的數據。前瞻性數據收集研究的優點是能較好地控制的數據質量,研究的說服力強,缺點是研究產出周期較長,花費較高;回顧性數據收集研究的優點是研究產出周期短,且花費極低。
目前,我們走的是前瞻性研究,為了鼓勵行業發展,當一些產品比如眼底、肺結節醫療AI產品獲批后,其他產品采用回顧性研究,為臨床提供支持,減少企業在臨床審批過程中的時間和費用。
企業要多與監管部門溝通
醫療人工智能智能行業是一個新興行業,很多規范沒有形成不可避免,很多企業也才剛剛成立2-3年的時間,大家也不必急功近利,醫療本就是一個慢行業,企業和監管機構都要慢慢熟悉行業規則,這畢竟是前無古人的行業。
在這個過程中,企業要積極與質控部門聯系,雙方要深入溝通,互相了解需求,盡快做出成熟的方案,以便行政部門做決策。
評論
查看更多