第一波 FDA 批準的可穿戴數字健康監測器與智能手表等消費產品相結合,才剛剛面世。醫療傳感器技術繼續快速發展,使緊湊、經濟且越來越精確的生理傳感器能夠進入現成的可穿戴設備。這種轉變的真正驅動因素之一是尖端機器學習和人工智能算法的可用性,這些算法可以從大量數據中提取和解釋有意義的信息。這包括噪聲數據和不太完美的信號(例如來自智能手表的 ECG 數據),這些信號被各種難以使用往往是確定性和基于規則的傳統算法處理的偽影破壞。
直到最近,解開來自這些傳感器的生理信號中的秘密以形成可接受的監管提交的合理準確的決策是具有挑戰性的,而且通常是不可能的。機器學習和人工智能算法的進步現在使工程師和科學家能夠克服許多這些挑戰。在本文中,我們將仔細研究用于處理生理信號的算法的整體架構,并揭開其操作的神秘面紗,將其轉變為經過數十年研究建立的更真實的工程。
為了說明簡單的機器學習算法的強大功能,這里有一個在線視頻,描述了來自活動跟蹤器中的加速度計的數據如何預測佩戴者的各種運動或休息狀態。我們可以將這種方法擴展到更復雜的現實世界醫學信號,例如心電圖,并開發可以自動將心電圖信號分類為正常或表現出心房顫動的算法。
開發機器學習算法包括兩個主要步驟(圖 1)。此工作流程的第一步是特征工程,其中從感興趣的數據集中提取某些數值/數學特征并將其呈現給后續步驟。第二步,將提取的特征輸入眾所周知的統計分類或回歸算法,例如支持向量機或適當配置的傳統神經網絡,以提出可用于新數據的訓練模型設置為預測。一旦使用具有良好代表性的標記數據集對該模型進行迭代訓練,直到達到令人滿意的準確性,它就可以在新的數據集上用作生產環境中的預測引擎。
圖 1. 包含訓練和測試階段的典型機器學習工作流程。
那么這個工作流程如何尋找心電圖信號分類問題呢?在本案例研究中,我們轉向2017 PhysioNet Challenge數據集,該數據集使用真實世界的單導聯心電圖數據。目的是將患者的 ECG 信號分類為以下四個類別之一:正常、心房顫動、其他節律和太嘈雜。在 MATLAB 中解決此問題的總體過程和各個步驟如圖 2 所示。
圖 2. 用于開發機器學習算法以對 ECG 信號進行分類的 MATLAB 工作流程。
預處理和特征工程
特征工程步驟可能是開發強大的機器學習算法中最難的部分。這樣的問題不能簡單地被視為“數據科學”問題,因為在探索解決這個問題的各種方法時,擁有生物醫學工程領域的知識來理解不同類型的生理信號和數據非常重要。MATLAB 等工具將數據分析和高級機器學習功能帶給領域專家,使他們能夠更輕松地將高級機器學習等“數據科學”功能應用于他們正在解決的問題,從而專注于特征工程。在這個例子中,
開發分類模型
Statistics and Machine Learning Toolbox 中的分類學習器應用程序對于剛接觸機器學習的工程師和科學家來說是一個特別有效的起點。在我們的示例中,一旦從信號中提取了足夠數量的有用且相關的特征,我們就會使用這個應用程序來快速探索各種分類器及其性能,并縮小我們進一步優化的選項。這些分類器包括決策樹、隨機森林、支持向量機和 K 近鄰 (KNN)。這些分類算法使您能夠嘗試各種策略并選擇為您的特征集提供最佳分類性能的策略(通常使用混淆矩陣或 ROC 曲線下面積等指標進行評估)。在我們的案例中,我們很快就在所有類別中達到了約 80% 的總體準確率,只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于特征工程和提取以及分類步驟結合在一個訓練步驟中的問題,盡管與傳統方法相比,這種方法通常需要更大的訓練數據集才能正常工作機器學習技術。只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于特征工程和提取以及分類步驟結合在一個訓練步驟中的問題,盡管與傳統方法相比,這種方法通常需要更大的訓練數據集才能正常工作機器學習技術。只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于特征工程和提取以及分類步驟結合在一個訓練步驟中的問題,盡管與傳統方法相比,這種方法通常需要更大的訓練數據集才能正常工作機器學習技術。因為我們的重點是驗證該方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于特征工程和提取以及分類步驟結合在一個訓練步驟中的問題,盡管與傳統方法相比,這種方法通常需要更大的訓練數據集才能正常工作機器學習技術。因為我們的重點是驗證該方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于特征工程和提取以及分類步驟結合在一個訓練步驟中的問題,盡管與傳統方法相比,這種方法通常需要更大的訓練數據集才能正常工作機器學習技術。
挑戰、法規和未來承諾
雖然許多常見的可穿戴設備還沒有完全準備好取代 FDA 批準和醫學驗證的同類設備,但所有技術和消費趨勢都強烈指向這個方向。FDA 開始在簡化法規和鼓勵監管科學的發展方面發揮積極作用,特別是通過數字健康軟件預認證計劃以及設備開發中的建模和模擬等舉措。
從日常使用的可穿戴設備收集的人體生理信號成為新的數字生物標志物,可以提供我們健康的全面圖片,這一愿景現在比以往任何時候都更加真實,這在很大程度上歸功于信號處理、機器學習和深度學習的進步算法。MATLAB 等工具支持的工作流程使醫療設備領域的專家能夠應用和利用機器學習等數據科學技術,而無需成為數據科學專家。
審核編輯:郭婷
-
機器學習
+關注
關注
66文章
8425瀏覽量
132776 -
可穿戴設備
+關注
關注
55文章
3817瀏覽量
167123 -
深度學習
+關注
關注
73文章
5507瀏覽量
121299
發布評論請先 登錄
相關推薦
評論