近日,中美科學家研發出一種預測分析模型,可以在感染初期判斷出哪些新冠肺炎患者會轉為重癥,準確率高達70~80%。
這項研究于30日發表在《Comouters,Materials&Continua》雜志上,論文題目為《基于數據預測新冠肺炎患者臨床嚴重程度的一種人工智能框架(Towards an Artificial Intelligence Framework for Data-Driven Prediction of Coronavirus Clinical Severity)》
研究人員計劃將預測模型用于新冠肺炎患者的診斷過程,用其幫助醫生區分哪些病人需要入院治療、哪些病人可以居家觀察,從而節省醫療資源。
一、新冠肺炎病程發展難以預料
新冠病毒肺炎的臨床軌跡與多種其他類型的肺炎都不相同。
在感染初期,患者的癥狀比較輕微,僅會咳嗽、發燒和偶發呼吸困難。約20%的患者會在5~8天后癥狀加重,出現呼吸困難、肺炎等癥狀,甚至會發展為急性呼吸窘迫癥候群(ARDS),面臨死亡風險。
對于這部分重癥病人來說,氧氣供應至關重要。患者需要長時間使用呼吸機,甚至要用到體外膜肺氧合技術(Extracorporeal Membrane Oxygenation,ECMO)來維持生命。
在這種情況下,醫院能否在短時間內把病人分流就成為爭取治療時間、節省醫療資源的關鍵。
然而,到目前為止,對新冠肺炎病程發展的預測模型還沒有建立起來,可供進一步研究的公共患者信息數據庫也尚屬空白。在臨床中,醫生不得不在缺乏經驗的情況下艱難抉擇。
二、采用AI技術,準確率高達70~80%
為了解決病毒感染早期輕重癥病人難以區分的問題,紐約大學格羅斯曼醫學院(NTU Grossman School of Medicine)、紐約大學克朗數學研究所(Courant Institute of Mathematical Sciences)、溫州市中心醫院及蒼南縣人民醫院的研究人員利用人工智能技術,設計出了一個新冠肺炎病情預測模型。
這個預測模型可以在感染初期判斷出病人是否可能發展為重癥患者。在經過對少量數據的學習后,預測準確率最高可達80%。
1、決策樹+隨機森林+支持向量機
利用人工智能技術解決醫學難題已經不是新聞。如果運用得當,AI技術可以幫助醫生做出臨床決策。例如,人工智能工具可以通過分析視網膜圖像預測心臟病發作風險,對埃博拉患者進行風險評級、為肺結核患者做胸透,或者是給癌癥患者拍攝X光圖像。
在對新冠肺炎病情預測工具的研究中,研究人員用到了決策樹、隨機森林和支持向量機這三種機器學習模型。
論文中指出,相比于傳統的邏輯回歸模型,上述三種模型的預測更加準確。
首先,這三種方法可以更熟練地處理病程早期的小數據集或不平衡數據集,也可以處理疾病數據分析中不可線性分離的數據。也就是說,預測模型可以在發病早期就做出預測,而不需要依靠全面、完整的數據集。
其次,預測模型也避免了對單一生物標記或實驗室環境的依賴。為了使預測結果可靠,模型匯集了一組通用預測因子。
另外,預測分析模型的決策閾值是在訓練過程中自動確定的,而邏輯回歸方法的決策閾值需要手動設定。
2、53位患者參與實驗,預測準確率高至70~80%
根據論文,本項研究用到了53位病人的數據。這些病人曾在溫州市中心醫院和蒼南縣人民醫院就診,目前已經全部出院。
溫州市中心醫院和蒼南縣人民醫院的醫生提供了病人的病例,病例內容包括既往病史、診斷過程中的臨床、實驗室和放射學特征。此外,醫生還記錄了病人采取的治療措施(如抗病毒藥物、皮質類固醇、抗生素、免疫球蛋白的使用情況)。
根據記錄,患者平均年齡43歲,其中男性3人、女性20人,少數病患在染病后一周內出現了包括肺炎在內的嚴重癥狀。
研究過程中,病人數據被輸入計算機模型。模型會利用決策樹方法來跟蹤不同的選項,并推測出每一個選擇之下的潛在后果。
通過對比預測結果和53位患者實際的病情發展情況,研究人員發現模型預測準確率達到了70~80%。這就說明該預測模型可以在保證較高準確率的前提下幫助醫生區分“患病”和“非患病”病人。
三、模型發現病情發展新指標
除了達到較高的準確率,預測模型還找出了與病情嚴重程度更相關的三個指標。
此前醫生在臨床診斷中,通常借助胸部X射線計算機斷層成像顯示毛玻璃樣、發燒、咳嗽和淋巴細胞減少等癥狀來做出判斷。但是,預測分析模型結果顯示這些指標的準確性并不高。
論文中寫道:“機器學習顯示出預測ARDS最準確的特征并不是臨床醫生標準化選擇的指標,也不是這些值的嚴重異常。”
根據模型預測結果,最具預測性的特征是:轉氨酶(aminotransferase,ALT)水平、肌痛和較高的血紅蛋白水平。
模型分析結果顯示,新冠肺炎患者的ALT水平有不明顯升高,但其與病情嚴重程度相關度很高,居于各種指標首位。
肌痛通常不被認為能夠反映疾病嚴重程度,但它可能說明了其他的指標沒有反映出的體內大面積炎癥和異常細胞因子反應。
此外,血紅蛋白水平越高,預后越差。研究人員推測這是由于血紅蛋白與其他因素之間的相關性。
這項研究結果為之后醫生進行臨床診斷指出了新的關注方向。
結語:訓練量少,仍待研究
盡管預測分析模型取得了較高的準確率,但是它也存在許多缺陷。
論文中寫道:“研究僅用到了53名患者的數據,其中還有一些人的數據并不完整,癥狀嚴重程度也比較有限。”
同時,研究人員也強調預測模型應當被用于輔助決策,而不是取代醫生做臨床診斷。“我們的目標并不是創建一個黑匣子來取代臨床推理,而是創建一個能夠提供洞察力的模型。”
為了達到這一目的,研究人員稱將在之后進行深入研究與驗證,“使用更多數據對模型進行進一步改造,增強其預測能力,使其成為一個有用的工具。”
關注微信公眾號(kjxw001)及微博(中國科技新聞網)

