中國醫生完成全球首個AI前瞻性隨機對照臨床試驗 能讓結腸鏡對腺瘤的檢出率增加近50%

在全世界新發癌症病例中,結直腸癌佔第三名,而死亡人數的佔比更是到達了第二名,僅次於“雙料第一”的肺癌。想要扭轉這個局面,除了注意預防,高風險人群定期的篩查也是很有必要的。

目前,結直腸癌篩查的金標準是結腸鏡檢查,在檢查過程中發現的癌前病變——腺瘤息肉可以在檢查的同時被切除,這降低了結直腸癌的發生率和死亡率。然而實際上,有高達27%的息肉都沒有被檢查出來,這可能是由於息肉較小、較隱蔽,或是醫生的個人原因造成的。雖然有研究顯示,在檢查中增加一位醫生可以增加息肉檢出率(PDR),但是這種策略是否也能同時增加腺瘤檢出率(ADR)還是不確定的,而ADR才是結腸鏡篩查的主要質量指標。

多一個醫生行不行不知道,但是多一個AI,說不定可以哦。

本月,在胃腸病學領域的頂尖期刊Gut上,來自四川省人民醫院的劉曉崗主任帶領團隊,與哈佛醫學院貝斯以色列女執事醫療中心的研究人員合作發表了一篇文章。

他們在一項前瞻性隨機對照臨床試驗發現,與標準結腸鏡相比,AI系統輔助的結腸鏡檢查,查出的ADR增加了近50%!每位患者檢出的平均腺瘤數也增加了,這主要是因為AI檢查出了更多的較小腺瘤。

這是全球首個使用「基於深度學習的計算機輔助檢測系統」的前瞻性隨機對照臨床試驗,輔助結腸鏡息肉檢查,具有開闢性的意義。

AI系統演算法架構

這項研究在四川省人民醫院進行,研究共納入1058例患者,他們被分為隨機分為2組,一組接受標準結腸鏡檢查(536例),另一組接受AI系統(實時自動息肉檢測系統)輔助的結腸鏡檢查(522例)。

在AI組中,結腸鏡連線到AI系統,監視器上會顯示用藍色空心框圈出的息肉位置,同時發出警報聲,醫生主要負責盯好監視器,在警報聲提示檢測到息肉時對息肉進行評估,判斷它是否是息肉,是否是腺瘤性息肉。

這次研究所用的AI系統是在深度學習架構上開發的,2018年,劉曉崗主任的團隊在《自然·生物醫學工程》雜誌上發表研究,介紹了這個系統。系統的建立基於2007年-2015年間,1290名患者的5545張結腸鏡檢查影象,其中有3634張是檢查出息肉的。

AI系統可以在不同的光線條件下對不同形狀的息肉進行檢測

研究人員共使用了4個數據集對這個系統的識別能力進行了驗證。資料集1和2使用的是結腸鏡檢查影象,其中系統的敏感性可達到94.38%,特異性達到95.92%,受試者工作特徵曲線下面積(AUROC)為0.984(評價統計模型預測準確性的指標,越接近1,說明準確性越高)。

與1和2不同,資料集3和4使用的不是檢查影象,而是檢查視訊,資料集3是包含息肉的檢查錄影片段,4則是經多名專家確認無息肉的患者的全部檢查錄影。從靜態到動態,這對於系統來說無疑是增加了難度,但另一方面,這種檢驗也更加貼近實際的臨床應用。

結果依然沒有讓研究人員失望,資料集3中視訊的逐幀敏感性仍能達到91.64%,而對息肉檢查的敏感性更是達到了100%!資料集4的特異性也高達95.40%。

而且,通過多執行緒處理系統,AI對實時視訊的處理速度能夠達到每秒至少25幀,延遲時間為76.80±5.60毫秒,可以說是將影象實時輸出了,不會影響醫生的操作。總的來說,就兩個字:優秀。

在這些結果的加持下,研究人員開展了這次臨床試驗,我們可以從幾個角度來評價。從檢查所需時間上來說,AI組所需的時間為6.89分鐘,僅比對照組的標準結腸鏡組長0.5分鐘,也都沒有出現與腸鏡檢查相關的併發症。

從息肉的檢查結果上來說,兩組共檢出了767個息肉,其中有422個腺瘤,對照組和AI組的PDR分別為0.29和0.45,差距明顯。在檢測出腺瘤的患者中,對照組和AI組檢測到的平均腺瘤數分別為0.31和0.53,ADR分別為0.20和0.29,增加了45%。兩組間的差距主要是由於AI組檢測出的小腺瘤較多(185 vs. 102),較大腺瘤的檢出數量雖然也有差距,但是不具有統計學意義。

腺瘤性息肉癌變的過程

看來,AI組在正面結果的對比上還是展現了優勢的,那麼負面結果,也就是漏檢和錯檢的結果如何呢?經過研究人員的統計,AI系統一共有39次錯誤警報,平均到每次結腸鏡檢查上大約是0.075次,錯誤率還是比較低的,而且也沒有出現漏檢。

Comments

comments

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *