2024 Volume 66 Issue 7 Pages 1547
【目的と方法】白色光内視鏡(WLE)と非拡大NBIで表在性食道扁平上皮癌(SCC)と前癌病変(IEN)を検出する人工知能(AI)システムを用いて,中国12病院で多施設ランダム化比較試験を行った.対象はスクリーニング,消化器症状,サーベイランスのために上部消化管内視鏡(EGD)を受けた患者で,AI優先群とルーチン優先群に無作為割り付された(1:1).患者は同日に2回EGDを受け,AI優先群はAI補助あり→補助なし,ルーチン優先群は補助なし→補助ありで行った.観察は挿入時WLE,抜去時非拡大NBI.主要アウトカムはSCC/IEN見逃し率(病変ごと,患者ごと,per-protocol).
【結果】AI優先群5,934例,ルーチン優先群5,912例が登録され,5,865例と5,850例が解析された.病変当たりの見逃し率はAI優先群で1.7%(2/118,95%CI;0.0-4.0),ルーチン優先群6.7%(6/90,95%CI;1.5-11.8)であった(リスク比0.25,95%CI;0.06-1.08,p=0.079).1人当たりの見逃し率はAI群で1.9%(2/106,95%CI;0.0-4.5),ルーチン優先群で5.1%(4/79,95%CI;0.2-9.9)(リスク比0.37,95%CI;0.08-1.71,p=0.40).
【解釈】SCC/IENの病変当たり・患者当たりの見逃し率に対するAI支援効果は統計学的には有意でなかったが,負の効果がなく実質的な利益が得られている.実臨床におけるこのAIシステムの有効性と費用対効果はさらに評価が必要である.
静止画・動画を用いた複数の前臨床研究 2)によって,SCC/IEN検出AI内視鏡診断補助システムの有用性が報告されてきたが,本研究は世界で初めての実臨床の大規模RCTである.使用されたAIはENDOANGEL(Xiamen lnnovision Medical Technology, Xiamen, China)で,リアルタイムに病変を拾い上げ,probability scoreを表示する.登録患者の95%以上が食道癌高危険群ではなく,全11,715名中SCC/IENは185名(208病変)であった.対象SCC/IENが少ない中で,病変当たりの見逃し率がAI優先群でリスク比0.25(95%CI;0.06-1.08,p=0.079)であったことから,AI補助によって実質的な利益が得られたとする筆者らの解釈は許容できる.しかしながら,患者当たりではAI優先群はリスク比0.37(95%CI;0.08-1.71,p=0.40)であり,実臨床における有用性は未だ証明されたとは言えないだろう.本研究では使用したAIの診断特異度などの精度が示されておらず,またAIシステムの診断を内視鏡医がどのように利用したのかも示されていない.今後,内視鏡医とAIの相互作用も含めた実臨床でのAI内視鏡の有効性に関する検討が更に必要である.