GASTROENTEROLOGICAL ENDOSCOPY
Online ISSN : 1884-5738
Print ISSN : 0387-1207
ISSN-L : 0387-1207
ARTIFICIAL INTELLIGENCE FOR CANCER DETECTION OF THE UPPER GASTROINTESTINAL TRACT
Hideo SUZUKIYoshitaka TOKAIToshiyuki YOSHIOTomohiro TADA
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2021 Volume 63 Issue 8 Pages 1545-1554

Details
要旨

近年,人工知能(AI)が画像認識の分野で医師の役に立つことがわかってきたのは,深層学習(すなわちConvolutional Neural Network:CNN),高性能コンピュータ,そして大量のデジタルデータの3つの要素によるものである.消化器内視鏡分野では日本の内視鏡医は,胃がんや食道がんを検出するための世界初のCNNを基盤としたAIシステムの成果を生み出している.本研究では消化管がんに対するCNNを基盤としたAIに関する論文をレビューし,臨床現場におけるこの技術の将来性について考察する.AI技術のAIを基盤とした診断能力を取り入れることは,内視鏡医の診断能力や精度にばらつきがある早期消化管がんにおいて有益である可能性がある.AIは内視鏡医の専門性に加わることで内視鏡診断の精度を高めることになるだろう.

Ⅰ 序  論

1970年代以降,医療画像の解析には様々な手法が用いられてきた.中でも深層学習を用いた画像解析は,複雑な画像処理アルゴリズムを記述することなく病変画像を分類・認識するシステムを構築できることから,多くの分野で広く利用されている 1

大腸ポリープでは,検出,局在診断,区分などの深層学習アルゴリズムの開発により,多くの評価がなされている 2.カプセル内視鏡検査の分野でも複数の報告が出ている 3

本レビューでは消化管がんの検出に役立つ画期的なCNNを用いたAIの可能性を示す論文を分析している.消化管内視鏡診断の専門医の診断能力でさえもAIが凌駕する可能性を示唆する論文が発表されており,われわれはこれらの臨床現場への導入の将来像について考察した.

Ⅱ 胃がんの検出

胃がん検出のためのCNNを基盤としたAIの応用は2018年1月にHirasawaら 4によって初めて報告された(Figure 1).早期胃がんは背景胃粘膜の炎症の中に認められることが多く,内視鏡医が認識することは難しい.上部消化管内視鏡検査における胃がん検出の偽陰性率は4.6~25.8%と推定されており 5)~10,AIはこの問題を解決する可能性のあるツールである.Hirasawaらはティーチング画像として専門医が検証し病理学的に胃がんと診断された白色光イメージング(WLI),狭帯域イメージング(NBI),インジゴカルミンを用いた染色内視鏡の高解像度画像13,584枚を用意した.この中から胃がん検出のためのAIを開発した.77病変の胃がん2,296画像の検証では感度は92.2%であったが,陽性的中率は30.6%であった.これは胃炎の誤診や,胃角の屈曲を胃がんと誤認した結果であった.続いてIshiokaら 11がこのシステムを動画に適用したところ,静止画と同様であった(感度94.1%).

Figure 1 

AIによる早期胃がんの検出例.

a:胃炎に似ていて検出しにくい胃体部の早期胃がんの白色光画像.

b:人工知能(AI)ががんの疑いのある病変と認識された部分を青い四角で囲んで示している.数値はコンピュータ支援診断システムが算出した確率スコアを示す.

c:緑色の四角は,病理組織学的検査でがんと確認された領域である.緑色の四角の領域は,AIが示した青色の四角の領域とほぼ一致している.

AIによる胃がんの検出を検証した他の論文はWuら 12によって2019年に発表された.200枚の内視鏡画像を検証した後,彼らのAIシステムにおける胃がんの精度,感度,特異度はそれぞれ92.5%,94%,91%であったと報告している.Luoら 13は胃がんや食道がんを含む上部・下部消化管がんを検出する消化管AI診断システム(GRAIDS)を開発した.消化管がんの診断精度は多施設共同研究による7つのバリデーションセットを用いて91.5%から97.7%であった.GRAIDSは複数の施設で高い精度を示すことで強固な診断能力を証明した.これは内視鏡専門医(94.2%対94.5%)と同等の診断感度を達成し,上級医(85.8%)や研修医(72.2%)よりも優れていた.この論文ではAIを使用した場合,がん検出感度が専門医で98.4%,上級医で97.8%,研修医で96.4%と有意に上昇したことも報告されている.これはAIと内視鏡医の組み合わせの有効性を示唆している.

Ⅲ 胃がんの診断

疑わしい病変が検出された後,NBI拡大内視鏡検査による早期胃がんの診断はWLIよりも精度が高い 14.拡大NBIによるがん部と非がん部の識別に対するAIの有用性は複数の研究者によって報告されている 15)~17.胃がんの診断精度は84~96%であり,AIの潜在的な有用性が示唆されている.堀内ら 18は174本の動画を用いてNBI拡大内視鏡検査におけるAIの性能を検証した.胃がんの拡大NBI画像1,492枚と非胃がんの拡大NBI画像1,078枚を用いてトレーニングされたAIは,曲線下面積(AUC)0.8684を示した.精度,感度,特異度はそれぞれ85.1%,87.4%,82.8%であった.Horiuchiらはまた内視鏡専門医11人とAIの精度を比較したところ,AIは2人の専門医よりも有意に高く1人の専門医よりも有意に低く残りの8人の専門医と有意差がないことを明らかにした.

Ⅳ 胃がんの深部浸潤の分類に対するAI

AIによる胃がんの深部浸潤の予測はKubotaやZhuらによって開発された.344病変の胃がん画像を用いて,Kubotaら 19はT1,T2,T3,T4の精度がそれぞれ77%,49%,51%,55%であることを示した.しかし,根治的内視鏡切除で最も重要な基準の一つは腫瘍の深達度である.内視鏡的粘膜切除術による治癒的切除は,粘膜内がん(M)や粘膜下浸潤<500μm(SM1)のがんではしばしば達成されるが,浸潤が深い胃がんでは手術が必要となる.したがって,AIを支援する胃がんの治療方針決定には,T1,T2のようなステージ分類よりも詳細な分類が必要となる.Zhuらは彼らのシステムは進行胃がんを含むすべての胃がんからMまたはSM1とSM2の深さを鑑別できることを報告した 20.彼らのシステムの感度,特異度,精度はそれぞれ76.5%,95.6%,89.1%で,熟練した内視鏡医よりも有意に高かった.Nagaoら 21は動画から抽出した様々な角度からの画像を含むWLI 8,271枚,NBI 2,701枚,インジゴカルミン染色画像2,656枚を用いて,胃がんの深達度を識別するAIを構築した.WLIのAIシステムのAUCは0.9590であった.病変を基にしたWLIのAIシステムの感度,特異度,精度はそれぞれ84.4%,99.4%,94.5%であった.病変を基にしたNBIとインジゴカルミン染色のAIシステムの精度はそれぞれ94.3%と95.5%であった.AIは内視鏡治療方針の支援に活用できる可能性があった.

Ⅴ 胃がんと胃潰瘍の鑑別診断

AIはがん病変の検出には有効であったが,悪性病変と良性病変を正確に区別することができず,診断精度は不十分であった.この課題を解決するためにNamikawaら 22は胃がんとの鑑別が必要で非がん性胃病変を代表する一般的な疾患である胃潰瘍を診断するためのAIを開発した.AIは1万3,584枚の胃がん画像と4,826枚の胃潰瘍画像で学習させられた.胃がんと胃潰瘍を区別する感度,特異度,陽性的中率はそれぞれ99%,93.3%,92.5%であった.

Ⅵ 保存された内視鏡画像のダブルチェックの可能性

AIシステムには検出時間の優位性もある.Ikenoyamaら 23は2,940枚の画像から早期胃がんの画像209枚の検出時間はAIシステムと内視鏡医でそれぞれ45.5秒と173.0分であったと報告した.さらに,AIの感度は内視鏡医67人に対して26.5%の差(58.4%対31.9%)で高かった.AIの特異度は内視鏡医よりも低かったが,感度の高さと速さの利点を考慮すると,AIはがんの見落としを防ぐ目的で内視鏡後の画像のダブルチェックに使えるようになる可能性がある.

Ⅶ H. pylori感染の分類

人工知能はH. pylori感染の診断にも応用された.Shichijoら 24は,H. pylori陽性735例,H. pylori陰性1,015例の32,205枚の画像を用いて,H. pylori感染と非感染を区別するAIシステムを開発した.感度,特異度,精度はそれぞれ88.9%,87.4%,87.7%であった.また,Itohら 25は,AIが感度,特異度ともに86.7%でH. pylori胃炎を検出・診断できたことを報告した.NakashimaらはWLIの代わりにBlue Laser Imaging(BLI)やLinked Color Imaging(LCI)を用いることで,AIがより正確な判定を構築できたことを示した.H. pylori感染のROC-AUC値はWLIで0.66であったが,BLI-brightとLCIはそれぞれ0.96,0.95と有意に精度が高かった 26.これらの結果は熟練した内視鏡医のものよりも優れている.さらに,Shichijoらは,H. pylori除菌後だけではなくH. pylori未感染と現感染を識別するAIシステムを開発した.H. pylori陽性742例,H. pylori陰性3,649例,H. pylori除菌後845例の合計98,564枚の画像がティーチング画像として用いられ,独立した847例,23,699枚の画像で検証された.AIシステムの精度は陰性の診断で80%,除菌後の精度で84%,陽性の診断で48%であった 27.胃がんのリスク評価にはH. pyloriの有無が臨床的に重要であることから,AIは臨床利用で内視鏡医に卓越した情報を提供することになるだろう.

Ⅷ 胃の解剖学的部位の分類

AIは胃の解剖学的な部位も認識できる.Takiyamaら 28は,上部消化管を解剖学的に分類するAIシステムを開発した.胃上部,中部,下部,十二指腸のROC-AUC値は0.99であった.Wuら 29は,胃の位置をリアルタイムで判断し胃全体を網羅的に確認できるAIシステム「WISENSE」(現在は「ENDOANGEL」に名称変更)を開発した.彼らは324人の患者の臨床試験で胃内視鏡検査中にこのAIを使用した結果,死角が15%減少したと報告している.Chen DらはENDOANGEL 30を用いてAIの有無による上部消化管内視鏡検査の死角率を比較した別の臨床試験を実施した.追加効果はAIシステムを併用した従来の上部消化管内視鏡検査で最も高かった.

Ⅸ 人工知能の胃疾患への展望

上述したように,AIを基にした胃の検査は胃がんやH. pylori感染,解剖学的分類を実現できる.それはWLIだけでなく画像強調内視鏡への応用もできる.AIシステムの目標は診断の標準化と安全性に向けられている.AIは診断を見逃すことなく早期がんの発見のため,あらゆるレベルの内視鏡医を支援することができる.AIは不必要な生検や内視鏡的切除を減らすことができる光学的生検を可能にする可能性がある.それはまた,胃がん検診の分野での医師の負担軽減も期待されている.AIが支援する検診は,何万枚もの内視鏡画像をチェックする医師の負担を軽減し,計り知れないメリットをもたらすだろう.しかし,AIシステムを臨床応用するためには,より多くのエビデンスが必要である.研究の多くは日本や中国の研究機関からであり,静止画像や場合によっては動画を用いた後ろ向きであった.前向き臨床試験として実施された研究はわずかであった 30),31.胃領域でのAIシステムの利用は,これらのシステムが臨床現場での利用が可能であることを確認するために,動画を用いたさらなる臨床試験が必要である.

Ⅹ 咽頭がんの検出

咽頭がんは進行がんとして発見された場合,外科的切除や化学放射線療法を必要とするため,患者のQOLは著しく低下する.一方,早期に発見された表在性咽頭がん(SPC)では,内視鏡的粘膜下層剝離術(ESD)や内視鏡的粘膜切除術(EMR)などの口腔内局所切除術で治療が可能である 32)~34.しかし,咽頭がんの検出における技術は世界的には普及しておらず,SPCの効率的な検出システムも必要とされている.Tamashiroら 35は5,403枚の咽頭がんの画像を教育画像として用いた,SPCを検出するAIシステムを報告した.このシステムを用いることにより,小さなSPCを含む検証データセットからすべてのSPCの検出が可能であった.このAIシステムを用いることが,内視鏡医によるSPCの見落としを防ぐ一助となりえるだろう.

Ⅺ 食道扁平上皮がんの検出

食道扁平上皮がん(ESCC)において進行癌では予後不良であるが,早期に発見されれば治療成績は良好である 36)~41.しかし,従来の内視鏡検査,特にWLIではESCCの早期発見は困難である 42),43.表在がんの検出にはNBIやBLIなどの画像強調内視鏡がより有用である 44)~50.しかし,経験の浅い内視鏡医においては検出感度が53%と低く十分とは言えない 51

Horieら 52は,ESCCや食道腺がん(EAC)を含む食道がんを検出するためのCNNをベースにしたAIシステムを初めて報告した(Figure 2).このシステムは,症例の98%で正確にがんを検出し,1,118枚の画像を27秒で解析した.注目すべきことに,AI診断システムは10mm以下のすべての病変を検出できた.さらに,98%の精度で表在がんか進行がんかを特異的に診断することができた.Ohmoriら 53は非拡大内視鏡と拡大内視鏡の両方の画像を用いてESCCを検出・鑑別するCNNをベースにしたAIシステムを報告した.このAIシステムは非拡大内視鏡ではSCC検出において高い感度を示し,かつ拡大内視鏡では高い特異度を達成することにより,偽陽性を減少させた.このAIシステムと経験豊富な内視鏡医で診断能力の比較を行うと,両者間で有意差は認めなかった.Caiら 54も静止画におけるESCCを検出するためのAIシステムを報告している.ESCCの検出において,AIシステムと内視鏡医間での比較が行われ,経験の浅い内視鏡医はもちろん,熟練医よりも優れた感度・特異度を示した.興味深いことに,AIがESCCと診断した部位を四角い枠で画像上に示すことにより,内視鏡医によるESCCの検出感度が優位に改善した.Guoら 55は教育画像に静止画を,検証用画像に動画を用いた.動画データセットにおけるESCC検出の感度と特異度は,NBI画像とNBI併用拡大内視鏡の両方で100%であった.Tokaiらは,まずESCCを検出し,次にその病変の深達度を診断する,CNNをベースにしたAIシステムを報告した.深達度診断において,表在型ESCCのEP-SM1症例とSM2以深症例のWLI画像とNBI画像を対象に深達度診断能を検証した(Figure 3 56.まずESCCの検出に関しては,95.5%のESCCが検出可能であった.それらを対象とした深達度診断では,AIシステムの診断能力は13名の内視鏡専門医のうち最上位のAUC値より高い値を示した.この研究により,ESCCの検出に加え,深達度診断でもAIシステムが臨床応用できる可能性が示唆された.

Figure 2 

表在性食道扁平上皮がん(ESCC)の検出.

a,b:中部食道後壁にわずかな表面不整がある平坦な病変がある.CADシステムはこの病変を白色光内視鏡検査とNBIで白い四角でマーキングした.続いて侵襲深度はT1a-lamina propria (LPM)と診断された.その病理的侵襲深度はT1a-LPMである.この場合,CADシステムは高い確率スコアで病変を正確に検出し,深達度も診断した.

Figure 3 

表在性食道扁平上皮がん(ESCC)の進達度診断.

a,b:これはT1a-musculularis mucosa(MM)の症例である.AI診断システムでは,WLIとNBI画像で病変を検出し,同様に進達度をT1a-MMと診断した.

Ⅻ バレット食道における食道腺がんの検出

バレット食道は食道腺がん(EAC)発症の危険因子として知られている.EACの予後は診断時の病期と強く相関するため 57,バレット食道の内視鏡的サーベイランスが推奨されている 58)~60.しかしながら,サーベイランスを行う非専門医や一般の内視鏡医にとって高度異形成や早期EACの検出は依然困難とされる 61

Ebigboら 62は148枚のWLI画像と100枚の NBI画像で学習させた,早期EACを検出するAIシステムを構築した.92%の感度と100%の特異度を示し,内視鏡医の成績と比較を行ったところ,13人のうち11人より良い成績であった.この研究を基に,彼らは拡大内視鏡で癌を識別するリアルタイムAIシステムを構築した 63.このAIシステムは,感度83.7%,特異度100%で正常なバレット食道とEACを鑑別することができた.Hashimotoら 64は,バレット食道の画像内からEACを拾い上げるだけでなく,局在も正確に診断するシステムを報告した.このAIシステムは,平均精度0.7533でEACを正確に検出した.

Groofら 65は,バレット食道がん検出のためのAIシステムを開発した.さらに,専門医が病変の範囲を囲った部分と,AIシステムがEACと診断し,囲った部位の重なった領域に関して評価を行った.画像あたりの感度95%,特異度85%であり,病変の位置の認識も可能であった.また,彼らは教育と検証のために,5つの明確で独立した内視鏡データセットを用いてAIシステムを開発した 66.このAIシステムは53人の内視鏡非専門医よりも高い診断精度を達成し,90%以上の症例で検出された病変の生検に最適な部位を特定した.続いて彼らは生体内でのバレット食道がん検出の検討を行った 67.バレット領域で2cmごとにWLI画像が撮影され,その画像はAIシステムにより直ちに解析され,結果は内視鏡医に瞬時にフィードバックされた.このAIシステムは高い精度でがんを検出した.

ⅩⅢ 咽頭がんと食道がんにおける人工知能の展望

前述したように,静止画だけでなく動画を用いた精度の高いAIシステムが数多く報告されているが,特にスクリーニング内視鏡検査など,内視鏡が食道を素早く通過する機会の多い臨床の現場で早期のESCCを検出するためには,AIシステムのさらなる改良が必要である.解剖学的には,食道胃接合部付近の食道粘膜や頸部食道を観察することは,特に非専門医にとって非常に困難である.加えて,多くの報告は検証動画からハレーション,ぶれ,ピント調節不良,粘液,伸展不良といった不良画像を除外している.したがって,われわれは臨床現場での実際の速度よりも高速な動画を用いてAIシステムは検証されるべきであると考える.また,ヨード染色後の多発不染域がESCCのリスクを示唆するように,WLIやNBIでの正常な食道背景からAIが発がんリスクを予測することができれば有用であろう.このような予測ができることになれば,日常の内視鏡検査現場でのがんの検出力向上にAIシステムが役立つだろう.

これらのことが実現すれば,AIシステムは早期の食道がんや咽頭がんの検出にあたり内視鏡医を効果的に支援し,結果として生存率の改善につながることが期待される.

ⅩⅣ 上部消化管がんの検出における人工知能の展望

現代のAIは画像情報の解析にしか特化していない.今のところ,画像情報,病歴,検査データを組み合わせて総合的な診断を行うことができるAIは存在しない.このようなAIは今から10年以上たてば可能になるかもしれないが,当面はAIが単独で診断を行うのではなく,医師の優れたアシスタントとして役立つ.

われわれが今回のレビューで見てきたように,AIは早期がんでは感度が高いと報告されている.AIと内視鏡の組み合わせは,がんの早期発見の可能性が高まるかもしれない.しかし,これらの知見を強固にするために,内視鏡の分野でAIを用いた前向き研究から多くのエビデンスが必要である.

今のところ,AIは高画質の静止画でしか教えられず,動画検証で同じ精度が得られたとしても,人間の医師よりも特異度が低いことが多い.臨床現場でリアルタイムの動画を使ったときに本当に効果的な結果が得られるAIが開発されるだろう.それまでは内視鏡医がAIの低い特異性を補うことになるだろう.

さらに,内視鏡診断支援AIは多くの国で医療機器として扱われており,各国からの規制承認なしでは臨床で使用できない.

しかし,これらの問題は数年後には解決されるだろう.内視鏡臨床にAIを導入することはまた,内視鏡医の研修時間を減少し,研修指導者の負担を軽減し,そして経験豊富な医師では加齢に関連した視力障害を補填する.内視鏡AIの特性を理解し,検査を行う際に一緒に使用することで,内視鏡医はより正確な診断・治療を行うことができる.

異なる検証材料の複数のAI製品が発売されると,どのAIが優れているか決めることが難しくなる.しかし,疾患ごとに標準的なAIの検証方法が確立されれば,AIの比較が容易になる.近い将来,内視鏡AIはガイドラインで推奨されるための十分なエビデンスが提供されたり,保険適用されるようになれば,必然的に一般化するだろう.大腸ポリープに対する内視鏡的AIでは,腺腫検出率の改善のために内視鏡的AIの使用が示されている.欧州消化器内視鏡学会(ESGE)は,大腸内視鏡へのAIの組み込みについて弱く推奨するガイドラインを発表した 68.大腸内視鏡でのAI使用の費用対効果も示されている 69

内視鏡AIはリアルタイムの動画診断であるため,各画像のAI診断の代わりに,前後の画像を総合的に判断するAIアルゴリズムを適用することで,内視鏡AIの精度が向上する可能性がある.加えて,将来には内視鏡装置の画質が4K8Kに改善するだけでなく,内視鏡による臓器の3Dマッピングが他のセンシング技術と一緒に行われる可能性がある.この分野の発展の可能性は無限である.

ⅩⅤ 結  論

本レビューでは,現在の研究開発状況と,消化管がん検出のAI応用の展望を概説した.AIを基盤とした内視鏡の利用は,早期がんの検出とそれに続く予後の改善が可能となる.早期胃がんでは内視鏡医間で診断能力に大きな差があるため,AI技術の利用はより良い診断能力という点で有益であろう.早期食道がんに対するAI診断も同様の効果が期待される.

がんの検出/診断のためのAI機器は,前向き試験で検証されたものはないが,AIは内視鏡医療の進化に貢献し,優れた助手として医師をサポートする可能性がある.しかし,AIは確定診断を行わず,内視鏡検査そのものを行うことはできないため,医師の必要性には変わりはない.これからは,内視鏡医はAIを理解し活用するスキルが必要になるだろう.

謝 辞

英文校正をしたEditage(www.editage.com)に感謝したい.

 

本論文内容に関連する著者の利益相反:多田智裕はAIメディカルサービス株式会社の株主である.他の著者は開示すべきCOIはない.

資金調達情報:この論文への資金提供はない.

文 献
 
© 2021 Japan Gastroenterological Endoscopy Society
feedback
Top