要旨
飛躍的なテクノロジーの進化に伴い,内視鏡医が取得する画像の質・データ量は格段に向上している.しかし,求められる診断技術のハードルも同時に向上しており,高精度の内視鏡診断が一部のエキスパート医師に限られているのも事実である.このような先端機器と医療技術のギャップを解決し,「いつでも,だれでも」高パフォーマンスな内視鏡診断を提供できる環境を作ることを目的として,人工知能(AI)を用いたコンピュータ診断支援システムの研究開発がにわかに注目を浴びており,本邦でも2019年3月から内視鏡AIの一部製品の市販が始まっている.本稿では,食道・胃・大腸の臓器別に内視鏡AIの研究状況を概観すると共に,内視鏡AIが直面している課題および,薬事承認の状況についても紹介し,今後の診療現場に内視鏡AIがどのような影響を与えうるのか,考察していきたい.
Ⅰ 内視鏡診断が直面する課題
近年の画像処理技術・高画質化・特殊光の標準搭載等により,内視鏡診断は飛躍的な発展をとげている.しかし,画像情報量の増加とともに,内視鏡医に求められる診断能も明らかに高くなっており,高精度の内視鏡診断ができるのがエキスパートに限られている現況も事実である.
例えば,バレット食道関連腫瘍の内視鏡的検出・診断は容易ではなく,欧米では無作為に複数個の生検をバレット上皮から採取するランダムバイオプシーが推奨されているが,その感度は病変あたり64%程度とされており多数の生検をしているにも関わらず見落としが多い
1)~3).一方,食道扁平上皮癌の診断のゴールドスタンダードとなっているルゴール染色においても90%以上の感度を誇るものの,その特異度は70%程度に留まっており正確な内視鏡診断が実現していない.胃癌においても見落としが10%超あり
4),内視鏡治療が可能な早期癌(T1a-T1b1)を転移のリスクが高い癌(T1b2)と鑑別するのも内視鏡的には容易でないことが分かっている.大腸においてもポリープの見落としは20%-40%程度あるのは公知であり
5),発見した病変の内視鏡診断(腫瘍/非腫瘍の鑑別)の精度も90%に達しないことが分かっている
6).
このような,内視鏡診療の内包する「限界」を打開する,新たな解決策として注目が集まっているのが,人工知能(AI)を用いた,コンピュータ診断支援システム(CAD)である.優れたCADが開発されれば,理論的には内視鏡医の技量に関わらず高い標準の診断が実現されるため,その実現が切望されている.新規の機械学習手法である深層学習(ディープラーニング)の登場とともに,にわかに注目を浴び始めている内視鏡AIの領域であるが,実はその研究論文の半数が日本発のものであり,領域として本邦がリードしつつある研究分野でもある(Table 1,2,3).本稿では主に医学誌(消化器系・総合内科系雑誌)に掲載された研究成果を中心にレビューすることで,実地医師の視点から見た内視鏡AIの現況について概説したい.なおこのような内視鏡AI研究は情報科学の基礎的・実験的研究・論文の積み重ねの上に医師主導研究が成りたっていることを申し添える.
Ⅱ AIとは?
AIの定義は定まっていないが,端的にいえば人間の知的な振る舞いの一部をコンピュータが人工的に再現したものである.本稿ではAIの中でも特化型AI,すなわち一つのタスク(要は内視鏡診断)に特化したAIが取り上げられる.なお特化型AIの対極にある汎用AIは,人そのもののような思考・振る舞いをするAIであり,現時点では実現されていない.なおCADはAI技術の使用有無に関わらず,コンピュータ解析によって診断支援をするものであり,コンピュータ検出支援(CADe)とコンピュータ診断支援(CADx)に分類され,内視鏡領域において前者は病変の検出支援,後者は発見された病変の質的・量的診断等を支援するものである.
内視鏡で用いられるAIは,提示された内視鏡画像上の特徴(色・エッジ・面積・テクスチャー等)を量的に把握し,過去にインプットした多量の「答え(病理診断等)」つきの特徴量を参照して,画像の「答え」を予測するシステムである.この多量の答えつきの特徴量をインプットすることによりAIを「鍛える」ことを機械学習という.内視鏡で用いられるAIは二つに大別される.すなわち,特徴量を事前に開発者が指定して機械学習を行うAI(=ハンドクラフト法),および繰り返す学習の中で自ら特徴量を抽出するAI(=ディープラーニング).ハンドクラフト法は旧来の学習方法で,ディープラーニングは最近注目されている新規の手法であり,一般にハンドクラフト法より精度が高いとされるが,ケースバイケースの場合もあるため研究開発の際は慎重なアルゴリズム選別が求められる
7).
Ⅲ 食道における内視鏡AI
食道における内視鏡AIは主にi)バレット食道異形成・ii)扁平上皮癌の検出・診断支援をターゲットとしている(Table 1).胃・大腸に比べると研究論文数も少なく,研究デザインも後ろ向き研究に限られるため,その真の有効性については,十分な検証を待つ必要がある.
i)バレット食道異形成に対するCADe
バレット食道における内視鏡AIについてはその有病率の高さから,主に欧米で研究が進められている.van der Sommenらはハンドクラフト法による機械学習でバレット異形成を感度・特異度83%で検出するCADeを開発し
8),2017年にはvolumetric laser endomicroscopy(VLE)を用いてバレット異形成を感度90%・特異度93%で検出するCADeを開発した
9).VLEとは,食道壁を3mmの深さにわたって顕微鏡像に近似した縦断像を取得できる光干渉断層撮影の一種である.類似技術は既に米国で薬事承認も受けており( https://docs.wixstatic.com/ugd/b80cb6_8e40908ecd254060b37174044536eadf.pdf, NinePoint Medical Corp., USA),日常診療への直接の寄与が期待される技術である.
また,近年では深層学習の応用についても研究が進められており,Ebigboらは,74病変から取得した白色光内視鏡画像を対象に,感度97%,特異度88%(交差検定)でバレット関連腫瘍を検出できたことを報告している(Figure 1)
10).
ii)扁平上皮癌に対するCADe,CADx
食道扁平上皮癌に関するCADx開発の嚆矢となったのは,Endocytoscopy(エンドサイト,オリンパス社)であった.エンドサイトは約520倍の接触顕微観察を可能とする超拡大内視鏡であり,メチレンブルー/トルイジンブルー染色下で粘膜表層の細胞核の観察が可能である.この核を直接観察できるエンドサイトの特質を利用し,Kodashimaらは核の面積を特徴量として算出することによって,癌と正常粘膜を鑑別できるCADxを開発した
11).Kumagaiらはこの研究を,深層学習を用いて発展させ,感度92.6%,特異度89.3%で癌鑑別が可能となりうることを検証した
12).エンドサイトと同様に接触顕微観察を可能とする内視鏡に共焦点内視鏡がある.Shinらは,共焦点内視鏡画像を対象として扁平上皮異型を非腫瘍性粘膜から感度87%,特異度97%で鑑別するCADxを開発した
13).
一方で,Horieらは,通常の白色光内視鏡を用いて食道癌を感度98%で検出するCADeを2018年に開発報告した(Figure 2)
14).このCADeは偽陽性(=過検出)が多く陽性反応的中率は40%に留まったが,陰性反応的中率が95%と極めて高いため,見落とし予防の目的では臨床的に有用性が期待できる.
食道拡大内視鏡の領域でもAI研究が始まりつつある.Eversonらは深層学習を用いて食道のIPCL(intrapapillary capillary loop)を分類できないか試みた.17人の患者画像データを用いたパイロット研究では感度89.3%,特異度98%で腫瘍が鑑別できることが報告されている
15).
Ⅳ 胃における内視鏡AI
胃における内視鏡AIは主にi)胃癌の検出・診断支援,ii)胃癌の深達度診断支援,iii)ピロリ菌感染の予測がターゲットになっている(Table 2).その有病率から日本・中国からの研究論文が多く,検出・病理予測・範囲診断・予防(ピロリ菌感染予測)に至るまで幅広い領域で研究が行われているが,研究デザインはほとんどが小規模の後ろ向き研究であり,前向き試験による再現性のある結果の公表が待たれる.
i)胃癌に対するCADe,CADx
2018年Hirasawaらは深層学習で胃癌の検出を支援するCADeを世界で初めて報告した
16).CADeは前述のHorieら
14)とほぼ同様のアルゴリズムで癌に対する感度92%,陽性反応的中率は31%であった(Figure 3).一方で,Wuらも同様に,深層学習を用いて感度94%,特異度91%で胃癌を検出するCADeを報告し,これは参加した内視鏡医の診断を凌駕する成果であった(Figure 4)
17).これらの試験は,既に内視鏡医が撮影した静止画を対象とした検証であったため,より「リアルワールド」に近いデータである内視鏡動画におけるフレームベースの診断感度・特異度が明らかになることを期待したい.
胃癌の検出と同様に,重要と考えられているのが観察範囲の監視システムである.すなわち,胃内視鏡検査では術者によって観察が不十分な部分(胃角前脚や体部小彎後壁等の視認が難しい領域)があり,これが胃癌の見逃しの大きな原因の一つとなっている.この「観察領域の見落とし」を防ぐシステムをWuらは開発し,ランダム化比較試験でその精度を検証し注目を集めた
18).このシステムは,深層強化学習というアルゴリズムを採用している.深層強化学習は,将棋や囲碁のAIで採用されるアルゴリズムで,ゲームのような手順・ルール等が定まっている対象において,繰り返し定まった手順を繰り返すことで教師データなしに半自動的に機械学習し高精度を達成する学習法である.精度評価においては,324人の患者がAI群(153名),非AI群(150名)に割り付けられ,結果,AI群の方が有意に見落とし領域の割合が少ない(5.86% vs 22.46%,P<0.001)ことが分かった.内視鏡検査自体のクオリティを向上されるうえで,非常に期待のもてるAIであると考えられるとともに,深層強化学習という一見,内視鏡には不向きなAIを見事に適応した点において大変評価される研究である.
一方,胃癌の質的診断については,拡大内視鏡と特殊光を組み合わせた胃癌の病理診断予測・範囲診断は学問として急速に成熟し,特に本邦では日常診療で欠かざるものとなった
19)~25).しかし,依然として非熟練者や海外に目を向けると,拡大内視鏡による胃癌診断はその難解さから一般診療に溶け込んでいない.Miyakiら
26)はこの問題にAIを用いて解を与えることを試みた.すなわち,拡大FICE(Fuji Intelligent Color Enhancement;Fujifilm Corp.)観察により癌と非癌の領域を感度85%,特異度87%で識別できるCADxを構築した.アルゴリズムは従来の機械学習の標準的技法であるsupport vector machine(SVM)を用いて学習・分類作業を行っている.Miyakiらは引き続き,同様の手法を拡大BLIに応用し,先行研究を裏付ける成果が得ている
27).
一方で,Kanesakaらは胃癌の範囲診断にAIを用いることに世界で初めて挑戦した
28).すなわち,拡大NBI画像をターゲットとして,癌の存在診断だけでなく,領域診断を行うAIを開発した.126枚の拡大NBI画像を,細かいピクセル単位に分割し,その特徴をSVMで学習し,癌の領域診断を感度66%,特異度81%で達成した.
ii)胃癌の深達度診断支援
「検出」され,「病理診断予測」(あるいは生検による確定診断)がなされた胃癌について,次に実施される診断ステップは「深達度診断予測」である.すなわち,内視鏡治療が考慮されるT1a~T1b1までの病変なのか,リンパ節転移のリスクがあり手術治療が推奨されるT1b2以深の深達度なのかの判別である.胃癌における深達度診断は,かねてより白色光所見に基づいた主観的な診断に頼らざるを得ない局面が多かった.しかし,AIで深達度診断を支援できる可能性が見えてきた.
Kubotaら
29)は,ニューラルネットワークを用いて深達度診断を行うCADxを開発,344病変の胃癌画像を用いてT1,T2,T3,T4を77%,49%,51%,and 55%の正診率で予測しうることを示した.なお,本システムを使った粘膜内癌と粘膜下層浸潤癌の鑑別正診率は69%であった.続いて,Zhuらは早期胃癌にターゲットを絞り,深層学習を使うことで更に高精度(特異度76%)の深達度診断予測(T1a-T1b1 vs T1b2)が可能となりうることを示した
30).96%と非常に高い特異度は,臨床において過剰手術を抑制するため,極めて臨床的にも有用性が期待できるAIである.
iii)ピロリ菌感染の予測
ピロリ菌感染は慢性胃炎・腸上皮化成を介して胃癌の原因となりうるため
31)~33),内視鏡でピロリ菌感染を拾い上げることが重要視されているが,その診断精度,特に感度は十分でないことが分かっている
34).AIはこのようなピロリ菌感染の見落としを拾い上げる機能を期待されており,アジアを中心に研究が進んでいる.
2004年,Huangら
35)はニューラルネットワークを用いてピロリ菌感染を予測するAIを報告した.30例の患者画像で学習し,74例で検証された結果,ピロリ菌感染を感度85%・特異度91%で予測することができた.
一方,Shichijoら
36)は深層学習でピロリ菌感染を感度89%,特異度87%で予測するAIを報告した.これは内視鏡医による正診率(82%)より有意に高い精度であった.続いてこのグループ
37)は,更に大量の試験画像(=847人の患者)を用いて,ピロリ菌の除菌例も加味した検討を行った.結果は,ピロリ未感染例については正診率80%,除菌例については正診率84%,感染例については正診率48%で予測できることが分かった.感染例の正診率が十分な水準に達しなかったが,除菌例と感染例の鑑別という非常にチャレンジングかつ実臨床に基づいた課題に取り組んだ意欲的な研究内容であり,今後の精度向上および臨床導入に期待したい.
別の研究グループからも同様に深層学習を用いたピロリ菌感染の予測については報告がある.Itohら
33)は感度87%特異度87%で感染予測ができうることを示した.引き続き,同グループのNakashimaら
38)は通常内視鏡画像ではなくBLIやLinked Color Image(LCI,Fujifilm Corp)を用いることで,より精度の高いAIが構築できることを示した(Figure 5).構築されたAIのピロリ菌感染に関するROC曲線のAUC値は白色光画像が0.66であったのに対し,BLI-brightとLCIはそれぞれ0.96,0.95と有意に高精度であった.
Ⅴ 大腸における内視鏡AI
大腸における内視鏡AIは主にi)大腸ポリープのCADe・ii)大腸腫瘍の病理診断予測・iii)大腸癌の深達度診断支援・iv)潰瘍性大腸炎の診断支援をターゲットとしている(Table 3).大腸内視鏡に対するAIは最も研究が盛んで,大規模な前向き研究が既に複数報告されており,実地医療への導入が最も早期に期待される分野である.後述するように,既に複数のAIが大腸領域で薬事取得・販売に至っており,今後の臨床への展開に特に注目したいモダリティである.
i)大腸ポリープのCADe
CADeについては,2000年代から様々な画像特徴量(エッジ検出・テクスチャー解析・エナジーマップ等)を利用してポリープを自動検出する手法が検討されていたが,検出率が安定して90%を超えることはなく,また計算機能力の限界から,リアルタイムでの診断に成功した事例はなかった
39),40).しかし,莫大な演算性能をもつGPU(Graphic Processing Unit)が画像表示だけでなく汎用計算にも使用できるような環境が整い(GPUを用いた汎用計算;GPGPU),ディープラーニングの計算時間が著明に短縮,しかもディープラーニングの精度が従来手法より格段に良いことが分かり,状況は一変した.この深層学習を利用することで,精度90%超でリアルタイムにポリープの検出ができる可能性がでてきた.
最初に深層学習を利用したCADeを医学誌に報告したMisawaらは,時間的要素を加味した畳み込みネットワークを用いることで,感度90.0%・特異度63.3%(フレームベース)でのリアルタイム・ポリープ検出を可能とした(Figure 6)
41).続いて,Urbanらはより多様な内視鏡静止画を学習画像に利用することで,感度93.0%・特異度93.0%(フレームベース)という極めて高精度でポリープ検出を可能とした
42).しかしながら,これらの研究はあらかじめ用意されたテスト用動画を用いたex vivo研究であり,CADeの実臨床での有用性は当初確認できていなかった.
これに対し,Wangら
43)は,1,058名の患者を対象としたランダム化比較試験(RCT)を実施,CADe群の腫瘍検出率が29.1%と対照群の20.3%を有意に上回る精度であることを報告した.内視鏡AI研究の中で初のRCTである本研究は,衝撃をもって受け止められたが,対照群の腫瘍検出率が比較的低かったこともあり,追試が必要と考えられている.このような追試は,CADeに関するもう一つの前向き研究であるKlareらの報告が,negativeな結果であったことからも裏付けられる
44).55人の患者に対してCADeをリアルタイムに使用したこの前向き試験では,腫瘍検出率自体は29.1%と良好であったものの,医師が検出したポリープのうち四分の一がCADeによって見逃されていた.このように,CADeによるポリープ検出のエビデンスについては議論の余地が残るため,慎重な解釈が必要である.
なお,Wangらの検討によると,CADeが新規に発見した病変のほとんどは5mm以下の腺腫あるいは過形成性ポリープといった,悪性度の低いものであったことが分かっている
43).本来ならば,悪性度が高くかつ検出も難しい,非顆粒型の側方発育型腫瘍や陥凹型腫瘍の検出支援が期待されるが,対象とする学習用画像が十分でない現況を考えると,実現には相当以上の時間がかかるであろう.
ii)大腸腫瘍の病理診断予測
a)拡大内視鏡を対象としたCADx
病理診断予測を担うCADxの対象となるモダリティとして最も研究されているものは拡大内視鏡である.2000年代より色素拡大内視鏡(=Pit pattern)を対象とするCADxの研究が口火となり
45),46),2010年代からは拡大NBI画像をターゲットとした報告
47)が複数の研究グループからなされている.興味深いことに,これらの報告の中には,リアルタイム診断を実現
46),48)した実用化に近い報告もあった.当時の診断アルゴリズムは,ハンドクラフトにより抽出される特徴量を,機械学習(SVM等)で学習・分類する手法が主流であった.本研究分野において,広島大学のグループが果たした役割は大きく,Kominamiらが実施した前向き試験(41人118病変を対象にリアルタイムにCADxを実証.腫瘍に関する感度93.3%・特異度93.3%を達成)は,小規模ながら当該研究分野の唯一の前向き試験として多数の引用を受けている
48).
一方で,本領域でもディープラーニングの出現が注目を集めている
49),50).Chenら,Byrneらは,ともに感度90%超で腫瘍・非腫瘍の鑑別をするCADxの開発に成功した.学習症例数を増加させることにより更なる精度向上が期待されており,今後の前向き試験による実証が待たれる.
なお,本研究分野のほとんどは腫瘍・非腫瘍の鑑別をターゲットにした研究であるが,Tamaiらは拡大NBI画像を対象にT1b癌の鑑別を行うCADxを開発,感度83.9%・特異度82.6%で識別できることを報告した
51).大腸T1b癌の鑑別は容易でなく精度80%にも満たないことが知られているため
52),このCADxが実用化された場合には診療現場への多大な恩恵が期待できる.
このように,拡大NBIをターゲットとしたCADxは多数の検討がなされているが,実用化に向けて乗り越えるべき2点のハードルがある.一つ目は,拡大NBIの関心領域(病変部位・非病変部位が混在する内視鏡画面の中で,「医師が見たい」部分)を内視鏡医が人為的に画面上で指定しなければならないというlimitationである(ディープラーニングによって関心領域を自動抽出する発想もあるが,そもそもその自動抽出の精度が100%ではないため,非現実的である).2点目の問題点は,研究のほとんどが後ろ向き研究あるいは小規模の前向き研究であり,結果の再現性が確立していない点である.このような課題が克服されれば,普及率が高い拡大NBIは,CADxのメインプレイヤーとなりえる.
b)Endocytoscopyを対象としたCADx
Endocytoscopyは,以下の特徴により,CADxに非常に適した(=開発が容易な)内視鏡である.1)超拡大観察機能かつ接触観察機能により,画面全体が関心領域となる 2)超拡大画像と非超拡大画像が大きく異なる画像のため,超拡大内視鏡画像時に自動解析するCADxが構築可能.
この利点を生かして昭和大学・名古屋大学の医工連携チームで開発されたCADxは,複数の後ろ向き研究で腫瘍診断感度90%以上が担保できることを確認した後
53)~58),Moriらにより大規模な前向き研究が実施された(Figure 7)
59).この試験では791名の患者を対象に,リアルタイムでEndocytoscopyを用いたCADxが使用され,計466個の微小大腸ポリープの病理診断予測が行われた.感度92.7%,特異度89.8%で腫瘍が鑑別可能なことが検証され,実臨床においてもCADxが有用であることを示した.なお,Endocytoscopyを利用したCADxは本邦初の内視鏡AIとして2018年12月に薬事承認を受けている(販売名:EndoBRAINⓇ).薬事承認取得の過程では,日本医療研究開発機構(AMED)の支援のもと,国内5施設(昭和大学横浜市北部病院・国立がん研究センター中央病院・国立がん研究センター東病院・静岡県立静岡がんセンター・東京医科歯科大学)による多施設共同研究が実施された(unpublished data).
なお,Endocytoscopyと並び,もう一つの市販されている超拡大内視鏡である共焦点内視鏡(Cellvizio, Mauna Kea Technologies社)についても,CADxが研究開発されているが,研究の量・精度ともに十分でないのが現況である
60),61).
c)自家蛍光(Autofluorescence)内視鏡を対象としたCADx
自家蛍光内視鏡を対象としたCADxには大きく分けて二つの研究開発が実施されている.一つは,自家蛍光スペクトロスコピーを用いたCADx,もう一つは自家蛍光内視鏡(Auto-fluorescence imaging;AFI,オリンパス社)を用いたCADxである.前者については,既にアメリカ・ヨーロッパにて薬事取得を果たした製品があり(WavSTAT4,ペンタックス社),二つの前向き試験が実施済である
62),63).しかしながら,WavSTAT4は,新規に大がかりな内視鏡ユニットを用意する必要があり,広く使用されるには至っていない.
オリンパス社のAFI光を用いたCADxについては,2013年ころより研究が進められてきた.二つの前向き試験が実施済であり,Aiharaらは32人102病変を対象に感度94.2%,特異度88.9%の精度で腫瘍鑑別できることを報告
64),Horiuchiらは,95人258病変を対象に感度80.0%特異度95.3%で腫瘍鑑別できることを報告した(Figure 8)
65).AFI内視鏡は既に市販化されており,前向き試験の結果も良好であるため,本CADx技術の実用化が期待される.
d)通常内視鏡画像を対象としたCADx
白色光を用いた通常内視鏡観察が,内視鏡診断の礎にあり,かつ最も簡便な方法であるのは論を俟たない.しかしながら,通常内視鏡画像を用いたCADxに関する研究開発は,上述のa)~c)と比較すると遅々として進んでいなかった
66).Komedaらはディープラーニングを用いて通常内視鏡画像をターゲットにしたCADxを開発し,質的診断に取り組んだが,高い精度は実現できておらず(交差検定での精度:75.1%)
67),Rennerらのグループも感度特異度ともに80%を超える精度を達成することができていなかった
68).これは,AIそのものの問題ではなく,拡大NBIやEndocytoscopy等と比較すると白色光通常内視鏡のもつ画像情報量が限定されるためと考えられる.
一方で,近年ディープラーニングでなくハンドクラフト法を用いた手法で,通常内視鏡画像CADxの精度を上げた研究が報告された(腫瘍/非腫瘍の鑑別における感度92.3%,特異度89.2%)
69).ディープラーニングは素晴らしい手法であるが,本研究のようにハンドクラフト法が極めて良い精度を達成することがあるのも事実であり,内視鏡AI研究については,ディープラーニングを盲目的に使用するのではなく,適宜ハンドクラフト法と比較しながら状況によって使い分ける知識・柔軟さが必要とされる
7).
iii)大腸癌の深達度診断支援
CADxの新分野として,T1b癌診断がにわかに注目を集めている.TakedaらはEndocytoscopyを大腸癌に使用することにより,表層の癌細胞の所見を拾い上げられる点に注目し,浸潤癌の診断予測を可能とするCADxについてex vivoの評価を行った(Figure 9)
70).感度89.4%・特異度98.9%の精度が確認できたが,前向き試験による精度検証結果が待たれる.
更に実用に近い例では,通常内視鏡画像をターゲットにして,Itoらは,深層学習を用いてT1b癌を感度67.5%・特異度89.0%で鑑別可能なCADxを報告
71),Luiらは,治癒切除可能な大腸病変(高分化型腺癌かつ,脈管侵襲陰性かつ,粘膜下層浸潤距離1,000μm未満)の鑑別を感度88.2%特異度77.9%で可能とするCADxを報告している(Figure 10)
72).これらは極めて初期段階の小数例での検討ではあるが,将来的には困難なT1b癌診断を強力にサポートしうるツールとなりうるため,今後の研究開発に期待したい.
iv)潰瘍性大腸炎の診断支援
潰瘍性大腸炎の診療において,粘膜治癒および組織学的治癒の重要性が重視されており,組織学的活動性の持続が病状の再燃・長期的発がんリスクにより強く関連している可能性が指摘されている
73).しかしながら,粘膜治癒および組織学的治癒を内視鏡的に正しく予測するのは難しく,検査再現性も十分ではないため,検査の客観化の必要性が求められていた
73),74).この潰瘍大腸炎のAIに関する研究がごく最近4報立て続けに報告された.うち,二報が白色光内視鏡をターゲットとしたもの(Figure 11)
75),76),残りが超拡大内視鏡をターゲットとしたものである(Figure 12)
77),78).いずれも比較的小数例の後ろ向き試験で,既存の内視鏡診断を上回る炎症の診断能を示した試験である.端緒についたばかりの研究分野であるが,潰瘍性大腸炎は患者数が年々増加するcommon diseaseの一つであるため,今後の研究発展を見守りたい.
Ⅵ 薬事承認をめぐる現況
このように内視鏡AIの研究は盛んであるが,一般臨床で使用するためには大きなハードルがある.すなわち,「医療機器」として薬事承認を取得することが必要である.これは内視鏡AIが,その用途によって大小様々な臨床リスクを内包するデバイスであるからである.2018年,医薬品医療機器総合機構(PMDA)の委託下に結成されたAI専門部会(部会長:光石衛)は,医用AIをそのリスクに応じて5レベルに分類し,特にレベル3以上の医用AIには(誤診に伴う)重大リスクを含有すると報告した
79).医用AIに関する規制当局の見解は欧米でも一致しており,米国食品医薬品局(FDA)も医用ソフトウェアをカテゴリー1~4に分類し,カテゴリー2の一部以上は高いリスクを含むため,より厳格な薬事審査プロセスが必要であると明記されている.このように,内視鏡AIの利用については薬事承認が必要と考えられており,未承認のAIを臨床使用することは原則できない.
2019年6月現在,日本で薬機法承認を受けている大腸内視鏡用のAIはEndocytoscopyをターゲットとした「EndoBRAINⓇ」(製造:サイバネットシステム株式会社・販売:オリンパス株式会社)のみである.海外においては,そのほか三つの内視鏡AIが大腸内視鏡用として薬事取得済の状況である.一つ目は自家蛍光スペクトロスコピーを対象としたCADxである「WavSTAT4」(製造販売:HOYA社)がFDA承認およびCEマーク取得(EU領域における医療機器認証システム)しており,二つ目は大腸ポリープを対象としたCADeである「GI Genius」(製造:COSMO AI社・販売:Medtronic社)がCEマークを取得,三つ目は,同じく大腸ポリープを対象としたCADeである「DISCOVERY」(販売Pentax社)がCEマークを取得している.このように,現時点で承認取得済の内視鏡AIは限られている状況であるが,昨今の内視鏡AIに関する研究開発の盛り上がりを鑑みると,これから数年で状況は一変することが想定される.
Ⅶ まとめ
食道・胃・大腸を対象とした内視鏡AIについて,「検出」・「病理診断予測」に主な焦点を当てて紹介した.昨今,AIは内視鏡医療の分野でも確実にその存在感を増している.しかし,ニュース性が先行しすぎ,過剰な期待がされているのもまた事実である.本稿のTable 1,2,3でご紹介したように,内視鏡AIの約半分は本邦初の論文報告でその数は世界一であるが,ほとんどがエビデンスレベルの低い探索的研究であり,最も信憑性が高いランダム化比較試験はいずれも国外(中国)から発信であり
18),43),近年のNature関連雑誌でもその二報のみが紹介されている状況である
80).すなわち,本研究領域が新規性で注目を集める時期は既に終了しており,世界の関心は「エビデンス構築」にシフトしつつある現況にある.「臨床導入」が始まったばかりの内視鏡AIであるが,その「有効性」と「限界」を認識したうえで上手に診療に生かしていくことで,真に患者様に恩恵のある内視鏡診療につながることを期待し,本稿をまとめたい.
謝 辞
図の提供を頂いたAugsburg Medical Centerの Alanna Ebigbo先生,Helmut Messmann先生,ただともひろ胃腸科肛門科多田智裕先生,武漢大学人民医院Hong Gang Yu先生,早期胃癌検診協会中島寛隆先生,東京慈恵会医科大学玉井尚人先生,堀内英華先生,香港大学 Thomas K.L. Lui先生に厚く御礼申し上げます.また,本総説において,多大な貢献を頂いた以下の先生・企業に御礼申し上げます.名古屋大学情報学研究科の森健策先生・伊東隼人先生・小田昌宏先生,昭和大学横浜市北部病院消化器センターの全スタッフ,オリンパス株式会社,サイバネット株式会社.
本論文内容に関連する著者の利益相反:森 悠一(オリンパス),三澤将史(オリンパス)
文 献
- 1. Sharma P, Hawes RH, Bansal A et al. Standard endoscopy with random biopsies versus narrow band imaging targeted biopsies in Barrettʼs oesophagus:a prospective, international, randomised controlled trial. Gut 2013; 62: 15-21.
- 2. Curvers WL, van Vilsteren FG, Baak LC et al. Endoscopic trimodal imaging versus standard video endoscopy for detection of early Barrettʼs neoplasia:a multicenter, randomized, crossover study in general practice. Gastrointest Endosc 2011; 73: 195-203.
- 3. Kara MA, Smits ME, Rosmolen WD et al. A randomized crossover study comparing light-induced fluorescence endoscopy with standard videoendoscopy for the detection of early neoplasia in Barrettʼs esophagus. Gastrointest Endosc 2005; 61: 671-8.
- 4. Menon S, Trudgill N. How commonly is upper gastrointestinal cancer missed at endoscopy? A meta-analysis. Endosc Int Open 2014; 2:E46-50.
- 5. Kumar S, Thosani N, Ladabaum U et al. Adenoma miss rates associated with a 3-minute versus 6-minute colonoscopy withdrawal time:a prospective, randomized trial. Gastrointest Endosc 2017; 85: 1273-80.
- 6. Ladabaum U, Fioritto A, Mitani A et al. Real-time optical biopsy of colon polyps with narrow band imaging in community practice does not yet meet key thresholds for clinical decisions. Gastroenterology 2013; 144: 81-91.
- 7. Khan S, Yong S. A comparison of deep learning and hand crafted features in medical image modality classification. In 2016 3rd International Conference on Computer and Information Sciences(ICCOINS) 2016; 15-7.
- 8. van der Sommen F, Zinger S, Curvers WL et al. Computer-aided detection of early neoplastic lesions in Barrettʼs esophagus. Endoscopy 2016; 48: 617-24.
- 9. Swager AF, van der Sommen F, Klomp SR et al. Computer-aided detection of early Barrettʼs neoplasia using volumetric laser endomicroscopy. Gastrointest Endosc 2017; 86: 839-46.
- 10. Ebigbo A, Mendel R, Probst A et al. Computer-aided diagnosis using deep learning in the evaluation of early oesophageal adenocarcinoma. Gut 2019; 68: 1143.
- 11. Kodashima S, Fujishiro M, Takubo K et al. Ex vivo pilot study using computed analysis of endo-cytoscopic images to differentiate normal and malignant squamous cell epithelia in the oesophagus. Dig Liver Dis 2007; 39: 762-6.
- 12. Kumagai Y, Takubo K, Kawada K et al. Diagnosis using deep-learning artificial intelligence based on the endocytoscopic observation of the esophagus. Esophagus 2019; 16: 180-7.
- 13. Shin D, Protano MA, Polydorides AD et al. Quantitative analysis of high-resolution microendoscopic images for diagnosis of esophageal squamous cell carcinoma. Clin Gastroenterol Hepatol 2015; 13: 272-9 e2.
- 14. Horie Y, Yoshio T, Aoyama K et al. Diagnostic outcomes of esophageal cancer by artificial intelligence using convolutional neural networks. Gastrointest Endosc 2018 Aug 16. pii:S0016-5107(18)32926-2. doi:10.1016/j.gie.2018.07.037. [Epub ahead of print].
- 15. Everson M, Herrera L, Li W et al. Artificial intelligence for the real-time classification of intrapapillary capillary loop patterns in the endoscopic diagnosis of early oesophageal squamous cell carcinoma:A proof-of-concept study. United European Gastroenterol J 2019; 7: 297-306.
- 16. Hirasawa T, Aoyama K, Tanimoto T et al. Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images. Gastric Cancer 2018; 21: 653-60.
- 17. Wu L, Zhou W, Wan X et al. A deep neural network improves endoscopic detection of early gastric cancer without blind spots. Endoscopy 2019; 51: 522-31.
- 18. Wu L, Zhang J, Zhou W et al. Randomised controlled trial of WISENSE, a real-time quality improving system for monitoring blind spots during esophagogastroduodenoscopy. Gut 2019. DOI:10.1136/gutjnl-2018-317366.
- 19. Nakanishi H, Doyama H, Ishikawa H et al. Evaluation of an e-learning system for diagnosis of gastric lesions using magnifying narrow-band imaging:a multicenter randomized controlled study. Endoscopy 2017; 49: 957-67.
- 20. Yao K, Anagnostopoulos GK, Ragunath K. Magnifying endoscopy for diagnosing and delineating early gastric cancer. Endoscopy 2009; 41: 462-7.
- 21. Osawa H, Yamamoto H. Present and future status of flexible spectral imaging color enhancement and blue laser imaging technology. Dig Endosc 2014; 26(Suppl 1): 105-15.
- 22. Osawa H, Yamamoto H, Miura Y et al. Diagnosis of extent of early gastric cancer using flexible spectral imaging color enhancement. World J Gastrointest Endosc 2012; 4: 356-61.
- 23. Mouri R, Yoshida S, Tanaka S et al. Evaluation and validation of computed virtual chromoendoscopy in early gastric cancer. Gastrointest Endosc 2009; 69: 1052-8.
- 24. Kimura-Tsuchiya R, Dohi O, Fujita Y et al. Magnifying Endoscopy with Blue Laser Imaging Improves the Microstructure Visualization in Early Gastric Cancer:Comparison of Magnifying Endoscopy with Narrow-Band Imaging. Gastroenterol Res Pract 2017:8303046.
- 25. Yoshifuku Y, Sanomura Y, Oka S et al. Clinical Usefulness of the VS Classification System Using Magnifying Endoscopy with Blue Laser Imaging for Early Gastric Cancer. Gastroenterol Res Pract 2017:3649705.
- 26. Miyaki R, Yoshida S, Tanaka S et al. Quantitative identification of mucosal gastric cancer under magnifying endoscopy with flexible spectral imaging color enhancement. J Gastroenterol Hepatol 2013; 28: 841-7.
- 27. Miyaki R, Yoshida S, Tanaka S et al. A Computer System To Be Used With Laser-based Endoscopy for Quantitative Diagnosis of Early Gastric Cancer. J Clin Gastroenterol 2015; 49: 108-15.
- 28. Kanesaka T, Lee TC, Uedo N et al. Computer-aided diagnosis for identifying and delineating early gastric cancers in magnifying narrow-band imaging. Gastrointest Endosc 2018; 87: 1339-44.
- 29. Kubota K, Kuroda J, Yoshida M et al. Medical image analysis:computer-aided diagnosis of gastric cancer invasion on endoscopic images. Surg Endosc 2012; 26: 1485-9.
- 30. Zhu Y, Wang QC, Xu MD et al. Application of convolutional neural network in the diagnosis of the invasion depth of gastric cancer based on conventional endoscopy. Gastrointest Endosc 2018 Nov 16. pii:S0016-5107(18)33282-6. doi:10.1016/j.gie.2018.11.011.
- 31. Uemura N, Okamoto S, Yamamoto S et al.
Helicobacter pylori infection and the development of gastric cancer. N Engl J Med 2001; 345: 784-9.
- 32. Kato T, Yagi N, Kamada T et al. Diagnosis of Helicobacter pylori infection in gastric mucosa by endoscopic features:a multicenter prospective study. Dig Endosc 2013; 25: 508-18.
- 33. Itoh T, Kawahira H, Nakashima H et al. Deep learning analyzes Helicobacter pylori infection by upper gastrointestinal endoscopy images. Endosc Int Open 2018; 6:E139-44.
- 34. Watanabe K, Nagata N, Shimbo T et al. Accuracy of endoscopic diagnosis of Helicobacter pylori infection according to level of endoscopic experience and the effect of training. BMC Gastroenterol 2013; 13: 128.
- 35. Huang CR, Sheu BS, Chung PC et al. Computerized diagnosis of Helicobacter pylori infection and associated gastric inflammation from endoscopic images by refined feature selection using a neural network. Endoscopy 2004; 36: 601-8.
- 36. Shichijo S, Nomura S, Aoyama K et al. Application of Convolutional Neural Networks in the Diagnosis of Helicobacter pylori Infection Based on Endoscopic Images. EBioMedicine 2017; 25: 106-11.
- 37. Shichijo S, Endo Y, Aoyama K et al. Application of convolutional neural networks for evaluating Helicobacter pylori infection status on the basis of endoscopic images. Scand J Gastroenterol 2019; 54: 158-63.
- 38. Nakashima H, Kawahira H, Kawachi H et al. Artificial intelligence diagnosis of Helicobacter pylori infection using blue laser imaging-bright and linked color imaging:a single-center prospective study. Ann Gastroenterol 2018; 31: 462-8.
- 39. Fernandez-Esparrach G, Bernal J, Lopez-Ceron M et al. Exploring the clinical potential of an automatic colonic polyp detection method based on the creation of energy maps. Endoscopy 2016; 48: 837-42.
- 40. Tajbakhsh N, Gurudu SR, Liang J. Automatic polyp detection using global geometric constraints and local intensity variation patterns. Med Image Comput Comput Assist Interv 2014; 17: 179-87.
- 41. Misawa M, Kudo SE, Mori Y et al. Artificial Intelligence-Assisted Polyp Detection for Colonoscopy:
Initial Experience. Gastroenterology 2018; 154: 2027-9 e3.
- 42. Urban G, Tripathi P, Alkayali T et al. Deep Learning Localizes and Identifies Polyps in Real Time With 96% Accuracy in Screening Colonoscopy. Gastroenterology 2018; 155: 1069-78 e8.
- 43. Wang P, Berzin TM, Glissen Brown JR et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates:a prospective randomised controlled study. Gut 2019; 68: 1813-9.
- 44. Klare P, Sander C, Prinzen M et al. Automated polyp detection in the colorectum:a prospective study(with videos). Gastrointest Endosc 2019; 89: 576-82. e1.
- 45. Hafner M, Liedlgruber M, Uhl A et al. Delaunay triangulation-based pit density estimation for the classification of polyps in high-magnification chromo-colonoscopy. Comput Methods Programs Biomed 2012; 107: 565-81.
- 46. Takemura Y, Yoshida S, Tanaka S et al. Quantitative analysis and development of a computer-aided system for identification of regular pit patterns of colorectal lesions. Gastrointest Endosc 2010; 72: 1047-51.
- 47. Tischendorf JJ, Gross S, Winograd R et al. Computer-aided classification of colorectal polyps based on vascular patterns:a pilot study. Endoscopy 2010; 42: 203-7.
- 48. Kominami Y, Yoshida S, Tanaka S et al. Computer-aided diagnosis of colorectal polyp histology by using a real-time image recognition system and narrow-band imaging magnifying colonoscopy. Gastrointest Endosc 2015;[Epub ahead of print].
- 49. Byrne MF, Chapados N, Soudan F et al. Real-time differentiation of adenomatous and hyperplastic diminutive colorectal polyps during analysis of unaltered videos of standard colonoscopy using a deep learning model. Gut 2017 [Epub ahead of print].
- 50. Chen PJ, Lin MC, Lai MJ et al. Accurate Classification of Diminutive Colorectal Polyps Using Computer-Aided Analysis. Gastroenterology 2018; 154: 568-75.
- 51. Tamai N, Saito Y, Sakamoto T et al. Effectiveness of computer-aided diagnosis of colorectal lesions using novel software for magnifying narrow-band imaging:
a pilot study. Endosc Int Open 2017; 5:E690-4.
- 52. Shimura T, Ebi M, Yamada T et al. Magnifying chromoendoscopy and endoscopic ultrasonography measure invasion depth of early stage colorectal cancer with equal accuracy on the basis of a prospective trial. Clin Gastroenterol Hepatol 2014; 12: 662-8.e1-2.
- 53. Mori Y, Kudo SE, Chiu PW et al. Impact of an automated system for endocytoscopic diagnosis of small colorectal lesions:an international web-based study. Endoscopy 2016; 48: 1110-8.
- 54. Mori Y, Kudo SE, Wakamura K et al. Novel computer-aided diagnostic system for colorectal lesions by using endocytoscopy(with videos). Gastrointest Endosc 2015; 81: 621-9.
- 55. Misawa M, Kudo SE, Mori Y et al. Characterization of Colorectal Lesions Using a Computer-Aided Diagnostic System for Narrow-Band Imaging Endocytoscopy. Gastroenterology 2016; 150: 1531-2 e3.
- 56. Misawa M, Kudo SE, Mori Y et al. Accuracy of computer-aided diagnosis based on narrow-band imaging endocytoscopy for diagnosing colorectal lesions:
comparison with experts. Int J Comput Assist Radiol Surg 2017; 12: 757-66.
- 57. Mori Y, Kudo S, Misawa M et al. Simultaneous detection and characterization of diminutive polyps with the use of artificial intelligence during colonoscopy. Video GIE in press.
- 58. Mori Y, Kudo SE, Mori K. Potential of artificial intelligence-assisted colonoscopy using an endocytoscope(with video). Dig Endosc 2018; 30(Suppl 1): 52-3.
- 59. Mori Y, Kudo SE, Misawa M et al. Real-Time Use of Artificial Intelligence in Identification of Diminutive Polyps During Colonoscopy:A Prospective Study. Ann Intern Med 2018; 169: 357-66.
- 60. Stefanescu D, Streba C, Cartana ET et al. Computer Aided Diagnosis for Confocal Laser Endomicroscopy in Advanced Colorectal Adenocarcinoma. PLoS One 2016; 11:e0154863.
- 61. Andre B, Vercauteren T, Buchner AM et al. Software for automated classification of probe-based confocal laser endomicroscopy videos of colorectal polyps. World J Gastroenterol 2012; 18: 5560-9.
- 62. Kuiper T, Alderlieste YA, Tytgat KM et al. Automatic optical diagnosis of small colorectal lesions by laser-induced autofluorescence. Endoscopy 2015; 47: 56-62.
- 63. Rath T, Tontini GE, Vieth M et al. In vivo real-time assessment of colorectal polyp histology using an optical biopsy forceps system based on laser-induced fluorescence spectroscopy. Endoscopy 2016; 48: 557-62.
- 64. Aihara H, Saito S, Inomata H et al. Computer-aided diagnosis of neoplastic colorectal lesions using ʻreal-timeʼ numerical color analysis during autofluorescence endoscopy. Eur J Gastroenterol Hepatol 2013; 25: 488-94.
- 65. Horiuchi H, Tamai N, Kamba S et al. Real-time computer-aided diagnosis of diminutive rectosigmoid polyps using an auto-fluorescence imaging system and novel color intensity analysis software. Scand J Gastroenterol 2019; 54: 800-5.
- 66. Mori Y, Kudo SE, Berzin TM et al. Computer-aided diagnosis for colonoscopy. Endoscopy 2017; 49: 813-9.
- 67. Komeda Y, Handa H, Watanabe T et al. Computer-Aided Diagnosis Based on Convolutional Neural Network System for Colorectal Polyp Classification:
Preliminary Experience. Oncology 2017; 93(Suppl 1)30-4.
- 68. Renner J, Phlipsen H, Haller B et al. Optical classification of neoplastic colorectal polyps-a computer-assisted approach(the COACH study). Scand J Gastroenterol 2018; 53: 1100-6.
- 69. Sánchez-Montes C, Sánchez FJ, Bernal J et al. Computer-aided prediction of polyp histology on white light colonoscopy using surface pattern analysis. Endoscopy 2019; 51: 261-5.
- 70. Takeda K, Kudo S, Mori Y et al. Accuracy of diagnosing invasie colorectal cancer using computer-aided endocytoscopy. Endoscopy 2017; 49: 798-802.
- 71. Ito N, Kawahira H, Nakashima H et al. Endoscopic Diagnostic Support System for cT1b Colorectal Cancer Using Deep Learning. Oncology 2019; 96: 44-50.
- 72. Lui TKL, Wong KKY, Mak LLY et al. Endoscopic prediction of deeply submucosal invasive carcinoma with use of artificial intelligence. Endosc Int Open 2019; 7:E514-20.
- 73. Bryant RV, Burger DC, Delo J et al. Beyond endoscopic mucosal healing in UC:histological remission better predicts corticosteroid use and hospitalisation over 6 years of follow-up. Gut 2016; 65: 408-14.
- 74. Iacucci M, Fort Gasia M, Hassan C et al. Complete mucosal healing defined by endoscopic Mayo subscore still demonstrates abnormalities by novel high definition colonoscopy and refined histological gradings. Endoscopy 2015; 47: 726-34.
- 75. Ozawa T, Ishihara S, Fujishiro M et al. Novel computer-assisted diagnosis system for endoscopic disease activity in patients with ulcerative colitis. Gastrointest Endosc 2019; 89: 416-21.e1.
- 76. Stidham RW, Liu W, Bishu S et al. Performance of a Deep Learning Model vs Human Reviewers in Grading Endoscopic Disease Severity of Patients With Ulcerative Colitis. JAMA Netw Open 2019; 2:e193963.
- 77. Maeda Y, Kudo SE, Mori Y et al. Fully automated diagnostic system with artificial intelligence using endocytoscopy to identify the presence of histologic inflammation associated with ulcerative colitis(with video). Gastrointest Endosc 2019; 89: 408-15.
- 78. Quénéhervé L, David G, Bourreille A et al. Quantitative assessment of mucosal architecture using computer-based analysis of confocal laser endomicroscopy in inflammatory bowel diseases. Gastrointest Endosc 2019; 89: 626-36.
- 79. Chinzei K, Shimizu A, Mori K et al. Regulatory Science on AI-based Medical Devices and Systems. Advanced Biomedical Engineering 2018; 7: 118-23.
- 80. Rees CJ, Koo S. Artificial intelligence-upping the game in gastrointestinal endoscopy? Nat Rev Gastroenterol Hepatol 2019; 16: 584-5.
- 81. de Groof J, van der Sommen F, van der Putten J et al. The Argos project:The development of a computer-aided detection system to improve detection of Barrettʼs neoplasia on white light endoscopy. United European Gastroenterol J 2019; 7: 538-47.
- 82. Quang T, Schwarz RA, Dawsey SM et al. A tablet-interfaced high-resolution microendoscope with automated image interpretation for real-time evaluation of esophageal squamous cell neoplasia. Gastrointest Endosc 2016; 84: 834-41.
- 83. Nakagawa K, Ishihara R, Aoyama K et al. Classification for invasion depth of esophageal squamous cell carcinoma using a deep neural network compared with experienced endoscopists. Gastrointest Endosc 2019; 90: 407-14.
- 84. Figueiredo PN, Figueiredo IN, Pinto L et al. Polyp detection with computer-aided diagnosis in white light colonoscopy:comparison of three different methods. Endosc Int Open 2019; 7:E209-15.
- 85. Gross S, Trautwein C, Behrens A et al. Computer-based classification of small colorectal polyps by using narrow-band imaging with optical magnification. Gastrointest Endosc 2011; 74: 1354-9.
- 86. Takemura Y, Yoshida S, Tanaka S et al. Computer-aided system for predicting the histology of colorectal tumors by using narrow-band imaging magnifying colonoscopy(with video). Gastrointest Endosc 2012; 75: 179-85.
- 87. Byrne MF, Chapados N, Soudan F et al. Real-time differentiation of adenomatous and hyperplastic diminutive colorectal polyps during analysis of unaltered videos of standard colonoscopy using a deep learning model. Gut 2019; 68: 94-100.
- 88. Min M, Su S, He W et al. Computer-aided diagnosis of colorectal polyps using linked color imaging colonoscopy to predict histology. Sci Rep 2019; 9:2881.
- 89. Inomata H, Tamai N, Aihara H et al. Efficacy of a novel auto-fluorescence imaging system with computer-assisted color analysis for assessment of colorectal lesions. World J Gastroenterol 2013; 19: 7146-53.