GASTROENTEROLOGICAL ENDOSCOPY
Online ISSN : 1884-5738
Print ISSN : 0387-1207
ISSN-L : 0387-1207
COMPUTER-AIDED DIAGNOSIS IN GASTROINTESTINAL ENDOSCOPY WITH THE USE OF ARTIFICIAL INTELLIGENCE: CURRENT STATUS AND FUTURE PERSPECTIVE
Yuichi MORI Shin-ei KUDOMasashi MISAWA
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2020 Volume 62 Issue 3 Pages 311-329

Details
要旨

飛躍的なテクノロジーの進化に伴い,内視鏡医が取得する画像の質・データ量は格段に向上している.しかし,求められる診断技術のハードルも同時に向上しており,高精度の内視鏡診断が一部のエキスパート医師に限られているのも事実である.このような先端機器と医療技術のギャップを解決し,「いつでも,だれでも」高パフォーマンスな内視鏡診断を提供できる環境を作ることを目的として,人工知能(AI)を用いたコンピュータ診断支援システムの研究開発がにわかに注目を浴びており,本邦でも2019年3月から内視鏡AIの一部製品の市販が始まっている.本稿では,食道・胃・大腸の臓器別に内視鏡AIの研究状況を概観すると共に,内視鏡AIが直面している課題および,薬事承認の状況についても紹介し,今後の診療現場に内視鏡AIがどのような影響を与えうるのか,考察していきたい.

Ⅰ 内視鏡診断が直面する課題

近年の画像処理技術・高画質化・特殊光の標準搭載等により,内視鏡診断は飛躍的な発展をとげている.しかし,画像情報量の増加とともに,内視鏡医に求められる診断能も明らかに高くなっており,高精度の内視鏡診断ができるのがエキスパートに限られている現況も事実である.

例えば,バレット食道関連腫瘍の内視鏡的検出・診断は容易ではなく,欧米では無作為に複数個の生検をバレット上皮から採取するランダムバイオプシーが推奨されているが,その感度は病変あたり64%程度とされており多数の生検をしているにも関わらず見落としが多い 1)~3.一方,食道扁平上皮癌の診断のゴールドスタンダードとなっているルゴール染色においても90%以上の感度を誇るものの,その特異度は70%程度に留まっており正確な内視鏡診断が実現していない.胃癌においても見落としが10%超あり 4,内視鏡治療が可能な早期癌(T1a-T1b1)を転移のリスクが高い癌(T1b2)と鑑別するのも内視鏡的には容易でないことが分かっている.大腸においてもポリープの見落としは20%-40%程度あるのは公知であり 5,発見した病変の内視鏡診断(腫瘍/非腫瘍の鑑別)の精度も90%に達しないことが分かっている 6

このような,内視鏡診療の内包する「限界」を打開する,新たな解決策として注目が集まっているのが,人工知能(AI)を用いた,コンピュータ診断支援システム(CAD)である.優れたCADが開発されれば,理論的には内視鏡医の技量に関わらず高い標準の診断が実現されるため,その実現が切望されている.新規の機械学習手法である深層学習(ディープラーニング)の登場とともに,にわかに注目を浴び始めている内視鏡AIの領域であるが,実はその研究論文の半数が日本発のものであり,領域として本邦がリードしつつある研究分野でもある(Table 123).本稿では主に医学誌(消化器系・総合内科系雑誌)に掲載された研究成果を中心にレビューすることで,実地医師の視点から見た内視鏡AIの現況について概説したい.なおこのような内視鏡AI研究は情報科学の基礎的・実験的研究・論文の積み重ねの上に医師主導研究が成りたっていることを申し添える.

Table 1 

食道をターゲットとした,人工知能を用いた内視鏡診断支援システム.

Table 2 

胃をターゲットとした,人工知能を用いた内視鏡診断支援システム.

Table 3 

大腸をターゲットとした,人工知能を用いた内視鏡診断支援システム.

Ⅱ AIとは?

AIの定義は定まっていないが,端的にいえば人間の知的な振る舞いの一部をコンピュータが人工的に再現したものである.本稿ではAIの中でも特化型AI,すなわち一つのタスク(要は内視鏡診断)に特化したAIが取り上げられる.なお特化型AIの対極にある汎用AIは,人そのもののような思考・振る舞いをするAIであり,現時点では実現されていない.なおCADはAI技術の使用有無に関わらず,コンピュータ解析によって診断支援をするものであり,コンピュータ検出支援(CADe)とコンピュータ診断支援(CADx)に分類され,内視鏡領域において前者は病変の検出支援,後者は発見された病変の質的・量的診断等を支援するものである.

内視鏡で用いられるAIは,提示された内視鏡画像上の特徴(色・エッジ・面積・テクスチャー等)を量的に把握し,過去にインプットした多量の「答え(病理診断等)」つきの特徴量を参照して,画像の「答え」を予測するシステムである.この多量の答えつきの特徴量をインプットすることによりAIを「鍛える」ことを機械学習という.内視鏡で用いられるAIは二つに大別される.すなわち,特徴量を事前に開発者が指定して機械学習を行うAI(=ハンドクラフト法),および繰り返す学習の中で自ら特徴量を抽出するAI(=ディープラーニング).ハンドクラフト法は旧来の学習方法で,ディープラーニングは最近注目されている新規の手法であり,一般にハンドクラフト法より精度が高いとされるが,ケースバイケースの場合もあるため研究開発の際は慎重なアルゴリズム選別が求められる 7

Ⅲ 食道における内視鏡AI

食道における内視鏡AIは主にi)バレット食道異形成・ii)扁平上皮癌の検出・診断支援をターゲットとしている(Table 1).胃・大腸に比べると研究論文数も少なく,研究デザインも後ろ向き研究に限られるため,その真の有効性については,十分な検証を待つ必要がある.

i)バレット食道異形成に対するCADe

バレット食道における内視鏡AIについてはその有病率の高さから,主に欧米で研究が進められている.van der Sommenらはハンドクラフト法による機械学習でバレット異形成を感度・特異度83%で検出するCADeを開発し 8,2017年にはvolumetric laser endomicroscopy(VLE)を用いてバレット異形成を感度90%・特異度93%で検出するCADeを開発した 9.VLEとは,食道壁を3mmの深さにわたって顕微鏡像に近似した縦断像を取得できる光干渉断層撮影の一種である.類似技術は既に米国で薬事承認も受けており( https://docs.wixstatic.com/ugd/b80cb6_8e40908ecd254060b37174044536eadf.pdf, NinePoint Medical Corp., USA),日常診療への直接の寄与が期待される技術である.

また,近年では深層学習の応用についても研究が進められており,Ebigboらは,74病変から取得した白色光内視鏡画像を対象に,感度97%,特異度88%(交差検定)でバレット関連腫瘍を検出できたことを報告している(Figure 1 10

Figure 1 

バレット食道異型上皮を検出するAI.白色光(左上)でも狭帯域光(左下)でも正しくバレット腺癌(粘膜内癌)が検出されている 10.(図はAlanna Ebigbo先生およびHelmut Messmann先生の御厚意にて提供頂いた).

ii)扁平上皮癌に対するCADe,CADx

食道扁平上皮癌に関するCADx開発の嚆矢となったのは,Endocytoscopy(エンドサイト,オリンパス社)であった.エンドサイトは約520倍の接触顕微観察を可能とする超拡大内視鏡であり,メチレンブルー/トルイジンブルー染色下で粘膜表層の細胞核の観察が可能である.この核を直接観察できるエンドサイトの特質を利用し,Kodashimaらは核の面積を特徴量として算出することによって,癌と正常粘膜を鑑別できるCADxを開発した 11.Kumagaiらはこの研究を,深層学習を用いて発展させ,感度92.6%,特異度89.3%で癌鑑別が可能となりうることを検証した 12.エンドサイトと同様に接触顕微観察を可能とする内視鏡に共焦点内視鏡がある.Shinらは,共焦点内視鏡画像を対象として扁平上皮異型を非腫瘍性粘膜から感度87%,特異度97%で鑑別するCADxを開発した 13

一方で,Horieらは,通常の白色光内視鏡を用いて食道癌を感度98%で検出するCADeを2018年に開発報告した(Figure 2 14.このCADeは偽陽性(=過検出)が多く陽性反応的中率は40%に留まったが,陰性反応的中率が95%と極めて高いため,見落とし予防の目的では臨床的に有用性が期待できる.

Figure 2 

食道の扁平上皮癌を検出するAI.図の緑四角は医師がつけた正解データ,白四角は人工知能が食道がんを疑って検出した領域 14.(図は多田智裕先生の御厚意により提供頂いた).

食道拡大内視鏡の領域でもAI研究が始まりつつある.Eversonらは深層学習を用いて食道のIPCL(intrapapillary capillary loop)を分類できないか試みた.17人の患者画像データを用いたパイロット研究では感度89.3%,特異度98%で腫瘍が鑑別できることが報告されている 15

Ⅳ 胃における内視鏡AI

胃における内視鏡AIは主にi)胃癌の検出・診断支援,ii)胃癌の深達度診断支援,iii)ピロリ菌感染の予測がターゲットになっている(Table 2).その有病率から日本・中国からの研究論文が多く,検出・病理予測・範囲診断・予防(ピロリ菌感染予測)に至るまで幅広い領域で研究が行われているが,研究デザインはほとんどが小規模の後ろ向き研究であり,前向き試験による再現性のある結果の公表が待たれる.

i)胃癌に対するCADe,CADx

2018年Hirasawaらは深層学習で胃癌の検出を支援するCADeを世界で初めて報告した 16.CADeは前述のHorieら 14とほぼ同様のアルゴリズムで癌に対する感度92%,陽性反応的中率は31%であった(Figure 3).一方で,Wuらも同様に,深層学習を用いて感度94%,特異度91%で胃癌を検出するCADeを報告し,これは参加した内視鏡医の診断を凌駕する成果であった(Figure 4 17.これらの試験は,既に内視鏡医が撮影した静止画を対象とした検証であったため,より「リアルワールド」に近いデータである内視鏡動画におけるフレームベースの診断感度・特異度が明らかになることを期待したい.

Figure 3 

早期胃癌を検出するAI.88.6%の信頼度で黄四角部分に早期癌が存在することを示している 16.(図は多田智裕先生の御厚意にて提供頂いた).

Figure 4 

胃癌を検出するAI.赤四角部分に早期癌が存在することを示している.なお,図の左下部分は,内視鏡が観察済の領域が色で示され,観察されていない領域が黒く塗りつぶされている 17),18.(図はHong Gang Yu先生の御厚意にて提供頂いた).

胃癌の検出と同様に,重要と考えられているのが観察範囲の監視システムである.すなわち,胃内視鏡検査では術者によって観察が不十分な部分(胃角前脚や体部小彎後壁等の視認が難しい領域)があり,これが胃癌の見逃しの大きな原因の一つとなっている.この「観察領域の見落とし」を防ぐシステムをWuらは開発し,ランダム化比較試験でその精度を検証し注目を集めた 18.このシステムは,深層強化学習というアルゴリズムを採用している.深層強化学習は,将棋や囲碁のAIで採用されるアルゴリズムで,ゲームのような手順・ルール等が定まっている対象において,繰り返し定まった手順を繰り返すことで教師データなしに半自動的に機械学習し高精度を達成する学習法である.精度評価においては,324人の患者がAI群(153名),非AI群(150名)に割り付けられ,結果,AI群の方が有意に見落とし領域の割合が少ない(5.86% vs 22.46%,P<0.001)ことが分かった.内視鏡検査自体のクオリティを向上されるうえで,非常に期待のもてるAIであると考えられるとともに,深層強化学習という一見,内視鏡には不向きなAIを見事に適応した点において大変評価される研究である.

一方,胃癌の質的診断については,拡大内視鏡と特殊光を組み合わせた胃癌の病理診断予測・範囲診断は学問として急速に成熟し,特に本邦では日常診療で欠かざるものとなった 19)~25.しかし,依然として非熟練者や海外に目を向けると,拡大内視鏡による胃癌診断はその難解さから一般診療に溶け込んでいない.Miyakiら 26はこの問題にAIを用いて解を与えることを試みた.すなわち,拡大FICE(Fuji Intelligent Color Enhancement;Fujifilm Corp.)観察により癌と非癌の領域を感度85%,特異度87%で識別できるCADxを構築した.アルゴリズムは従来の機械学習の標準的技法であるsupport vector machine(SVM)を用いて学習・分類作業を行っている.Miyakiらは引き続き,同様の手法を拡大BLIに応用し,先行研究を裏付ける成果が得ている 27

一方で,Kanesakaらは胃癌の範囲診断にAIを用いることに世界で初めて挑戦した 28.すなわち,拡大NBI画像をターゲットとして,癌の存在診断だけでなく,領域診断を行うAIを開発した.126枚の拡大NBI画像を,細かいピクセル単位に分割し,その特徴をSVMで学習し,癌の領域診断を感度66%,特異度81%で達成した.

ii)胃癌の深達度診断支援

「検出」され,「病理診断予測」(あるいは生検による確定診断)がなされた胃癌について,次に実施される診断ステップは「深達度診断予測」である.すなわち,内視鏡治療が考慮されるT1a~T1b1までの病変なのか,リンパ節転移のリスクがあり手術治療が推奨されるT1b2以深の深達度なのかの判別である.胃癌における深達度診断は,かねてより白色光所見に基づいた主観的な診断に頼らざるを得ない局面が多かった.しかし,AIで深達度診断を支援できる可能性が見えてきた.

Kubotaら 29は,ニューラルネットワークを用いて深達度診断を行うCADxを開発,344病変の胃癌画像を用いてT1,T2,T3,T4を77%,49%,51%,and 55%の正診率で予測しうることを示した.なお,本システムを使った粘膜内癌と粘膜下層浸潤癌の鑑別正診率は69%であった.続いて,Zhuらは早期胃癌にターゲットを絞り,深層学習を使うことで更に高精度(特異度76%)の深達度診断予測(T1a-T1b1 vs T1b2)が可能となりうることを示した 30.96%と非常に高い特異度は,臨床において過剰手術を抑制するため,極めて臨床的にも有用性が期待できるAIである.

iii)ピロリ菌感染の予測

ピロリ菌感染は慢性胃炎・腸上皮化成を介して胃癌の原因となりうるため 31)~33,内視鏡でピロリ菌感染を拾い上げることが重要視されているが,その診断精度,特に感度は十分でないことが分かっている 34.AIはこのようなピロリ菌感染の見落としを拾い上げる機能を期待されており,アジアを中心に研究が進んでいる.

2004年,Huangら 35はニューラルネットワークを用いてピロリ菌感染を予測するAIを報告した.30例の患者画像で学習し,74例で検証された結果,ピロリ菌感染を感度85%・特異度91%で予測することができた.

一方,Shichijoら 36は深層学習でピロリ菌感染を感度89%,特異度87%で予測するAIを報告した.これは内視鏡医による正診率(82%)より有意に高い精度であった.続いてこのグループ 37は,更に大量の試験画像(=847人の患者)を用いて,ピロリ菌の除菌例も加味した検討を行った.結果は,ピロリ未感染例については正診率80%,除菌例については正診率84%,感染例については正診率48%で予測できることが分かった.感染例の正診率が十分な水準に達しなかったが,除菌例と感染例の鑑別という非常にチャレンジングかつ実臨床に基づいた課題に取り組んだ意欲的な研究内容であり,今後の精度向上および臨床導入に期待したい.

別の研究グループからも同様に深層学習を用いたピロリ菌感染の予測については報告がある.Itohら 33は感度87%特異度87%で感染予測ができうることを示した.引き続き,同グループのNakashimaら 38は通常内視鏡画像ではなくBLIやLinked Color Image(LCI,Fujifilm Corp)を用いることで,より精度の高いAIが構築できることを示した(Figure 5).構築されたAIのピロリ菌感染に関するROC曲線のAUC値は白色光画像が0.66であったのに対し,BLI-brightとLCIはそれぞれ0.96,0.95と有意に高精度であった.

Figure 5 

ピロリ菌の感染を予測するAI.aはLinked color imaging(Fujifilm Corp.),bはblue laser imaging-light(Fujifilm Corp.).ともに萎縮領域がヒートマップ上で特定されているのが分かる(c,d) 38.(図は中島寛隆先生の御厚意にて提供頂いた).

Ⅴ 大腸における内視鏡AI

大腸における内視鏡AIは主にi)大腸ポリープのCADe・ii)大腸腫瘍の病理診断予測・iii)大腸癌の深達度診断支援・iv)潰瘍性大腸炎の診断支援をターゲットとしている(Table 3).大腸内視鏡に対するAIは最も研究が盛んで,大規模な前向き研究が既に複数報告されており,実地医療への導入が最も早期に期待される分野である.後述するように,既に複数のAIが大腸領域で薬事取得・販売に至っており,今後の臨床への展開に特に注目したいモダリティである.

i)大腸ポリープのCADe

CADeについては,2000年代から様々な画像特徴量(エッジ検出・テクスチャー解析・エナジーマップ等)を利用してポリープを自動検出する手法が検討されていたが,検出率が安定して90%を超えることはなく,また計算機能力の限界から,リアルタイムでの診断に成功した事例はなかった 39),40.しかし,莫大な演算性能をもつGPU(Graphic Processing Unit)が画像表示だけでなく汎用計算にも使用できるような環境が整い(GPUを用いた汎用計算;GPGPU),ディープラーニングの計算時間が著明に短縮,しかもディープラーニングの精度が従来手法より格段に良いことが分かり,状況は一変した.この深層学習を利用することで,精度90%超でリアルタイムにポリープの検出ができる可能性がでてきた.

最初に深層学習を利用したCADeを医学誌に報告したMisawaらは,時間的要素を加味した畳み込みネットワークを用いることで,感度90.0%・特異度63.3%(フレームベース)でのリアルタイム・ポリープ検出を可能とした(Figure 6 41.続いて,Urbanらはより多様な内視鏡静止画を学習画像に利用することで,感度93.0%・特異度93.0%(フレームベース)という極めて高精度でポリープ検出を可能とした 42.しかしながら,これらの研究はあらかじめ用意されたテスト用動画を用いたex vivo研究であり,CADeの実臨床での有用性は当初確認できていなかった.

Figure 6 

画面中央やや左側に5mm前後の発赤長平坦病変が確認でき,これをAIが検出し,画面外側に黄色のアラートと確率(=61%)で表示.この表示方法は,ポリープの場所を内視鏡医が探す必要があるが,内視鏡画像表示エリアには何も表示されないため,内視鏡医が集中力を保ちやすい利点がある 41

これに対し,Wangら 43は,1,058名の患者を対象としたランダム化比較試験(RCT)を実施,CADe群の腫瘍検出率が29.1%と対照群の20.3%を有意に上回る精度であることを報告した.内視鏡AI研究の中で初のRCTである本研究は,衝撃をもって受け止められたが,対照群の腫瘍検出率が比較的低かったこともあり,追試が必要と考えられている.このような追試は,CADeに関するもう一つの前向き研究であるKlareらの報告が,negativeな結果であったことからも裏付けられる 44.55人の患者に対してCADeをリアルタイムに使用したこの前向き試験では,腫瘍検出率自体は29.1%と良好であったものの,医師が検出したポリープのうち四分の一がCADeによって見逃されていた.このように,CADeによるポリープ検出のエビデンスについては議論の余地が残るため,慎重な解釈が必要である.

なお,Wangらの検討によると,CADeが新規に発見した病変のほとんどは5mm以下の腺腫あるいは過形成性ポリープといった,悪性度の低いものであったことが分かっている 43.本来ならば,悪性度が高くかつ検出も難しい,非顆粒型の側方発育型腫瘍や陥凹型腫瘍の検出支援が期待されるが,対象とする学習用画像が十分でない現況を考えると,実現には相当以上の時間がかかるであろう.

ii)大腸腫瘍の病理診断予測

a)拡大内視鏡を対象としたCADx

病理診断予測を担うCADxの対象となるモダリティとして最も研究されているものは拡大内視鏡である.2000年代より色素拡大内視鏡(=Pit pattern)を対象とするCADxの研究が口火となり 45),46,2010年代からは拡大NBI画像をターゲットとした報告 47が複数の研究グループからなされている.興味深いことに,これらの報告の中には,リアルタイム診断を実現 46),48した実用化に近い報告もあった.当時の診断アルゴリズムは,ハンドクラフトにより抽出される特徴量を,機械学習(SVM等)で学習・分類する手法が主流であった.本研究分野において,広島大学のグループが果たした役割は大きく,Kominamiらが実施した前向き試験(41人118病変を対象にリアルタイムにCADxを実証.腫瘍に関する感度93.3%・特異度93.3%を達成)は,小規模ながら当該研究分野の唯一の前向き試験として多数の引用を受けている 48

一方で,本領域でもディープラーニングの出現が注目を集めている 49),50.Chenら,Byrneらは,ともに感度90%超で腫瘍・非腫瘍の鑑別をするCADxの開発に成功した.学習症例数を増加させることにより更なる精度向上が期待されており,今後の前向き試験による実証が待たれる.

なお,本研究分野のほとんどは腫瘍・非腫瘍の鑑別をターゲットにした研究であるが,Tamaiらは拡大NBI画像を対象にT1b癌の鑑別を行うCADxを開発,感度83.9%・特異度82.6%で識別できることを報告した 51.大腸T1b癌の鑑別は容易でなく精度80%にも満たないことが知られているため 52,このCADxが実用化された場合には診療現場への多大な恩恵が期待できる.

このように,拡大NBIをターゲットとしたCADxは多数の検討がなされているが,実用化に向けて乗り越えるべき2点のハードルがある.一つ目は,拡大NBIの関心領域(病変部位・非病変部位が混在する内視鏡画面の中で,「医師が見たい」部分)を内視鏡医が人為的に画面上で指定しなければならないというlimitationである(ディープラーニングによって関心領域を自動抽出する発想もあるが,そもそもその自動抽出の精度が100%ではないため,非現実的である).2点目の問題点は,研究のほとんどが後ろ向き研究あるいは小規模の前向き研究であり,結果の再現性が確立していない点である.このような課題が克服されれば,普及率が高い拡大NBIは,CADxのメインプレイヤーとなりえる.

b)Endocytoscopyを対象としたCADx

Endocytoscopyは,以下の特徴により,CADxに非常に適した(=開発が容易な)内視鏡である.1)超拡大観察機能かつ接触観察機能により,画面全体が関心領域となる 2)超拡大画像と非超拡大画像が大きく異なる画像のため,超拡大内視鏡画像時に自動解析するCADxが構築可能.

この利点を生かして昭和大学・名古屋大学の医工連携チームで開発されたCADxは,複数の後ろ向き研究で腫瘍診断感度90%以上が担保できることを確認した後 53)~58,Moriらにより大規模な前向き研究が実施された(Figure 7 59.この試験では791名の患者を対象に,リアルタイムでEndocytoscopyを用いたCADxが使用され,計466個の微小大腸ポリープの病理診断予測が行われた.感度92.7%,特異度89.8%で腫瘍が鑑別可能なことが検証され,実臨床においてもCADxが有用であることを示した.なお,Endocytoscopyを利用したCADxは本邦初の内視鏡AIとして2018年12月に薬事承認を受けている(販売名:EndoBRAIN).薬事承認取得の過程では,日本医療研究開発機構(AMED)の支援のもと,国内5施設(昭和大学横浜市北部病院・国立がん研究センター中央病院・国立がん研究センター東病院・静岡県立静岡がんセンター・東京医科歯科大学)による多施設共同研究が実施された(unpublished data).

Figure 7 

超拡大内視鏡(CF-H290ECI,Olympus Corp.)のNarrow-band imagingでの画像をAIが解析し,対象病変がneoplastic(=腫瘍)であると予測している 55),59

なお,Endocytoscopyと並び,もう一つの市販されている超拡大内視鏡である共焦点内視鏡(Cellvizio, Mauna Kea Technologies社)についても,CADxが研究開発されているが,研究の量・精度ともに十分でないのが現況である 60),61

c)自家蛍光(Autofluorescence)内視鏡を対象としたCADx

自家蛍光内視鏡を対象としたCADxには大きく分けて二つの研究開発が実施されている.一つは,自家蛍光スペクトロスコピーを用いたCADx,もう一つは自家蛍光内視鏡(Auto-fluorescence imaging;AFI,オリンパス社)を用いたCADxである.前者については,既にアメリカ・ヨーロッパにて薬事取得を果たした製品があり(WavSTAT4,ペンタックス社),二つの前向き試験が実施済である 62),63.しかしながら,WavSTAT4は,新規に大がかりな内視鏡ユニットを用意する必要があり,広く使用されるには至っていない.

オリンパス社のAFI光を用いたCADxについては,2013年ころより研究が進められてきた.二つの前向き試験が実施済であり,Aiharaらは32人102病変を対象に感度94.2%,特異度88.9%の精度で腫瘍鑑別できることを報告 64,Horiuchiらは,95人258病変を対象に感度80.0%特異度95.3%で腫瘍鑑別できることを報告した(Figure 8 65.AFI内視鏡は既に市販化されており,前向き試験の結果も良好であるため,本CADx技術の実用化が期待される.

Figure 8 

自家蛍光内視鏡画像の中の関心領域(小さな赤四角で囲んだ部位)の色調をa解析することで,リアルタイムで対象病変が腫瘍なのか非腫瘍なのかを予測するAI.本症例はG/R比が0.815であるため腫瘍と診断された 64),65.(図は玉井尚人先生,堀内英華先生の御厚意にて提供頂いた).

d)通常内視鏡画像を対象としたCADx

白色光を用いた通常内視鏡観察が,内視鏡診断の礎にあり,かつ最も簡便な方法であるのは論を俟たない.しかしながら,通常内視鏡画像を用いたCADxに関する研究開発は,上述のa)~c)と比較すると遅々として進んでいなかった 66.Komedaらはディープラーニングを用いて通常内視鏡画像をターゲットにしたCADxを開発し,質的診断に取り組んだが,高い精度は実現できておらず(交差検定での精度:75.1%) 67,Rennerらのグループも感度特異度ともに80%を超える精度を達成することができていなかった 68.これは,AIそのものの問題ではなく,拡大NBIやEndocytoscopy等と比較すると白色光通常内視鏡のもつ画像情報量が限定されるためと考えられる.

一方で,近年ディープラーニングでなくハンドクラフト法を用いた手法で,通常内視鏡画像CADxの精度を上げた研究が報告された(腫瘍/非腫瘍の鑑別における感度92.3%,特異度89.2%) 69.ディープラーニングは素晴らしい手法であるが,本研究のようにハンドクラフト法が極めて良い精度を達成することがあるのも事実であり,内視鏡AI研究については,ディープラーニングを盲目的に使用するのではなく,適宜ハンドクラフト法と比較しながら状況によって使い分ける知識・柔軟さが必要とされる

iii)大腸癌の深達度診断支援

CADxの新分野として,T1b癌診断がにわかに注目を集めている.TakedaらはEndocytoscopyを大腸癌に使用することにより,表層の癌細胞の所見を拾い上げられる点に注目し,浸潤癌の診断予測を可能とするCADxについてex vivoの評価を行った(Figure 9 70.感度89.4%・特異度98.9%の精度が確認できたが,前向き試験による精度検証結果が待たれる.

Figure 9 

超拡大内視鏡(CF-H290ECI,Olympus Corp.)のメチレンブルー染色観察像をAIで解析することにより,非腫瘍/腺腫(粘膜内癌を含む)/浸潤癌 を識別するシステム.本症例は核が腫大・濃染されている進行癌であり,99%の信頼度で浸潤癌であると予測された 70

更に実用に近い例では,通常内視鏡画像をターゲットにして,Itoらは,深層学習を用いてT1b癌を感度67.5%・特異度89.0%で鑑別可能なCADxを報告 71,Luiらは,治癒切除可能な大腸病変(高分化型腺癌かつ,脈管侵襲陰性かつ,粘膜下層浸潤距離1,000μm未満)の鑑別を感度88.2%特異度77.9%で可能とするCADxを報告している(Figure 10 72.これらは極めて初期段階の小数例での検討ではあるが,将来的には困難なT1b癌診断を強力にサポートしうるツールとなりうるため,今後の研究開発に期待したい.

Figure 10 

早期大腸癌のnarrow-band imaging(Olympus Corp.)画像をもとに,その病変が内視鏡治療で治癒可能病変(Curable,粘膜下層浸潤距離1,000μm以下,脈管侵襲陰性)なのかどうかを予測するシステム.図のように,内視鏡の写真ごとにcurableかincurableであるかの確率を計算し,複数の画像所見を総合して最終的な推論を行う 72.(図はThomas K.L. Lui先生の御厚意にて提供頂いた).

iv)潰瘍性大腸炎の診断支援

潰瘍性大腸炎の診療において,粘膜治癒および組織学的治癒の重要性が重視されており,組織学的活動性の持続が病状の再燃・長期的発がんリスクにより強く関連している可能性が指摘されている 73.しかしながら,粘膜治癒および組織学的治癒を内視鏡的に正しく予測するのは難しく,検査再現性も十分ではないため,検査の客観化の必要性が求められていた 73),74.この潰瘍大腸炎のAIに関する研究がごく最近4報立て続けに報告された.うち,二報が白色光内視鏡をターゲットとしたもの(Figure 11 75),76,残りが超拡大内視鏡をターゲットとしたものである(Figure 12 77),78.いずれも比較的小数例の後ろ向き試験で,既存の内視鏡診断を上回る炎症の診断能を示した試験である.端緒についたばかりの研究分野であるが,潰瘍性大腸炎は患者数が年々増加するcommon diseaseの一つであるため,今後の研究発展を見守りたい.

Figure 11 

Mayoの内視鏡粘膜治癒のスコアリングを用いて,白色光画像の炎症状態を予測する人工知能.本画像では97.4%の確率でMayo 1であると予測された 75.(図は多田智裕先生の御厚意にて提供頂いた).

Figure 12 

超拡大内視鏡(CF-H290ECI,Olympus Corp.)のnarrow-band imagingでの画像をAIが解析し,潰瘍性大腸炎の粘膜が組織学的に治癒しているかどうかを推測するシステム.本画像では91%の信頼度で組織学的な炎症が陽性(教師データは,Geboesスコアに準拠)であると予測された 77

Ⅵ 薬事承認をめぐる現況

このように内視鏡AIの研究は盛んであるが,一般臨床で使用するためには大きなハードルがある.すなわち,「医療機器」として薬事承認を取得することが必要である.これは内視鏡AIが,その用途によって大小様々な臨床リスクを内包するデバイスであるからである.2018年,医薬品医療機器総合機構(PMDA)の委託下に結成されたAI専門部会(部会長:光石衛)は,医用AIをそのリスクに応じて5レベルに分類し,特にレベル3以上の医用AIには(誤診に伴う)重大リスクを含有すると報告した 79.医用AIに関する規制当局の見解は欧米でも一致しており,米国食品医薬品局(FDA)も医用ソフトウェアをカテゴリー1~4に分類し,カテゴリー2の一部以上は高いリスクを含むため,より厳格な薬事審査プロセスが必要であると明記されている.このように,内視鏡AIの利用については薬事承認が必要と考えられており,未承認のAIを臨床使用することは原則できない.

2019年6月現在,日本で薬機法承認を受けている大腸内視鏡用のAIはEndocytoscopyをターゲットとした「EndoBRAIN」(製造:サイバネットシステム株式会社・販売:オリンパス株式会社)のみである.海外においては,そのほか三つの内視鏡AIが大腸内視鏡用として薬事取得済の状況である.一つ目は自家蛍光スペクトロスコピーを対象としたCADxである「WavSTAT4」(製造販売:HOYA社)がFDA承認およびCEマーク取得(EU領域における医療機器認証システム)しており,二つ目は大腸ポリープを対象としたCADeである「GI Genius」(製造:COSMO AI社・販売:Medtronic社)がCEマークを取得,三つ目は,同じく大腸ポリープを対象としたCADeである「DISCOVERY」(販売Pentax社)がCEマークを取得している.このように,現時点で承認取得済の内視鏡AIは限られている状況であるが,昨今の内視鏡AIに関する研究開発の盛り上がりを鑑みると,これから数年で状況は一変することが想定される.

Ⅶ まとめ

食道・胃・大腸を対象とした内視鏡AIについて,「検出」・「病理診断予測」に主な焦点を当てて紹介した.昨今,AIは内視鏡医療の分野でも確実にその存在感を増している.しかし,ニュース性が先行しすぎ,過剰な期待がされているのもまた事実である.本稿のTable 123でご紹介したように,内視鏡AIの約半分は本邦初の論文報告でその数は世界一であるが,ほとんどがエビデンスレベルの低い探索的研究であり,最も信憑性が高いランダム化比較試験はいずれも国外(中国)から発信であり 18),43,近年のNature関連雑誌でもその二報のみが紹介されている状況である 80.すなわち,本研究領域が新規性で注目を集める時期は既に終了しており,世界の関心は「エビデンス構築」にシフトしつつある現況にある.「臨床導入」が始まったばかりの内視鏡AIであるが,その「有効性」と「限界」を認識したうえで上手に診療に生かしていくことで,真に患者様に恩恵のある内視鏡診療につながることを期待し,本稿をまとめたい.

謝 辞

図の提供を頂いたAugsburg Medical Centerの Alanna Ebigbo先生,Helmut Messmann先生,ただともひろ胃腸科肛門科多田智裕先生,武漢大学人民医院Hong Gang Yu先生,早期胃癌検診協会中島寛隆先生,東京慈恵会医科大学玉井尚人先生,堀内英華先生,香港大学 Thomas K.L. Lui先生に厚く御礼申し上げます.また,本総説において,多大な貢献を頂いた以下の先生・企業に御礼申し上げます.名古屋大学情報学研究科の森健策先生・伊東隼人先生・小田昌宏先生,昭和大学横浜市北部病院消化器センターの全スタッフ,オリンパス株式会社,サイバネット株式会社.

 

本論文内容に関連する著者の利益相反:森 悠一(オリンパス),三澤将史(オリンパス)

文 献
 
© 2020 Japan Gastroenterological Endoscopy Society
feedback
Top