GASTROENTEROLOGICAL ENDOSCOPY
Online ISSN : 1884-5738
Print ISSN : 0387-1207
ISSN-L : 0387-1207
CURRENT STATUS AND FUTURE PERSPECTIVE ON ARTIFICIAL INTELLIGENCE FOR LOWER ENDOSCOPY
Masashi MISAWA Shin-ei KUDOYuichi MORIYasuharu MAEDAYushi OGAWAKatsuro ICHIMASAToyoki KUDOKunihiko WAKAMURATakemasa HAYASHIHideyuki MIYACHIToshiyuki BABAFumio ISHIDAHayato ITOHMasahiro ODAKensaku MORI
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2021 Volume 63 Issue 7 Pages 1402-1416

Details
要旨

大腸癌の世界的な罹患率と死亡率は依然として高い状態である.大腸内視鏡検査は,腫瘍性病変の発見と切除のためのゴールドスタンダードと考えられている.しかし,大腸内視鏡検査は,人間のパフォーマンスの限界に関連したいくつかの不確実性を包含する.第一に,1回の大腸内視鏡検査では,大腸腫瘍性病変の約4分の1が見逃される.第二に,optical biosyに関しては,エキスパートでない医師が高い精度で診断することは依然として困難である.第三に,腺腫検出率に関連するいくつかの質の指標(例えば,盲腸到達,腸管前処置,抜去速度など)の記録が不完全な場合がある.近年の機械学習技術の向上とコンピュータ性能の向上に伴い,人工知能を用いたコンピュータ支援診断は,内視鏡医に利用されるようになってきた.特に,深層学習の出現により,従来の機械学習技術よりもコンピュータ支援システムの開発が容易になり,現在では,前者が大腸内視鏡によるコンピュータ支援診断の標準的な人工知能と考えられている.これまでのところ,コンピュータ支援検出システムは,腫瘍性病変の検出率を向上させる可能性が指摘されている.さらに,コンピュータ診断支援システムは,optical biopsyにおいて診断精度を向上させる可能性がある.さらに,大腸内視鏡検査の質の向上を目的とした,いくつかの人工知能支援システムが報告されている.コンピュータ支援システムを臨床現場に導入することで,パフォーマンスの低い内視鏡医の教育やリアルタイムの臨床意思決定の支援など,さらなる利点が得られる可能性がある.

本レビューでは,主に消化器内科医から報告されている大腸内視鏡検査時のコンピュータ支援診断に焦点を当て,その現状と限界,今後の展望について考察した.

Ⅰ はじめに

大腸癌は,全世界でがん関連死の主な原因となっている.その対策として,大腸内視鏡検査において腫瘍性病変を徹底切除することが,大腸癌の罹患率と死亡率の両方を低下させる確実な手段であると考えられている 1),2.しかし,大腸内視鏡検査のクオリティは内視鏡医の熟練度によって異なる.大腸内視鏡検査による腺腫検出率(ADR)は,大腸内視鏡検査後に発見される大腸癌の罹患率や死亡率と逆相関することから,大腸内視鏡のquality indicator(QI)とされる 3),4.したがって,大腸内視鏡検査のクオリティを標準化し,それによって病変の見逃し数を減らすことが望まれる.

発見された病変の内視鏡診断の精度は別の問題である.正確な内視鏡診断を担保として,病理組織学的診断の代替として,内視鏡診断を採用する考えも提唱されるようになっている.米国消化管内視鏡学会(American Society of Gastrointestinal Endoscopy)は,Preservation and Incorporation of Valuable Endoscopic Innovations(PIVI)を提案しており,直腸からS状結腸の微小腺腫に対する陰性的中率(NPV)が90%以上であれば,過形成ポリープに対してはleave in situが認められ得るとしている 5.しかし,このような内視鏡診断の高い精度を,特に日常臨床において達成することは難しいことも報告されている 6)~8

コンピュータ支援診断(CAD)は,ヒューマンエラーに対処するための手段として,近年注目を集めている.大腸内視鏡検査におけるCADの主な役割は,コンピュータ検出支援(CADe)とコンピュータ診断支援(CADx)である.CADeは大腸内視鏡検査中に病変の存在と位置をリアルタイムで表示することで,モニターに表示されているが,目視では見落としがちなポリープを発見できる可能性がある.さらに,検出された病変の病理学的予測や内視鏡的分類を出力することで,CADxはより正確な内視鏡診断を提供し得る.

本レビューでは,主にこの分野における医師主導の研究を参考に,大腸内視鏡検査におけるCADの活用の現状を評価する.

Ⅱ 機械学習とディープラーニング

まず,内視鏡医の視点から機械学習について解説する.人工知能(AI)の一種であるディープラーニング(深層学習とも呼ばれる)は,画像分野においてすでに人間を凌駕する性能を持っていると言われており,近年注目を集めている.ディープラーニングのもう一つの強みは,膨大な数の学習サンプルがあれば,対象となる疾患の特徴を自ら見つけ出すことができることである.一般的に,使用する訓練画像数が多ければ多いほど,ディープラーニングに基づいたAIの性能(感度,特異度など)は向上すると言われている.このように,膨大な数の画像や動画を用いて訓練を行えば,AIは非常に優れた性能を発揮する.これに対して,サポートベクターマシンのようないわゆる浅い学習(シャローラーニング)では,訓練サンプルから手動で特徴を抽出する必要がある.例えば,シャローラーニングを用いて大腸ポリープを検出するシステムを開発する場合,内視鏡画像からポリープの色や形状などの特定の特徴を抽出するアルゴリズムを作らなければならない.しかし,大腸ポリープの色や形状は様々であり,ロバスト性の高い特徴抽出アルゴリズムの開発は困難である.このような開発には医用画像解析の専門家である情報工学のエンジニアが必要とされることが多い.一方ディープラーニングでは要求される情報工学的な専門性はそれほど高くないため,一般的なソフトウェアエンジニアでも実装が可能であり,爆発的な普及につながっている.しかし,シャローラーニングはディープラーニングに比べて学習画像数が少なくて済むため,こと学習画像(=個人情報)を集めることに大きな障壁がある医療などの分野では,注目したい重要な技術である.

Ⅲ 大腸病変のCADe

後方視的な研究

大腸ポリープのCADeに関する最初の研究は,2003年に2つのグループによって報告された 9),10.これらのパイロット研究では,画像から特徴を抽出するためウェーブレット変換と呼ばれる工学的な手法を使用しており,90%以上の感度が得られている.これらの研究を参考とし,他のグループはアルゴリズムに様々な技術的なアイデアと修正を適用した 11)~19.これらの研究のほとんどは,公開された内視鏡画像データベース(CVC-ColonDBやASU-Mayoなど)の静止画像を使用した研究で,48%~90%の感度を達成した.この感度は一見すると,許容できる性能を示しているように思われるが,これらの公開画像データベースに含まれる病変数は20個未満と少なく,この結果を一般化することはできないと考えられた.これらとは対照的に,スペインのグループは,24本の動画を使用して研究を行っており,70%以上の感度と特異度が得られた 20.この研究では,この分野で医師が主導した最初の研究であるという点でも特徴であった.しかし,このような「手作り」のシャローラーニングの実用化には,計算速度,感度の低さ,血管や便物,ひだの存在による偽陽性など,様々な障壁が存在したが,ディープラーニングの登場によりこの状況は一変した.

最近になって,ディープラーニングを用いたCADeの医師主導の研究が報告されるようになっている.Misawaらは3次元畳み込みニューラルネットワークを使用したCADe 21を開発した(Figure 1).病変が映っている動画50本,病変が映っていない動画85本を用いて,感度90%,特異度63 %という結果を報告している.その後,Urbanらは実験的に優れた性能を持つCADeを開発した.このCADeはAUROCが0.991,感度が96% 22と極めて高性能であった.最近では,Wangらが,動画ベースの解析で感度90%以上,特異度90%以上のCADeモデルを報告している 23.Wangらの研究の強みは,多数の画像,患者,動画を使用した評価を行ったことであり,信頼性の高い結果である(彼らのテストセットは,1,138人の患者からの静止画像27,113枚,111人の患者からの138病変を含む動画,ポリープを含む54本の大腸内視鏡検査の動画で構成されている).Yamadaらは,病変画像1,244枚,動画から得られた891フレーム,非病変画像2,843枚を用いてCADeを学習させ,感度97.3%,特異度99.0%を達成した.しかし,興味深いことに,動画データをCADeに入力すると,感度は74.6%に低下した 24.この感度の違いは,動画データからの学習サンプル数が少ないことが原因であると考えられる.Misawaらは,大腸内視鏡用CADeの研究・開発を容易にするために,公開された大規模な大腸内視鏡動画のデータベースを立ち上げている 25

Figure 1 

大腸病変のコンピュータ支援検出の一例(文献21).

内視鏡画像の四隅に色をつけて警告音を発する.

CADeを使用した前向き研究

近年,CADeを用いた前向きランダム化比較試験(RCT)がいくつか報告されている.Wangらが1,058人の患者を対象に実施したRCTでは(CADeあり;536人,CADeなし;522人),CADe群は有意に高いADRを達成した(29% vs. 20%,P<0.001)ことを報告している(Figure 2 26.Suらの研究では,308人の患者と315人の患者をCADe群と対照群に分けて解析したところ,CADe群ではADRが有意に高かった(29% vs. 17%,P<0.001) 27.また,Liuらは,CADeを用いた1,026人の患者を対象としたRCTを実施し,Misawaらと同じアルゴリズムで実施した 21研究では,CADe群のADRが有意に高かった(39% vs 24%,P<0.001) 28

Figure 2 

コンピュータ支援検出システム(文献26).

検出されたポリープの境界線を青色で出力されている.

これらの研究はいずれもCADeのADRが有意に高いことを報告している.しかしながら,いくつかの注目すべき要素がある.第一に,これらの研究ではadvanced adenomaの検出率が有意に増加したわけではなく,いずれの研究でも微小腺腫の検出率が増加しただけであった.第二に,これらの研究は非盲検でありバイアスが排除しきれていない.最後に,これらの研究はすべてアジアの1カ国で実施されたものである.したがって,これらの結果は欧米諸国では適用できないかもしれない.これらの欠点は最近,他の研究者によって取り組まれている.Gongらは,CADeシステムを用いて10mm以上の腺腫検出率が有意に高いことを報告している.彼らのCADeシステムには,腸管前処置,スコープの抜去速度をモニタリングする機能が追加されていた.われわれの知る限りでは,これはCADeがadvanced adenomaの検出割合を向上させる可能性を持っているという最初の報告であった 29.抜去速度をモニタリングすることで間接的に内視鏡の死角を減らしていた可能性があり,これに起因してadvanced adenomaの検出割が増えていると考えられた.Wangらは,あえて偽陽性を出力するsham-AI(偽のAI)を用いた興味深い盲検化RCTを実施した.この研究では,CADeのADRがsham-AI群よりも有意に高いことが示された(34%対28%,P=0.03) 30.Repiciらは,EU当局に承認されたCADeシステム(GI Genius;Medtronic, Dublin, Ireland)を用いた多施設RCTを実施した.685人の患者をCADe群とCADeなし群に割り付け,CADe群のADRが有意に高いことを確認した(54.8%対40.4%) 31

われわれはこれらCADeを使用した前向きRCTの結果をまとめるために,メタ解析を行った.その結果,CADeを用いた場合のADRは33.7%(95%CI:31.9%~35.6%)であったのに対し,CADeを用いない場合は22.9%(95%CI:21.3%~24.6%)であった(Figure 3).このように,現状ではCADeシステムはADRを増加させると考えられた.

Figure 3 

コンピュータ支援検出システムの腺腫検出率に関するフォレストプロット.

前述の研究はいずれもRCTであり,質の高い研究とされている.一方で,back-to-back試験は,大腸内視鏡検査のクオリティを表すもう一つの重要な指標である腺腫見逃し率を評価できるため,CADeシステムの有効性を評価するのにも有用であると考える.最近,Wangらは,自分たちが開発したCADeシステムを用いたランダム化back-to-back試験を報告した.その結果,CADeを使用した場合の腺腫見逃し率は,CADeを使用しない場合に比べて有意に低かった(13.89% vs 40.00%,P<0.001) 32

Ⅳ 大腸病変のCADx

白色光観察用CADx

白色光観察(WLI)は最も基本的で汎用的な内視鏡診断法である.そのため,CADxをWLIに適用することは大きなメリットがあるが,このような研究はこれまでほとんど行われていなかった.これに対しKomedaらは,大腸病変に対するディープラーニングベースのCADxを用いて,腫瘍性病変と非腫瘍性病変を区別できることを報告している 33.しかし,その診断精度は75.1%にとどまっており,さらなる機械学習とアルゴリズムの調整が必要であると考えられた.Sánchez-Montesらは,シャローラーニングを用いた同様のWLI用CADxを開発し,その精度は91.1%であった.今後の研究次第では,白色内視鏡検査の精度が十分に高いCADxが利用できるようになり,色素内視鏡検査や画像強調観察は不要になるかもしれない.しかし,WLIは色素内視鏡検査や画像強調観察に比べて情報量が少ないことを考えると,WLI用CADxはNBIや他の画像強調技術を用いたCADxほどの高精度が得られる可能性は低い.そのため,白色内視鏡検査に対するCADxの可能性を証明するためには,さらなる検討が必要であると考える.

画像強調観察用CADx

Narrow-band imaging(NBI)またはblue-laser imagingは,表面の血管などの詳細な評価を可能にする画像強調観察手法である.NBIにCADxを初めて適用したのは,Tischendorfら 34とGrossら 35であり,それぞれ86.2%と93.1%の診断精度を報告した.彼らのCADxのアルゴリズムは,拡大NBI画像から9つの血管の特徴(例えば,長さ,明るさ,周囲長)を抽出し,これらの特徴をサポートベクターマシンで2クラスの病理診断予測(すなわち,腫瘍性か非腫瘍性か)をすることに基づいている.Grossらは,CADxの精度が93.1%と非専門家よりも優れていることを示しており,CADxが初心者の内視鏡医にとって強力な支援となり得るとしている.Tamaiらは,早期大腸癌の深達度診断にCADxを応用することに取り組んだ.彼らのCADxはNBI拡大画像で観察される血管パターンの様々な特徴(例えば血管の幅,長さ,濃度など)に基づいている.大腸病変121例を解析し,粘膜下層高度浸潤癌に対する正診率は82.8%を達成した.他にも本邦の広島大学グループは,CADの研究開発に大きく貢献した 36)~42.彼らのアルゴリズムは,画像の特徴量を一つのベクトとして扱うことで画像分類を行うbag-of-visual-wordsという手法であった.Bag-of-visual-wordsモデルは深層学習モデルではないが,彼らのCADxはリアルタイムで動作し,前向き臨床研究では93.2%の正診率で腺腫と非腫瘍性ポリープを区別することができた 40

近年は,NBI画像に対するディープラーニングベースのCADxが報告されるようになってきている.Chenらは,2,157枚の画像を用いて学習した,腺腫と過形成ポリープを鑑別できるディープラーニングベースのCADxを開発した.Chenは,微小ポリープの診断性能に関してCADxと内視鏡医を比較した.ChenらのCADxは正診率90.1%で腺腫を診断できたが,非専門医においては80.3%~88.0%であった 43.Byrneらは,病変のNICE分類をリアルタイムに推論・出力するCADxを報告している.彼らは,60,089フレームからなる223個のポリープが映っている動画を用いてCADxを学習し,連続した125の微小病変で検証を行った.腺腫に対する正診率は94%であった 44.これらの研究以降他のグループは,腺腫と非腺腫の鑑別を目的とした類似の研究を行い報告している 45)~47.しかし,リアルタイムでのNBIにCADxを用いた前向きな臨床試験は行われておらず,CADxに有利なバイアスを回避し,CADxの有効性を明らかにするためには,RCTが必要であると考えられる.

色素内視鏡に対するCADx

Pit pattern分類は,大腸病変の質的・量的診断において,NBIよりも優れた診断性能を有している 48.その診断精度にもかかわらず,色素内視鏡のCADxに関する研究はほとんど発表されていない.Hafnerらは,拡大内視鏡検査のための非深層学習型特徴抽出法である局所二値化解析を報告しており,彼らのCADxは腫瘍性病変と非腫瘍性病変の鑑別において正診率85.3%を達成している 49.Takemuraらはpit patternの定量的解析を可能にする独自のソフトウェアを開発した.このソフトウェアは,クリスタルバイオレット染色された画像から6つの特徴(面積,周囲,円形度など)を抽出し,入力画像ごとにpit paternをで予測することができる.V型pit patternを除外した結果ではあるが,このCADxは98.5%の正診率驚くほど良好な性能を発揮した 50.しかし,pit patternを判別するには,クリスタルバイオレット染色が必要である.この染色は内視鏡医が行うものであり,色の濃さは色素の散布量に依存するため,均一な品質の画像を得ることは困難である.そのため,色素内視鏡観察用のロバスト性の高いCADxを得ることは困難であると考えられる.

超拡大内視鏡画像のCADx

Endocytoscopy(H290ECI;オリンパス,東京,日本)は,520倍の拡大倍率でリアルタイムに生体内で細胞核レベルの画像を観察することができる接触型顕微内視鏡である 51),52

Kodashimaらは,endocytoscopyによって可視化された細胞核をコンピュータ解析したパイロット研究を報告し,その後のCADx研究の基礎となっている 53.Endocytoscopyに対するCADxは,日本の研究グループによって多く報告されている.彼らの最初の報告は,メチレンブルーで染色された核領域を自動抽出し,6つの核の特徴(例えば面積,長さ,幅など)の定量化し分類を試みた.腫瘍性病変に対する正診率は89.2%であった 54.2016年と2018年に報告された追加研究では,特徴抽出にテクスチャ解析と呼ばれる手法を追加し,分類器としてサポートベクターマシンを追加することで,診断アルゴリズムが改善され,それによって予測される病理の出力画像と診断の確率の両方が得られるようになった(Figure 4 55)~57.また,内視鏡検査とNBIを組み合わせ,より使いやすいCADxシステムも開発し報告している 58

Figure 4 

Endocyotoscopy画像に対するコンピュータ診断支援システム.超拡大内視鏡画像を解析して病理予測を出力する.

Moriらはendocytoscopyに対するCADxの有効性を評価するために,791人の連続患者を対象とした前向き試験を実施した.全体では,466病変の微小病変がCADxによって評価され,直腸・S状結腸の微小腺腫に対するNPVは96.4% 59であった.この結果は,MoriらのCADxは病理診断が省略可能として提唱されているPIVIの閾値を上回るものであったと結論付けた.さらに腫瘍性病変と非腫瘍性病変の鑑別に加えて,彼らは浸潤癌の深達度診断をするためにCADxを使用することを検討した 60.このパイロット研究によると,感度89.4%,特異度98.9%,正診率94.1%で浸潤癌を鑑別することができたと報告している.

上記のCADx試験の結果をTable 1にまとめた.

Table 1 

大腸におけるコンピュータ診断支援システム(質的診断支援)のサマリー.

Ⅴ CADeとCADxの機能を合わせて持ったシステム

臨床においてはCADeとCADxの組み合わせて使用できることが理想的と考えられる.Moriらは,これまでに彼らが開発した技術を用いて,病変検出と診断支援を同時に行うこと技術を報告している.これは(1)白色光画像に対して病変を検出するディープラーニングアルゴリズム,(2)endocytoscopy画像で得られる画像で病理診断を予測するアルゴリズムから成り立つものである 61.Ozawaら 62は,single shot multi box detectorを用いた同様のCADeとCADxの機能を併せ持ったシステムを報告している(Figure 5).彼らのシステムは 4,752個のポリープから撮影された16,418枚の画像を用いて学習し,検出されたポリープに対して5つの病理診断予測(腺腫,過形成,SSA/P,癌,その他)のうちの1つを予測して出力することができる.その結果,白色光画像に対して92%の感度で病変が検出でき,正しく検出された病変の83%が正しく病理診断予測されたと報告している.これらのシステムは,CADeとCADxの機能が大腸内視鏡検査の臨床に不可欠な要素であることを考えると,有望なシステムであると言える.

Figure 5 

Ozawaら(文献62)が提案したコンピュータ支援による検出と診断の同時併用システムは,検出されたポリープを矩形で表示し,同時に病理診断も予測できる.

炎症性腸疾患に対するCAD

近年,潰瘍性大腸炎の臨床転帰を予測できる因子として,内視鏡的な粘膜所見が報告されている 63.内視鏡的なmucosal healingは潰瘍性大腸炎の治療目標とされているが,内視鏡的な炎症活動性評価における観察者間のばらつきは大きいことが知られている 64.潰瘍性大腸炎患者の炎症活動性を客観的に評価するためのCADシステムがいくつか報告されている.Ozawaらは,841人の患者から撮影した26,304枚の画像を用いて学習したディープラーニングベースのMayoスコアが予測できるCADを開発した.114人の患者から3,981枚の画像を用いた後ろ向きな解析では,はMAYOスコア0に対するAUROC=0.86と高い性能を示した 65.Stidhamらは,3,082人の患者から得られた16,514枚の画像を用いて,Mayoスコアを予測するためのCADを開発し,同様の結果を報告している.この研究の特筆すべき点は,精度の検証にあたり,大腸内視鏡検査の動画を使用して完全な外部データに対する検証を行ったことである.驚くべきことにこの外部検証に対するAUROCは0.97 66であった.Bossuytらディープラーニング全盛の時代にも拘わらず従来の機械学習を用いてこの問題に取り組み,素晴らしい結果を得た.彼らのアルゴリズムは,血管パターン検出とカラーデータに基づいている.このアルゴリズムの出力スコアは,Robartsの組織学的指標(r=0.74),Mayoスコア(r=0.76),UC Endoscopic Index of Severity(UCEIS)スコア(r=0.74)と相関していた 67.Maedaらは,UCには別の方法で取り組んでいる.Maedaらは内視鏡検査による潰瘍性大腸炎の組織学的治癒の予測を可能にするCADを開発し,報告した 54.彼らのCADは87人の患者から得られた12,900枚のendocytoscopy画像を用いてAIの学習を行い,100人の患者から得られた525枚の画像を用いてその性能を評価した.彼らのCADは組織学的治癒を予測するもので,内視鏡的粘膜治癒の予測よりも難易度が高いと思われたが,正診率91%と比較的正確な予測が可能であった(91%).最近,Takenakaらは潰瘍性大腸炎に対するCADの前向き試験の結果を報告した.彼らのディープラーニングを用いたアルゴリズムは,1枚の内視鏡画像から内視鏡的寛解,組織学的寛解,UCEISスコア3つの変数について予測を出力することが可能である 68.このシステムを用いたUC患者875名を対象とした前向き試験では,内視鏡的寛解は90.1%,組織学的寛解は92.9%の正診率で予測可能であった(Figure 6).

Figure 6 

Takenakaらが開発した潰瘍性大腸炎のコンピュータ診断支援システム(文献68).

このモデルは,1枚の内視鏡画像から内視鏡的炎症スコアと組織学的スコアの両方を予測するものである.

潰瘍性大腸炎に対するAIの研究については,これまでのところ,真の外部検証(他の病院や他国との評価)を前向きに検討した研究はない.したがって,この分野におけるCADの価値を判断するためには,さらなる研究が必要であると考えられた.

Ⅵ AI支援による内視鏡のクオリティ評価システム

これまでに述べたCADeシステムは,人間の知覚を補助することを目的としている.すなわち,これらのCADeシステムは,画面上に描出されているが内視鏡医が見逃してしまったポリープを検出することができるかもしれないが,ひだの裏や糞便の下の死角に位置にあるポリープを検出することはできない.したがって,大腸内視鏡検査の死角を定量化できるシステム(例えば,粘膜の何%が描出されたかを内視鏡医に伝えるシステム)の開発は,死角を減らし大腸癌の発生率を低下させることにつながる可能性がある.

これまでのところ,このようなシステムの開発は容易ではなかったが,Maらは大腸内視鏡画像を3次元で再構築するシステムを報告している 69.彼らは,ディープラーニングを使用したマッピングシステムを開発しており,大腸内視鏡の画像から3次元再構成画像を生成することができる.このような3次元再構成システムが利用可能になれば,内視鏡医は大腸内視鏡検査中に死角に関するリアルタイムのフィードバックを得ることができるようになる.大腸内視鏡検査において,盲腸到達と抜去速度は,どれくらい粘膜面を観察し得たかに関するサロゲートマーカーとして認識されているが,Gongらは,これらをディープラーニングで対処するための研究を行っている.彼らのシステムは,盲腸到達,スコープがスリップして抜去された状態の監視,抜去速度のモニタリングの3つの機能を持っている.彼らのシステムを用いたランダム化試験では,ADRはこのシステムを用いた方が有意に高いことが示されている16%対8%,P=0.001) 29

CADeに関するメタアナリシスでは,CADeシステムは,微小ポリープを有意に多く検出するが,advanced neoplasiaの検出率を増加させないことが示されている 70.このようなAI支援による内視鏡の品質評価システムは,この分野で大きな役割を果たすと考えている.

Ⅶ 今後の方向性

Figure 7に,これまでに報告されている主要なCADシステムに関するマイルストーンを示す.CADシステムは多くの良好な結果を得ているが,いくつかの課題が残っている.第一に,CADシステムが大腸癌の発生率や死亡率を有意に低下させるかどうかが不明である.第二に,報告されているすべてのCADシステムは開発者によって評価されているため,開発者によるバイアスは避けられない.したがって,これらのシステムを用いた長期的な多施設前向き試験が必要である.第三に,これらのCADシステムを臨床で使用するためには,薬機法規制当局の承認が不可欠である.しかし,承認を得ているCADシステムはまだ少ない 71)~74.このため,世界的にCADが普及するまでにはもう少し時間が必要である.第四に,CADシステムの有効性を明らかにするためには,質の高い前向きの臨床研究が必要である.すなわち,十分なサンプル数を有する開発施設以外の施設での前向き臨床研究で検証されるべきである.CADeシステムが真に臨床的に意義のある有効性を有するか否かを判断するためには,他のアウトカム(例:advanced adenomaの発見率,大腸内視鏡検査後の大腸癌発生率)を調査すべきである.CADxに関しては,正確な診断に基づき病変を切除せず残すleave-in-situを可能とするには,腺腫に対する十分な陰性的中率(または特異度)が前向き研究で示されるべきである.さらに,これらのCADシステムは,最適ではない設定(例えば,非専門医,腸管前処置がやや不良な環境下,など)で検証することも,システムのロバスト性を確かめる上で重要である.AIは理想的で高クオリティの大腸内視鏡画像を過学習することがあり,その場合には低クオリティの画像に対しては性能が劣ることが知られる.

Figure 7 

報告されているコンピュータ支援システムのマイルストーンをまとめた図.

近い将来,大腸内視鏡AIを臨床現場に導入することで,様々なメリットが得られる可能性がある.例えば,AIシステムからリアルタイムのフィードバックを受けることで,非専門医などの内視鏡医の教育にも有効かもしれない.また精度の高いCADは,PIVI声明で提案されているleave-in-situまたはresect-and-discardに関する意思決定をリアルタイムにサポートしたり,炎症性腸疾患患者における治療強化に関する意思決定もサポートできるだろう.最近のCOVID-19のパンデミックの環境下では院内感染を最小限に抑える必要があるため,内視鏡医のトレーニングの機会が失われている.指導医の立ち合いと比べると,感染リスクのないAIシステムは,内視鏡医の教育において重要な役割を果たす可能性がある.AIシステムの費用対効果については,ある研究でCADxが医療費を削減し得ることを示した.この研究者らは,腫瘍と非腫瘍の鑑別において,CADxを使用した前向き臨床研究の事後分析を行った.CADxを用いることで病理診断コスト,通院コストの一部が省略可能になるという仮定のもと,日本では1億4,920万ドルのコスト削減が可能であると推定した 75.このような費用対効果が多くのAIシステムで確認されれば,臨床現場へのAIの導入は加速するだろう.

Ⅷ 結  論

これまでのところ,AIは大腸内視鏡検査のクオリティやアウトカムを向上させ,かつきんてん化させる可能性を秘めている.しかしながら,AI関連の研究はほとんどが後方視的な研究ばかりで,その真価は質の高い臨床研究の結果を待たなければならない.AIは本当に患者予後を改善させ得るのか?AIが次世代の内視鏡診療への扉を開くかどうかは,これからの時代にかかっている.

資金調達

本研究は,日本学術振興会科学研究費補助金番号19K17504の支援を受けています.

 

本論文内容に関連する著者の利益相反:三澤将史,工藤進英,森悠一は,オリンパス株式会社から講演料を受領しています.三澤将史,工藤進英,森悠一は,サイバネットシステムと昭和大学が保有する特許(日本国特許第6059271号,第6580446号)を取得しています.森健策は,サイバネット株式会社から研究費を受けています.その他の著者は,本研究・論文に関連して利害関係を有していません.

文 献
 
© 2021 Japan Gastroenterological Endoscopy Society
feedback
Top