The Journal of Japan Society for Laser Surgery and Medicine
Online ISSN : 1881-1639
Print ISSN : 0288-6200
ISSN-L : 0288-6200
REVIEW ARTICLE
Endoscopic Diagnosis of Gastric Cancer Utilizing Artificial Intelligence (AI)
Toshiaki Hirasawa Yohei IkenoyamaMitsuaki IshiokaKen NamikawaYusuke HoriuchiHirotaka NakashimaTomohiro TadaJunko Fujisaki
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2022 Volume 42 Issue 4 Pages 255-260

Details
Abstract

機械学習とディープラーニングの技術革新と高性能のGPUにより,人工知能(AI)を用いた画像認識は,飛躍的に発展した.現在は,画像認識ではAIが人間の能力を超えたと言われている.胃癌診療でもAIによる内視鏡観察部位診断,H. pylori感染診断,胃癌の存在診断・質的診断の研究が進められており,医師と同等レベルの精度が報告されている.しかし,医療AIは既存の医療機器とは異なる問題点もあり,臨床現場の導入までには大きなハードルが存在する.近い将来,胃癌診断にAIが導入され,医療の質が向上することが期待される.

Translated Abstract

Image recognition using artificial intelligence (AI) has made great strides due to innovations in machine learning, deep learning, and high-performance graphics processing units. Currently, it is considered that AI has exceeded human capabilities in image recognition. In the field of gastric cancer, research on AI-based diagnoses, such as anatomical classification of esophagogastroduodenoscopy images, identification of Helicobacter pylori infection, and detection and qualitative diagnosis of gastric cancer, is being performed, and accuracy equivalent to that of endoscopists has been reported. However, there are some drawbacks with the use of medical AI that make it less acceptable than existing medical devices, and there are significant hurdles before it can be introduced into clinical practice. In the near future, AI is expected to be introduced to the field of gastric cancer diagnosis and improve the quality of medical care.

1.  緒言

胃癌は世界のがん死因の第3位であり,年間100万人以上が罹患し,77万人以上が死亡している1).日本でも年間約13万人が罹患し,約5万人が命を落としている2).胃癌の予後は発見時のステージによって異なり,ステージIの5年生存率は約95%と良好であるが,ステージIVでは10%以下となる2-4).胃癌治療には早期発見・早期治療が重要であるが,上部消化管内視鏡検査による胃癌発見の偽陰性率は4.6~25.8%と報告されており5-7),経験の浅い内視鏡医は胃癌の偽陰性率が高い傾向にある6).また,胃炎と胃癌の鑑別や,治療方針に関係する胃癌の深達度診断,範囲診断においても,内視鏡医の診断能力に大きな差がある8).このように,診断の質の均てん化は,臨床現場で克服すべき大きな問題として残されている.

近年の人工知能(artificial intelligence: AI)によるイノベーションは目覚ましく,高性能のGPU(Graphics Processing Unit)が比較的安価に手に入るようになったこともあり,AIは自動運転,機械翻訳などあらゆる分野で応用されている.AIが最も得意な分野の一つが,ディープラーニングや機械学習などの技術革新により発達した画像認識である.内視鏡診断は画像認識そのものであり,AIと親和性が高い.そのため,内視鏡AIは国内外で研究および実用化が進んでおり,大腸内視鏡の分野では,いくつかのAIが薬事の認可を取得し,臨床現場に導入されている.一方,胃癌診断へのAIの応用は現段階では研究段階であり,臨床現場では使用できない.本稿では胃癌診断におけるAIの現状と今後の展望について概説する.

2.  AIを用いた胃癌診断

2.1  AIによる内視鏡観察部位の診断

胃内の不十分な内視鏡観察は,胃癌を見逃す原因の一つである.胃は内腔が屈曲した臓器であり,胃全体を観察したつもりでも,視野に入ってこない死角がある.AIが胃の解剖学的部位を認識できれば,胃全体が網羅的に観察されたかどうかを確認するのに有用である.Takiyamaらは,上部消化管内視鏡画像を咽頭,食道,胃上部,胃中部,胃下部,十二指腸に分類したAIを開発した(Fig.19).独立した17,081枚の上部消化管内視鏡画像で検証し,AUC(area under the curve)値は咽頭,食道では1.0,胃と十二指腸は0.99と良好な成績を示した.Wuらは,胃の内視鏡画像を26の解剖学的領域に分類するAIを開発しており,AIの正診率は65.9%であり,経験豊富な内視鏡医による63.8%と同等の成績であった10).さらに,胃全体が撮影されたかをリアルタイム評価する無作為化比較試験では,このAIを使用することで,撮像部位の抜けが15%減少することを報告した11).同じグループのChenらは,同様のAIを用いて鎮静ありの通常径内視鏡,鎮静なし通常径内視鏡,鎮静なしの細径内視鏡の3群を,それぞれAIの有無で分類した6群で無作為化比較試験を行い,鎮静下のAI併用通常径内視鏡検査が有意に観察漏れ部位が少なかったと報告した12).このように観察部位を診断するAIは,観察漏れによる胃癌の見逃しを減らす効果が期待される.

Fig.1 

AI system for diagnosing anatomical parts of upper gastrointestinal endoscopy images.

The closer the probability score to 100, higher the probability of an anatomical part. In this image, AI correctly identified the lower portion of the stomach with the highest tendency score.

2.2  AIによるH. pylori感染診断

胃癌の95-99%はH. pylori(HP)感染が原因であり13-15),胃癌発症のリスク評価にはHP感染状況の診断が重要である.しかし,内視鏡所見に基づくHP感染診断は,主観的な判断であり,医師により診断精度に大きなばらつきがある16).近年,内視鏡所見からHP感染を診断するAIに関する研究がいくつか報告されている.Shichijoらは,ディープラーニングによるAIを構築し,HP感染に対するAIの診断は感度88.9%,特異度87.4%,正診率87.7%であり,内視鏡医より有意に高い成績であった17).Nakashimaらは,画像強調観察(IEE)の狭帯域光法であるlinked color imaging(LCI)を用いてHP感染症の診断精度を向上させるAIを開発した(Fig.218).LCIは短波長の光を用いることにより,粘膜浅層の詳細観察を可能とする新しい光工学を応用した観察法であり,narrow band imaging(NBI),blue laser imaging(BLI)も同様の技術を用いている.120症例(現感染,未感染,除菌後それぞれ40症例ずつ)の胃体部小彎の動画で精度評価を行い,正診率は未感染84.2%,現感染82.5%,除菌後79.2%であり,経験がある内視鏡医と同等の診断精度が得られた.

Fig.2 

Diagnosis for status of Helicobacter pylori infection with the AI system. (a) The AI system correctly diagnosed the status of HP infection as currently infected on linked color imaging. (b) The ‘Gradient-weighted Class Activation Mapping’ system uses a heat map to present endoscopic findings that contribute to the diagnosis of HP infection in the LCI image. In the heat map, the AI well-responding area is seen in yellowish-green to red hues, while the relatively poor-responding areas are seen in blue.

2.3  AIによる胃癌の存在診断(拾い上げ診断)

胃癌は慢性胃炎を背景に発生するため,胃炎に類似した早期胃癌も多く,内視鏡による検出が困難なものもある.われわれは,ディープラーニングを用いて胃癌を検出するAIを世界で初めて報告した(Fig.319).このAIは77例中71例の胃癌を検出し,感度は92.2%であった.しかし,陽性反応的中度は30.6%と低く,誤診例の多くは胃炎を胃癌と判断したものであった.さらに,検証画像として,病変径が20 mm以下の早期胃癌の内視鏡画像209枚と非癌の画像2,731枚をAIと67名の内視鏡医に提示した20).早期胃癌を検出する感度と特異度は,AIで58.4%と87.3%,内視鏡医で31.9%と97.2%であった.感度はAI,特異度は内視鏡医が有意に高い結果であった.以上の研究は静止画を用いたが,動画でも診断精度を評価した.動画では,AIは68例中64例(94.1%)の早期胃癌を検出しており21),静止画と同等の成績が得られた.Wuらが開発した胃癌診断のAIは,200枚の内視鏡画像の検証の結果,胃癌検出の正診率,感度,特異度は92.5%,94%,91%であり,内視鏡医(expert)の89.7%,93.9%,87.3%と感度,特異度は同等,正診率に関してはAIが有意に上回っていた22).Yoonらの報告した早期胃癌を診断するAIは,胃癌検出の感度は91.0%,AUCは0.981と良好な成績を示した23)

Fig.3 

Detection of gastric cancer using the artificial intelligence (AI) system. (a) Slightly reddish and flat lesion of the gastric cancer appears on the posterior wall of the middle body. (b) The yellow rectangular frame was marked by the AI system as a possible lesion indicating the extent of a suspected gastric cancer lesion. The green rectangular frame was manually marked by an endoscopist to indicate the location of cancer [0-IIc, 12 mm, tub1, T1a (M)].

以上より,胃癌拾い上げAIは経験のある内視鏡医と同等レベルの精度を有すると考えられる.

2.4  AIによる胃癌の質的診断(胃炎と胃癌の鑑別)

臨床現場では早期胃癌と良性病変(胃炎,びらん,胃潰瘍)の鑑別が困難な場合も多い.従来の白色光を用いた内視鏡検査による生検での癌の陽性反応的中度は3.2~5.6%と低く,癌・非癌の鑑別の難しさを表している8,24).Namikawaらは,主に胃癌の画像で教育させたoriginal AIと,original AIに胃潰瘍画像を追加学習させたadvanced AIを比較検討した25).その結果,早期胃癌 と胃潰瘍の鑑別に対するoriginal AIとadvanced AIの正診率はそれぞれ45.9%,95.9%であった.本研究は,鑑別となる良性疾患を追加学習させることで,胃癌に対するAIの診断精度が向上することを示した.

白色光通常観察よりもIEEである狭帯域法(NBI, LCI, BLI)を併用した拡大観察が胃癌の質的診断に有用であることが複数報告されており26-28),実臨床でも狭帯域法併用拡大観察が普及してきた.しかし,狭帯域法併用拡大観察の診断の習熟には時間がかかり,誰もが簡単に正確に診断できるものではなく,この領域にもAIの研究が進められている.

KanesakaらはNBI併用拡大内視鏡画像を用いたAIにより,感度96.7%,特異度95%,正診率96.3%で癌・非癌を鑑別した29).Horiuchiら(Fig.4),UeyamaらもNBI併用拡大観察で胃炎と胃癌を鑑別する精度の高いAIを報告している30,31).さらに,Horiuchiらはリアルタイムでの胃癌診断を可能にするために,動画での研究を行った32).早期胃癌のNBI併用拡大内視鏡における動画(癌部87動画,隣接する非癌部87動画)での,AIと11人の熟練医の診断能を比較検討し,AIの正診率,感度,特異度は85.1%,87.4%,82.8%であり,正診率において2人の熟練医を上回り,8人と差がなかった.最近,HuらはNBI拡大画像を用いた多施設研究で,AI自体の診断能の高さに加えて,実際,内視鏡医がそのAIを使用することで,内視鏡医の診断性能が有意に上昇したことを報告している33)

Fig.4 

Differential diagnosis between gastritis and gastric cancer in magnified narrow band imaging (NBI) using the AI system. (a) The image of differentiated-type cancer with irregular vessels and irregular structure. AI system correctly diagnosed as gastric cancer. (b) The image of gastritis without irregular vessels and irregular structure. The AI system correctly diagnosed as gastritis.

AIによる癌・非癌の鑑別診断を応用することにより,不要な生検の減少や,正確な癌の範囲診断が期待される.

2.5  AIによる胃癌の深達度診断

胃癌の浸潤の深さ(深達度)の診断は治療の決定に不可欠であるが,その正診率は50~70%と臨床的に満足できる成績ではない34,35).これまでに通常内視鏡画像を用いたAIによる胃癌深達度診断がいくつか報告されている.Kubotaらが開発した胃癌の深達度を診断するAIは,胃癌病変344例を用いた検証において,T1,T2,T3,T4(T 病期分類)で 77%,49%,51%,55%の正診率を示した36).Zhuらも胃癌の深達度診断のAIを報告している37).進行胃癌を含めたすべての胃癌から,深達度M/SM1とSM2以深を鑑別する診断では,感度,特異度,正診率は,76.5%,95.6%,89.1%であり,内視鏡医の87.8%,63.3%,71.5%と比較して特異度,正診率はAIが内視鏡医より有意に高かった.Yoonらは早期胃癌の深達度をMとSMに分類するAIを報告し,AUCは0.851と良好であった23).Naganoらも胃癌の深達度をM/SM1とSM2以深に分類するAIを開発し,94.5%の高い正診率を示した38).今後,評価に用いられる内視鏡画像のプロトコルをより厳格にして,前向きに検討する必要がある.

3.  胃癌診断AIの課題

胃癌におけるAIの応用に関する報告は,静止画と限られた数の検証サンプルを使用したレトロスペクティブな研究が多く,日本と中国からの報告が主である.これらの研究はいずれも精度が高いと報告されているが,検証データや研究デザインが異なるため,これらの研究の結果を直接比較することはできない.また,スクリーニングや精査などの状況に応じた最適なモダリティ(白色光,狭帯域法,拡大内視鏡など)をさらに明確にしていく必要がある.今後,無作為化比較試験を実施し,その有用性をリアルワールドで評価する必要がある.

医療AIは既存の医療機器とは異なるいくつかの課題も存在する.まず,AIの性能は学習により変化する点が挙げられる.Namikawaらが示したように,多数の教師データを追加すれば,AIの性能が向上することが期待できるが18),不適切なデータを追加した場合は,逆に性能は劣化する.また,質の高いデータを多量に追加した場合でも,「過学習」をきたすことがある.「過学習」とは過度の学習により判断の基準が厳しくなり,少しでもパターンが異なると診断を誤ってしまう機械学習に特有な現象である.このように性能が変化するAIの安全性および性能の評価は従来の医療機器の評価方法では対応できない.

機械学習,特にディープラーニングは,その特性上,判断の過程がブラックボックスであり,アウトプットの判断根拠を明確に示すことが困難な場合がある.通常の医療機器ではその性能確保のために示すことが求められる動作原理の明示が困難となる.そのため,診断アルゴリズムを詳細に精査するというよりは,一般的な医療機器プログラムの評価と同様,そのインプットに対して所要のアウトプットが得られているかを確認することに重点を置き,その性能を評価することが適当と考えられる.つまり,AIの性能を確保するために,使用方法及び目的に応じて,製造販売業者が対象疾患の検出率,偽陽性率,偽陰性率,検出に要する時間等,性能に係る値を適切に規定し,その性能が常に担保されていることを示すことが必要となる.また,このように,検証データで性能を担保する方法は,教師データが少ない場合にGAN(敵対的生成ネットワーク)を用いて教師データを増やしてAIを開発した場合や,アノテーションのついていないデータも教師データに入れて半教師あり学習を行った場合でも対応可能な汎用性の広い評価方法であると考える.

4.  AIを用いた胃癌診断の展望

臨床応用としてまず挙げられるのは,静止画のAIを用いた胃がん内視鏡検診のダブルチェックの支援である.胃がん内視鏡検診では内視鏡検査後に,別医師による画像のダブルチェックが求められており39),膨大な内視鏡画像を確認することは医師にとって大きな負担である.AIが撮影部位の網羅性の確認,不鮮明などの不適切な画像の抽出,胃癌が疑わしい病変の指摘などをダブルチェック前の下読みとして行えば,医師の負担軽減につながるであろう.次に,内視鏡検査中のリアルタイム診断支援にも応用が期待される.病変拾い上げ,拡大観察による質的診断,範囲診断や深達度診断もリアルタイムでAIがサポートすることで,非熟練医の経験不足をAIが補うことが期待される.

臨床現場の導入にあたっては,薬事承認を得なくてはならない.そのためには医薬品医療機器総合機構(Pharmaceuticals and Medical Devices Agency: PMDA)と医療機器開発前相談と対面助言を繰り返し行い,最終的にはPMDAの要求する性能評価試験をクリアしなくてはいけない.このハードルはとても高く,莫大な資金と時間が必要であり,産学連携での対応が必要である.

5.  おわりに

これまで述べたように,内視鏡AIは胃癌診断においても熟練医と同等以上の診断能力を有すると考えられている.今後はリアルワールドでの質の高いエビデンスの構築を行い,医療現場へ導入されることが望まれる.また,医療AIを普及させるには,保険診療でのAI加算なども期待される.

利益相反の開示

利益相反あり.内視鏡AIの機器開発に関する費用の一部は,国立研究開発法人新エネルギー・産業技術総合開発機構,株式会社AIメディカルサービス,未来を拓くイノベーションTOKYOプロジェクト,富士フィルム株式会社が負担した.

引用文献
 
© 2022 Japan Society for Laser Surgery and Medicine
feedback
Top