日本消化器内視鏡学会雑誌
Online ISSN : 1884-5738
Print ISSN : 0387-1207
ISSN-L : 0387-1207
総説
人工知能(AI)を活用した胃癌診療の未来像
平澤 俊明 多田 智裕藤崎 順子
著者情報
ジャーナル フリー HTML

2020 年 62 巻 12 号 p. 3031-3040

詳細
要旨

人工知能(AI)を用いた画像認識は,機械学習とディープラーニングという革新的技術により飛躍的に発展した.現在は,画像認識ではAIが人間の能力を超えたと言われている.胃癌診療でもAIによる内視鏡観察部位診断,H. pylori感染診断,胃癌の存在診断・質的診断の研究が進められおり,医師と同等レベルの精度が報告されている.さらに人間の能力を超えるようなAIも出現してくるであろう.しかし,医療AIは既存の医療機器とは異なる問題点もあり,臨床現場の導入までには大きなハードルが存在する.また,現時点の医療AIは「医師の仕事の効率を上げる情報を提示する支援ツール」としての位置づけであり,最終診断は医師が行うとされている.

近未来の医療現場では医師のサポートツールとして当たり前のようにAIが導入され,医療の質が向上すると期待される.

Ⅰ はじめに

胃癌は全世界で年間100万人以上が罹患し,死亡者数は78万人とがん死亡者数の3番目に位置する疾患である 1.胃癌の予後は発見時のステージに依存し,進行癌で発見された場合の予後は不良であるが,早期胃癌の5年生存率は90%を超える 2),3.また,多くの粘膜内癌が低侵襲の内視鏡治療で切除することが可能である 4.胃癌治療では早期発見,早期治療が重要であるが,上部消化管内視鏡検査の胃癌の検出の偽陰性率は4.6~25.8%と報告され,経験の浅い内視鏡医は胃癌の偽陰性率が高い傾向にある 5)~9.また,胃炎と胃癌の鑑別や,治療方針に関わる胃癌の範囲診断,深達度診断なども内視鏡医の診断能力に大きな差がある.このように,臨床現場では診断の質の均てん化が克服すべき大きな問題として残っている.

一方,ディープラーニングや機械学習などの技術革新により人工知能(AI)は飛躍的に進化し,画像認識能力では人間を上回ったとされている.医療現場でもゲノム医療 10,創薬 11,画像診断 12などに応用されつつある.胃癌診療にも,AIを応用した研究が報告されるようになり,今後,日常診療のサポートツールとしての期待は大きい.本稿では,報告されている論文をレビューするとともに,胃癌診療の未来像について考察する.

Ⅱ AIの基礎知識

「AI(artifical intelligence)」という言葉が初めて使われたのは,1956年にアメリカで開催されたダートマス会議である.計算機科学者であるジョン・マッカーシーが人間のように考える機械を,AIと呼ぶことを提唱した.その後AIという言葉は「人間と同じ知的な処理能力(知能)をもつ機械」として,研究者だけでなく,一般にも幅広く使われるようになった.ただし,「知能」についての定義自体が曖昧である以上,「人間と同じ知的な処理能力」の解釈も研究者によって異なる.したがって,AIに関しても世界的に定まった定義はまだないということになる.

AIは画像認識という分野においては,非常に優れた能力を発揮することが知られている 13.画像認識とは,画像や動画から特徴をつかみ,対象物を識別するパターン認識技術である.自動運転技術や,顔認証システムといった,すでに身近になりつつある最新技術は,AIによる画像認識を応用している.その画像認識の軸となっている技術は機械学習とディープラーニングである.機械学習とは,AIのプログラム自身が学習する仕組みである.これまで,機械に対して何かを教える際には人間がデータを集計・分析し,定義やアルゴリズムを導き出して,機械に教えていた.一方,AIによる機械学習は,膨大な量の情報であるビックデータ(教師データ)から,機械が自動的にデータの規則性や判断基準(特徴量)を見つけ出し,それをもとにAI自身で新しいデータを分析,判断する.この飛躍的な発展を支えるのが,ディープラーニングという技術革新である.ディープラーニングは人間の脳の神経細胞ネットワークを模倣し,数理モデル化したものを組み合わせたニューラルネットワークというシステムを用いる.Figure 1にコンピューターの処理システムを単純化した模式図を示す.入力された情報は,入力層にある多数のニューロンが情報を処理して,その結果を出力層のニューロンに伝え,出力層で判断して回答を導き出す.複雑な情報を処理するには,入力層と出力層だけでは不十分であり,その間に中間層を設けることによって複雑な解析も可能となる.中間層が増えることを,深い=ディープと表現し,このような中間層を複数もつコンピューターの処理システムがディープラーニングである(Figure 2).このディープラーニングの出現により,AIによる画像認識は大きく進歩した.米国の複数の大学が共同で開催する,AIによる大規模画像認識コンテストであるImageNet Large Scale Visual Recognition Challenge(ILSVRC)では,2015年にAIが人間の正答率を超える成績を出した.つまり,画像認識ではAIが人間の能力を超えたと考えられている.

Figure 1 

ニューラルネットワーク 入力層・出力層.

(文献13から引用).

Figure 2 

ニューラルネットワーク 入力層・中間層・出力層.

(文献13から引用).

このように,AIは「人間と同じ知的な処理能力をもつ機械」という包括的な概念であり,その一部として機械学習があり,さらに機械学習のひとつの学習形態としてディープラーニングという技術がある(Figure 3).

Figure 3 

AI,機械学習,ディープラーニングの関係.

(文献13から引用).

Ⅲ AIによる内視鏡観察部位の診断

胃癌の見逃しの一因として,胃内の不十分な観察が挙げられる.胃は屈曲した広い管腔をもつ臓器であり,胃内をすべて観察したつもりでも盲点が存在し,胃癌の見逃しのひとつの原因となっている 14.AIが胃の解剖学的部位を認識できれば,胃全体が網羅的に観察されたかどうかを確認するのに有用である.Takiyamaらは上部消化管内視鏡画像の解剖学的部位を診断するAIを報告した 15.上部消化管内視鏡画像27,335枚を咽頭,食道,胃上部,胃中部,胃下部,十二指腸に分類しディープラーニングで機械学習させAIを構築した(Figure 4).独立した17,081枚の上部消化管内視鏡画像で検証し,AUC(area under the curve)値は咽頭,食道では1.0,胃と十二指腸は0.99と良好な成績を示した.Wuらは胃内の内視鏡画像を解剖学的に26部位に分類するAIを開発し,AIの正診率は65.9%であり,経験のある内視鏡医の63.8%と同等の成績であった.さらに,324人の患者を対象にリアルタイムで胃全体が撮影されたかの網羅性を確認するランダム化比較試験を行い,このAIを使用すると,撮影漏れ部位が15%減少することを報告した 16.同じグループのChenらは,同様のAIを用いて鎮静ありの通常径内視鏡,鎮静なし通常径内視鏡,鎮静なしの細径内視鏡の3群をそれぞれAIの有無で分類した6群でランダム化比較試験を実施し,鎮静下のAI併用通常径内視鏡検査が有意に観察漏れ部位が少なかったと報告した 17.このように観察部位を診断するAIは,観察漏れによる胃癌の見逃しを減らす効果が期待される.

Figure 4 

AIによる上部消化管部位診断.

傾向スコアが1に近いほど解剖学的部位の可能性が高い.この画像ではAIは傾向スコアが一番高い胃体中部と診断した.

Ⅳ AIによるH. pylori感染診断

胃癌の95-99%はH. pylori感染に起因するため 18)~21H. pylori感染状態の診断は胃癌のリスク評価に有用である.しかし,内視鏡所見に基づくH. pylori感染診断は主観的な判断であり,医師の診断能力に大きく依存し,診断精度のばらつきは大きい 21),22.近年,内視鏡所見からH. pylori感染を診断するAIの報告が散見されるようになった 23)~27.ShichijoらはH. pylori陽性735症例,H. pylori陰性1,015症例の白色光内視鏡画像32,205枚を教師画像としてディープラーニングの手法でAIを構築した 23.独立した397症例11,481画像を用いてAIを検証し,H. pylori感染に対するAIの診断は感度88.9%,特異度87.4%,正診率87.7%であった.一方,23名の内視鏡医の成績の平均は感度79.0%,特異度83.2%,正診率82.4%であり,AIは内視鏡医の成績を上回った.ShichijoらはさらにH. pylori感染状態を未感染,現感染,除菌後の3つに分類して鑑別するAIを開発し,AIの正診率は未感染80%,現感染48%,除菌後84%であり,改善の余地が残された 24.Nakashimaらはlinked color imaging(LCI)を用いることによりH. pylori感染状態の診断精度を高めたAIを開発した(Figure 5 27.120症例(現感染,未感染,除菌後それぞれ40症例ずつ)の小彎の動画で精度評価を行い,正診率は未感染84.2%,現感染82.5%,除菌後79.2%であり,経験がある内視鏡医と同等の診断精度であった.

Figure 5 

AIによるH. pylori感染診断.

a:H. pylori 現感染でのlinked color imaging(LCI)に対するAIの診断.AIは現感染(Currently infected)を99.986%と予測し,正しい診断結果を示した.

b:AIの反応を表現するheat map.heat mapではAIが診断根拠としている部位が黄緑から赤色調,診断根拠としていない部位が青色調に示される(図は中島寛隆先生の御厚意にて提供).

Ⅴ AIによる胃癌の存在診断

胃癌は慢性胃炎を背景に発生するため,一部の胃癌は胃炎に類似しており,発見が困難である 14.著者らは,ディープラーニングを用いた機械学習による胃癌を検出するAIを報告した(Figure 67 28.13,000枚以上の胃癌画像を準備し,細かく病変の範囲をマーキングし,臨床データの紐づけを行い,教師データを作成した.それらのデータを,畳み込みニューラルネットワークによるディープラーニングシステムを用いて,学習させることでAIを開発した.検証には,胃癌の連続症例69症例(77病変)の内視鏡画像2,296枚を用いた.AIは胃癌77病変中71病変を検出し,感度は92.2%であった.陽性反応的中度は30.6%であり,誤診例の多くは胃炎を胃癌と判断したものであった.次に20mm以下の早期胃癌症例の胃癌画像209枚と非癌2,731枚を検証画像として,AIおよび内視鏡医67人に提示した 29.胃癌を検出する感度,特異度は,AIは58.4%,87.3%であり,内視鏡医は31.9%,97.2%であった.感度はAIが有意に高く,特異度は内視鏡医が高かった.上記検討は静止画であるが,早期胃癌68例の動画での精度評価も行った 30.AIは動画から早期胃癌を,68病変中64病変(94.1%)を検出し,静止画での報告と同等のレベルであった.また,病変が画面内に写り込んでからAIが認識するまでに要した時間はわずか1秒(中央値)であった.Wuらが開発した胃癌診断のAIは,200枚の内視鏡画像の検証の結果,胃癌検出の正診率,感度,特異度は92.5%,94%,91%であり,内視鏡医(expert)の89.7%,93.9%,87.3%と感度,特異度は同等,正診率に関してはAIが有意に上回っていた 31.Yoonらの報告した早期胃癌を診断するAIは,胃癌検出の感度は91.0%,AUCは0.981と良好な成績を示した 32

Figure 6 

AIによる胃癌の拾い上げ診断.

a:体中部後壁,0-Ⅱc,11×9mm,tub1,T1a(M)の病変.

b:黄色の矩形はAI内視鏡が早期胃癌と診断した部位であり,内視鏡医がマーキングした緑色の矩形と一致している.

Figure 7 

AIによる胃癌の偽陽性.

黄色の矩形はAI内視鏡が腸上皮化生による凹凸とわずかな白色調変化を胃癌と誤診した部位である.

これらの論文から,胃癌拾い上げAIは経験のある内視鏡医と同等レベルの精度を出すことが可能であると示唆される.

Ⅵ AIによる胃癌の質的診断(胃炎と胃癌の鑑別)

胃炎と胃癌の鑑別は時として難しく,白色光通常内視鏡の生検による癌の陽性反応的中度は3.2-5.6%である 9),33.白色光通常観察よりも画像強調観察(IEE)である狭帯域法(NBI,LCI,BLI)を併用した拡大観察が胃癌の質的診断に有用であることが複数報告されており 34)~37,実臨床でも狭帯域法併用拡大観察が普及してきた.しかし,狭帯域法併用拡大観察の診断の習熟には時間がかかり,誰もが簡単に正確に診断できるものではなく,この領域にもAIの研究が進められている.

KanesakaらはNBI併用拡大内視鏡画像を用いたAIにより,感度96.7%,特異度95%,正診率96.3%で癌・非癌を鑑別した 38.さらに40×40ピクセルのブロックに細かく分割し,ブロックごとに癌と非癌を判別することにより,病変の範囲診断を行った.AIによる範囲診断は感度65.5%,特異度80.8%,正診率73.8%と比較的良好な成績を示した.HoriuchiらもNBI併用拡大観察で胃炎と胃癌を鑑別するAIを開発した.早期胃癌1,492枚と胃炎1,078枚のNBI拡大の内視鏡画像でAIを教育し,早期胃癌151枚,胃炎107枚のNBI拡大内視鏡画像で評価を行った(Figure 8 39.その結果,正診率85.3%で胃癌と胃炎を鑑別しえた.さらに,Horiuchiらはリアルタイムでの胃癌診断を可能にするために動画での研究を行った 40.早期胃癌のNBI併用拡大内視鏡における動画(87病変の癌部の動画,および隣接する非癌部の動画)でのAIの診断能力,および11人の熟練医との診断能を比較検討し,AIの正診率,感度,特異度は85.1%,87.4%,82.8%であり,正診率において2人の熟練医を上回り,8人と差がなかった.

Figure 8 

AIによるNBI併用拡大観察診断.

a:不整な表面微細構造と微小血管構築像を認める分化型癌である.AIは胃癌と診断した.

b:不整な構造,血管は認めない胃炎の所見である.AIは非癌と診断した.

AIによる癌・非癌の鑑別診断を応用することにより,不要な生検の減少や,正確な癌の範囲診断が期待される.

Ⅶ AIによる胃癌の深達度診断

胃癌の深達度診断は治療方針に必須であるが,その正診率は50-70%と報告されている 41)~43.Kubotaらは,ニューラルネットワークを用いて深達度診断を行うAIを開発した 44.344病変の胃癌画像を用いた検証では,T1,T2,T3,T4を77%,49%,51%,55%の正診率を示した.Zhuらも胃癌の深達度診断のAIを報告している.進行胃癌を含めたすべての胃癌から,深達度MまたはSM1とSM2以深を鑑別する診断では,感度,特異度,正診率は,76.5%,95.6%,89.1%であり,内視鏡医の87.8%,63.3%,71.5%と比較して特異度,正診率はAIが内視鏡医より有意に高かった 45.Yoonらは早期胃癌を粘膜内癌と粘膜下層癌に分類するAIを報告し,AUCが0.851と良好な成績を示した 32.ただし,未分化型癌は分化型癌より有意に正診率が低かった.

Ⅷ AIの問題点

医療AIは既存の医療機器とは異なる問題点も存在する.まず,AIの性能は学習により変化する点が挙げられる.教師データを追加すれば,AIの性能が向上することが期待できる反面,不適切なデータを追加した場合は,逆に性能は劣化する.また,質の高いデータを多量に追加した場合でも,「過学習」をきたすことがある.「過学習」とは過度の学習により判断の基準が厳しくなり,少しでもパターンが異なると診断を誤ってしまう機械学習に特有な現象である 46.このように性能が変化するAIは従来の医療機器の安全性・性能評価では対応できない側面も有している.

次に,AIの開発には莫大な資金と時間が必要となる点である.AI開発には高品質な内視鏡画像が多量に求められる.さらに収集した膨大な内視鏡画像は臨床データを紐づけるアノテーションが必要となる.これらの作業には熟練医が関わる必要があり,その労力は大きなものである.また,AI開発を担う優秀なエンジニアも日本には少ないのが現状である.

Ⅸ 臨床現場への応用

研究レベルではAIの医療への応用は進んできているが,すぐに臨床現場で使用できるものではない.「医療機器」として薬事承認を得なくてはならず,これが大きなハードルになっている.医療機器は患者に与えるリスクに応じて,一般医療機器(クラスⅠ),管理医療機器(クラスⅡ),ならびに高度管理医療機器(クラスⅢとクラスⅣ)に分類されている(Table 1).これまで述べてきた胃癌診断のAIは「人の生命および健康に影響を与えるおそれがあるもの」と判断され,クラスⅡ,Ⅲに該当する.例えば,AIが胃癌の可能性がある領域を矩形で示した場合は,AIの診断に影響された医師が生検を行い,その結果として健康に影響を与えるおそれがあるためである.つまり,診断をサポートする多くの医療AIは,内視鏡システムや手術用ロボットと同様のリスクが大きい医療機器と判断される.「医療機器」として薬事承認を得るには,医薬品医療機器総合機構(PMDA)と医療機器開発前相談と対面助言を繰り返し行い,最終的にはPMDAの要求する臨床試験をクリアしなくてはいけない.この作業には莫大な資金と時間が必要となる 47

Table 1 

医療機器の分類と規制.

Ⅹ AIを用いた胃癌診断の未来像

臨床応用としてまず挙げられるのは,静止画のAIを用いた胃がん内視鏡検診のダブルチェックの支援である.胃がん内視鏡検診では内視鏡検査後に,別医師による画像のダブルチェックが求められており,膨大な内視鏡画像を確認することは医師にとって大きな負担である.AIが撮影部位の網羅性の確認,不適切な画像の抽出,胃癌が疑わしい病変の指摘などをダブルチェック前の下読みとして行えば,医師の負担軽減につながるであろう.次に,内視鏡検査中のリアルタイム診断支援にも応用が期待される.病変拾い上げ,拡大観察による質的診断,範囲診断や深達度診断もリアルタイムでAIがサポートすることで,非熟練医の経験不足をAIが補うことができる.また熟練医でも体調などによっては病変を見逃すことがあり,パフォーマンスが常に一定であるAIにより,見逃しを予防できる可能性もある.

人間を超えた能力をもつ医療AIもすでに多く報告されている.病理のHE染色から癌の遺伝子異常を判断するAI 48や,眼底画像から性別を判断するAI 49などの報告がある.これらは,人間が感知していない「何か」をAIが認識しているが,その「何か」に関してはブラックボックスでわからない.胃癌診断でもAIが内視鏡画像を解析することによりリンパ節転移や予後を予測するなど,医師の診断を凌駕する可能性が充分に考えられる.

Ⅺ おわりに

医療分野においても,今後AIの活用が飛躍的に進むと予想され,10年後には医療は大きく変貌するであろう.一方で,診断や治療における主体はあくまでも医師である.厚生労働省が2018年に示した「AIを用いた診断,治療等の支援プログラムの利用」についての見解の中では,AIは「医師の仕事の効率を上げる情報を提示する支援ツール」として位置づけられている.「診断,治療等を行う主体は医師であり,医師はその最終的な判断の責任を負う」ことが明記され,AIの回答の妥当性を臨床的に判断することは医師の業務であるという位置づけが明確になった形である.AIが補助診断ツールとしての役割を果たしてくれるようになると,医師の仕事の形もまた変化していくのかもしれない.しかしAIが医師の仕事を奪うのではという懸念については,果たしてそうなるかは疑問である.医療現場で最も必要とされる「コミュニケーション能力」をもつAIが登場するのは恐らく遠い未来になるからだ.

近未来の医療現場では,サポートツールとして当たり前のようにAIが導入されると共に,AIのサポートを得た医師がより細やかで温かなコミュニケーションを提供するなど,AIの進歩が質の高い医療の提供に貢献すると確信している.

 

本論文内容に関連する著者の利益相反:平澤俊明,多田智裕(研究助成金:国立研究開発法人新エネルギー・産業技術総合開発機構),多田智裕(株式会社AIメディカルサービス)

文 献
 
© 2020 一般社団法人 日本消化器内視鏡学会
feedback
Top