2023 Volume 44 Issue 4 Pages 83-88
近年,人工知能は第三次ブームを迎え,様々な場面で私達の日常生活の身近な存在になってきた。医療の世界でも,人工知能は日々の臨床補助になりえることを期待し,様々な研究が進められている。眼科分野においても各種画像を用いた研究が進められている。本稿では,超広角走査型レーザー検眼鏡および光干渉断層計を用いた本邦の研究について解説する。
In recent years, artificial intelligence has experienced a third boom and has become a familiar part of our daily lives in various fields. Even in the medical world, various studies are being conducted with the expectation that artificial intelligence can be a daily clinical aid. In the field of ophthalmology, research is also being conducted using various types of images. This paper describes Japanese research using an ultra-widefield scanning laser ophthalmoscope and optical coherence tomography.
近年,人工知能(artificial intelligence;AI)は第3次ブームを迎え,日常でも身近な存在になってきた。なかでも生成系AI(generative AI)は連日ニュースで取り上げられ,とくにOpenAI(San Francisco, California, U.S.A)が2022年11月に公開したChatGPTは世界中で論争を巻き起こした。このブームは深層学習(deep learning)に牽引されている。深層学習は,脳の神経回路網を模したニューラルネットワークを利用した機械学習である。ニューラルネットワーク自体は,1930年代に提唱され,1970年代には文字認識などに利用されはじめた。その後,多層ニューラルネットワーク,畳み込みニューラルネットワークと発展を遂げてきた。生成系AIでは,通常多量のデータ・コンテンツから学習し構築された非常に大規模な機械学習モデルである。先のChatGPTはテキスト生成モデルであるが,その他Stable DiffusionやMidjourneyなどの画像生成AIも登場し,誰でも試しやすいことから社会の注目を集めている。
医療の世界でも同様に,このブームが一般社会に広がる前から種々の研究開発が行われている。臓器のセグメンテーション1)癌の検出2)など多くの医療画像を用いた研究が報告され蓄積されてきている。現在,今後の実用化に向けて行政・企業・医療者そして社会が,四者一体となって進み,全世界的に大きく注目を集めている。眼科分野は放射線・病理学などと並んでAI・深層学習との相性が良い分野である。眼科診療では診察は視認することから始まり,検査結果の多くが画像として出力され保存されてきたからだ。深層学習では,画像の持つ特徴量をAI自ら探索・学習するため,検査値などの数値データだけなく,画像を学習させることが強みとなる。画像検査には比較的身近な健診センターなどでも活用される画角45度の眼底写真,眼科クリニックなどで撮影できる網膜断層画像である光干渉断層計(Optical coherence tomography; OCT)やそれを応用したOCT-angiography,画角220度・網膜の80%以上を一度に撮影できる超広角走査型レーザー検眼鏡(Ultra-wide field scanning laser ophthalmoscope; UWF-SLO)や,同機器と励起フィルター・造影剤を組み合わせて撮影する造影検査画像,前眼部OCT(Anterior segment-OCT; AS-OCT)など画像など専門的な画像を含め,多種多様な方法で眼内を評価・記録する方法がある。今回,私達の行ったUWF-SLO画像を用いた研究とOCTを用いた研究についてご紹介したい。
超広角走査型レーザー検眼鏡(UWF-SLO)は,瞳孔を散瞳させずに眼底の画角220度もの範囲を一枚の写真に映すことができる画期的な機械である(図1)。UWF登場以前の眼底カメラは,画角45度程度を記録することが一般的であった。現在も視神経乳頭や黄斑部など,眼底の中央部の所見は画角45度の写真の方が色調などの点で見やすいため重宝され,健康診断の眼底検査でもこのカメラが使用されている。現在ではUWFの他,OCTやOCT-A,レーザースペックルフローグラフィーなど眼底所見を観察・記録する多様なモダリティが存在しているが,これらが登場し臨床現場で使用されるようになったのは10-15年前ほどである。それ以前の眼底の観察や記録はすべて一般眼底カメラのみで行われてきた。腕の静脈から造影剤を投与し眼底カメラに励起フィルターを通して撮影する蛍光眼底検査は,眼底の動脈・静脈の血流を撮影できるが,これも眼底カメラを使用していた。造影剤検査が有用な疾患として具体的には,血流が悪いことで病状が悪化する糖尿病網膜症や網膜静脈閉塞症,血管を含めた眼底に炎症が生ずるぶどう膜炎(サルコイドーシスや原田病など),網膜と脈絡膜の循環異常が一因と考えられている中心性漿液性脈絡網膜症,加齢とともに発症する新生血管を伴う加齢黄斑変性など多数の眼底疾患が挙げられる。
optos社の超広角走査型レーザー顕微鏡
眼底230度の範囲のうち,約220度を一枚の写真に写すことができる。検診や一般に使用されることの多い眼底カメラは画角45度(緑色点線)であり,広角写真の撮影範囲が大きいことがわかる。
画像提供元:株式会社ニコン
糖尿病網膜症は微小血管変化から始まり,肉眼的には眼底の点状出血が網膜症の初期の所見として現れる。網膜静脈閉塞症では,網膜動脈と静脈の交差部位において網膜静脈の閉塞が生じ,網膜出血を生じる。後極(画角45度で撮影される範囲)で生じれば,検診で指摘され診断につながることがある。しかし一般の眼底カメラ1枚では画角45度であり,網膜全体の230度に対し撮影できない範囲が広い。糖尿病網膜症や静脈閉塞症のように網膜全体に生じる疾患では,後極のみではなく周辺部の変化も重要であり,肉眼的な眼底変化のほかにその血流障害の範囲が重症度判定に重要となる。両疾患ともに網膜に血流障害が生じる疾患であり,その範囲(無灌流領域,non perfusion area; NPA)が広いと硝子体出血や牽引性網膜剥離の原因となる網膜新生血管や難治性の緑内障の原因となる虹彩・隅角新生血管が発症する。UWF登場以前は眼底カメラを用い,蛍光眼底検査によってNPAを記録し,重症度判定・新生血管の発症リスクを判断していた。UWFの登場によって一度に眼底の80%以上を撮影でき,刻々と流れる造影剤・血流評価を広角で観察できるようになったことで新しい知見が集積されてきた3-5)。糖尿病網膜症は,肉眼的には出血や白斑などが目立ちNPAは分かりづらい。一方で造影剤検査を用いると,造影剤は白く写り,それ以外の部位は黒く映るため出血や白斑等の情報は分かりづらくなる。造影剤が流れ込まない血流不足の領域は黒く映るNPAとなる。(図2)ただし,NPAの判定に未だ造影剤は必要である。造影剤検査は,上述のように有用な検査であるが一方で,撮影には手間がかかり,その他薬剤投与のための点滴の確保,アレルギーのリスクなど侵襲性がある。
A.糖尿病網膜症カラー眼底写真
出血(白矢印)が散在し,視神経乳頭鼻側に硬性白斑(青矢印)と点状出血を伴う。アーケード下方に軟性白斑(緑矢印)を認める。
B.蛍光血管造影画像
造影剤が白く写るため,視神経乳頭から伸びる網膜動静脈が白く周辺部まで伸びる。散在する白点(青矢印)は点状出血・点状漏出を示し,黒く抜ける範囲が無灌流領域(赤矢印)である。
そこで私達は深層学習を用い,造影剤を用いないNPAの推定を試みた6)。深層学習のモデルとしては,セグメンテーションの問題となる。セグメンテーションとは日本語に訳すと「分割」「分類」という意味になり,機械学習においては画像をいくつかのオブジェクトに分割するタスクのことを指す。自動運転などにも使用される手法であり,対向車や先行車などの車や白線・黄色線などの車線,信号機とその色の認識など物体それぞれを認識し,避けるべきものなのか,従うものなのかなど分類していくことである。深層学習の応用では,学習済みのモデルに対して微調整を行う転移学習というアプローチが多く行われている。これは,AlexNetやGoogleNetなどの既存の学習済みのネットワークに対して,そのネットワークが事前には学習されていないクラスを含むデータを与えて学習させる。転移学習は,時間の短縮や学習に必要な画像数が少ないという利点があり,それぞれ新しいタスクに向いたネットワークを用いる。医療画像解析でもセグメンテーションは重要であり,その多くがU-Netという学習済みネットワークをベースにしている。しかし,わたしたちはカラー眼底写真からNPA領域についてセグメンテーションを行うために,Pra-Netを7)を用いた。Pra-Netはもともと大腸内視鏡検査において,異常部位を認識する目的で開発された経緯があり,境界が不明瞭で曖昧なセグメンテーションが得意であるからだ。
図2に示したような造影剤検査結果を基に,眼科専門医および眼科フォトグラファーがカラー眼底画像にNPAのアノテーション(画像などに情報をタグ付けする作業のこと)を行った。このアノテーションを行った1,725人17,600枚画像とNPAがない3,438人16,000枚画像を学習させた。開発したアルゴリズムの検証には,学習に使用しなかった画像の虚血性眼疾患80例を用い,無灌流領域の実測面積と推定面積の差およびその重心間距離について検討を行った。NPAに重要なのは,その範囲の大きさと分布であり,図3であれば中央よりやや下方の左右の範囲を正確に推定できている。80眼についてその面積について評価を行うと,残念ながら6眼(7.5%)において過大・過小評価となったが,他は問題なかった。また,妥当性の検証として先の80眼のほか370眼の正常眼を用いた。妥当性確認とは,今回のアルゴリズムが実臨床のニーズを満たすかという確認である。実臨床では,眼科医が実際に造影剤検査を検討すべきNPAサイズを適切に判定していれば臨床ニーズを満たしている。ある一定以上のNPAがあると,その後の病期進行となるため治療介入を検討するためである。画角45度の眼底カメラが標準であったときは,10視神経乳頭サイズ分のNPAが一つの基準であり8),同NPAサイズを基準に検討を行った。結果,感度83.3-87.0%,特異度79.3-85.7%であった。超広角の時代となり,その基準についても30視神経乳頭サイズ分だとする報告もでてきており9,10),検証を行った(図4)。10視神経乳頭サイズ分の基準よりも感度は改善し,特異度はやや下がるが30視神経乳頭サイズにおいても感度・特異度ともに80%を超える良好な結果が得られた。
A.実測無灌流領域
造影剤画像を基に,網膜専門医および眼科フォトグラファーがアノテーションを行った結果。青い範囲が無灌流領域
B.推定無灌流領域
カラー眼底像を基に,AIアルゴリズムに無灌流領域を推定させた。推定無灌流領域は確率をもって表示され,確率が小さい〜大きい範囲が黄色の淡色〜濃色として表示される。分布は似通っているが,やや過大評価を行っている。
推定NPAの判定基準毎の感度特異度
縦軸に判定精度,横軸に判定基準面積とする。10視神経乳頭サイズ(disk area; DA)から30DAまで感度特異度共に80%以上であった。Sensitivity;感度,Specificity;特異度
OCTは,光(近赤外光)の干渉現象を利用して組織の断面図を評価できる検査手法である。薬剤は不要で非侵襲的であり,患者負担は眼底カメラのときとほぼ同様だ。Time-domain OCTに始まり,その後解像度の優れるSpectral domain OCTが開発された。Time-domain OCTでは10 µmの解像度であったのに対して,Spectral domainでは1から3 µmまで解像度が向上し,更に3次元画像の構築が可能となった。光源の問題で網膜下の脈絡膜までの観察が不十分であったが,2012年のSwept source OCTの登場によって,脈絡膜下の観察も各層を明瞭に描出できるようになった。Swept source OCTの登場によって様々な病態が明らかとなり,現在OCTは眼科日常診療にとって大変重要な検査機器の一つとなった。現在診療で使用される機器のほとんどがSwept source OCT(SS-OCT)である。この高解像度のSS-OCTは,網膜の構造を明瞭に写し,網膜組織の構造的変化やその病理学的特性がどのように疾患と関連しているかを示し,多くの知見が明らかになっている11-13)。その一つに,網膜内層の破壊は,糖尿病網膜症での視力低下と関連し14,15)黄斑部の非灌流領域との高い特異性が示されている16)。また,網膜静脈閉塞症や糖尿病網膜症,加齢黄斑変性による網膜内の浮腫や網膜下液は視力低下・歪視,そして網膜萎縮の原因となる17)。
そこで私達は,中心窩を通る水平断・垂直断のOCT画像のみから,深層学習によって撮像時の視力を予測できないか試みた18)。視力は一般に本邦で測定される少数視力を用い,学習済みネットワークとしてGoodleNetを用いた。水平断・垂直断の画像それぞれに数値(視力)を学習させ,最終的に統合し数値を予測させるモデルを構築した。学習画像は,2,700枚469人の画像を用い,そのうち2,110枚191人が眼底疾患(加齢黄斑変性,糖尿病網膜症,黄斑円孔・網膜前膜,網膜静脈閉塞症,中心性漿液性脈絡網膜症,病的近視にともなう脈絡膜新生血管,その他)を有する。OCTから視力を予測する研究は報告されているが19,20),数は少なく特定疾患に関するものであり,バリエーションに富んだ疾患群から予測させるモデルは本報告が初である。決定係数(R2),RSME(root mean squared error),MAE(mean absolute error)はそれぞれ,0.51,0.35,0.32であった。疾患ごとに予測精度といえるR2は大きく異なり,網膜静脈閉塞症や加齢黄斑変性では0.96,0.37であったが,中心性漿液性脈絡網膜症では-0.22と低値であった。疾患ごとに推定良好画像と,推定不良画像を示す(図5)。また,結果的にはinternal validationはうまくいったがexternal testでは網膜静脈閉塞症,加齢黄斑変性では比較的良好と同様の傾向はあったが良好な精度は上がらなかった。おそらくこの低精度はAIモデル全体で解決せねばならない根本的な問題であるが,OCTから視力の推論に関しては,AIモデルから加齢黄斑変性と網膜静脈閉塞症では可能性があること推察された。
代表的なOCT画像
推定最良矯正視力および精度を用いて,精度の良い画像と悪い画像をそれぞれ疾患毎に示す。
眼科分野における近年のAI研究は目覚ましい。臨床研究のためのAIアルゴリズムから,実臨床におけるAIアルゴリズムまで様々である。現在もAIアルゴリズムが搭載された機器はあるが,数年後には一般臨床機器にAIアルゴリズムが搭載されることが標準化するかもしれない。AIの診断は絶対ではなく補助的であり,現代社会で重要なITリテラシーさながら,医療者には「医療AIリテラシー」を身に着けていく必要と,患者さんにも「AIに対する理解」を啓蒙していく必要がある。
稿を終えるにあたり,日々研究・臨床とご指導をいただいております自治医科大学 眼科学教室の川島秀俊教授,髙橋秀徳准教授,横浜市立大学 視覚再生外科学柳靖雄客員教授に深く感謝申し上げます。
Satoru Inoda declares lecturer's fees from Kowa, Novartis, Bayer, Santen, Chugai, and DeepEyeVision, Inc., and grants from Novartis outside this work.