2020 年 36 巻 1 号 p. 35-45
人工知能はこれまでに2度のブームを経て,今また3度目のブームを迎えていると言われる.様々な産業,業態で導入が検討され,実用化されているものもある.小児領域における人工知能と機械学習を用いた研究の現状はどうなっているのだろう?現時点において,artificial intelligence,machine learning,pediatricなどのキーワードで400件超の文献が検索される.これらを目的,機械学習法,画像法,結果などで分類することにより,現在に至るまでの潮流を調査し,最近のトレンドを知る.
Artificial intelligence has been through two booms so far and is said to be reaching its third boom. What is the current state of artificial intelligence and machine learning related research in the pediatric field? More than 400 papers were searched by keywords such as artificial intelligence, machine learning and pediatric. By classifying these according to purpose, machine learning method, image method, result, we investigated the tidal current to the present and determined the latest trends.
人工知能(artificial intelligence; AI)はこれまでの2度のブームを経て,今また3度目のブームを迎えていると言われる1).このブームを牽引しているのは,AIのなかでも「弱いAI」と呼ばれる機械学習(machine learning; ML)に含まれる深層学習(deep learning; DL)である.AIはいたる所で喧伝され,様々な産業,業態で導入が検討され,社会実装への取組みが進められている2).
このようなAIが医療に応用されるべき理由は何であろうか?より精密な医療の実現,医師不足および偏在問題への対応など医療現場における社会的諸問題の解決が主な対象とされる.放射線医学領域においても,診療または業務効率の上昇等を目的にAI導入の検討が行われている.導入が検討されているAIの多くは,画像の特徴を利用して,診断,治療方針の決定,予後予測等に有益な情報を抽出するものや,情報を統合して意思決定に役立てることを目的としている3).
小児領域におけるAI/ML研究の現状はどうなっているのだろうか?artificial intelligence,machine learning,pediatricなどのキーワードで400件近い文献が検索される.これらを研究目的,研究対象,データソース,機械学習法などで分類して俯瞰することにより,最近のトレンドを知ることができる.
本稿は,2019年6月22日に神戸国際会議場で開催された第55回小児放射線学会学術集会のシンポジウム「AiとAI」において講演した内容4)の一部を抜粋し,編集を加えたものである.講演内では代表的な機械学習の手法についても短く解説を加えたが,本稿では,小児領域におけるAI/ML研究のトレンドを知るための資料たるべく,文献検索結果とそのまとめに注力した.また,現状のAI/ML研究が直面する課題についても言及し,その対策の例を示した.最後に今後のAI/ML研究の展開について私見を加えた.
研究のトレンドを調べる手法として,PubMed5)を用いてキーワード探索を行った.キーワードは,pediatricとmachine learningであり,検索日は,2019年5月28日であった.
検索の結果,367件が該当した.それらから,英文のフルペーパー,小児領域でかつ人間を対象にしたもの,機械学習が用いられているもののような条件を加え,レビュー論文等の総説や概要を除いたオリジナル論文の数は137件6–142)であった.
以下,これら137件のオリジナル論文について,論文数の推移,研究目的,研究対象,モダリティまたはデータソースとサンプル数,利用されている機械学習の方法,それらの成績についてまとめた.
Fig. 1に小児領域におけるAI/ML研究論文数の推移を示した.2017年から件数が30を超え,2019年も調査時点で25件となっていたため,2018年の46件を超えてた件数になることが予想された.2016年の北米放射線学会のタイトルは,「Beyond Imaging」であり,ALとMLの可能性が大きく取り上げられた年であった143).それを受けて2017年には研究論文数が3倍になり,近年3年間での増加傾向に繋がっていると考えられる.
小児領域におけるAI/ML研究論文数の推移
PubMed検索:調査日;2019年5月28日,キーワード;pediatric,machine learning,対象論文数;137件.
Fig. 2に主な目的を示した.研究目的としては,予測100–132),診断11,12,25,26,32,43,47,64,67,71,81,82,106,130,131,134)・鑑別34,136),調査27,30,38,51,52,55,57,73,78,83,95,107,140)などが多く取り上げられていた.また,検査59,66,92,99,143,144,149)・分析3,19,58,132)・計測79),バイオマーカー4,15,56,85,90,91,93,94,129,142,148),分類への応用2,6,17,20,29,54,61,69,86,145),検出10,40,42,62,87,103,135),解析7,21,89)・評価60,104),また新たな知見の発見36,50,141)などへも小児領域研究では機械学習が利用されている.
小児領域におけるAI/ML研究の主な目的
縦軸には論文数(左,棒)と成績(右,点),横軸には主な研究目的を示した.
成績には主にAUCを使用し,AUCがない場合にはAccuracyの値を用いた.
研究目的別の成績(主にROCカーブ下面積:AUC,AUCでない場合はaccuracyの値を使用した)は,概ね0.8をこえて高い成績を示しており(最大値は1),とくに分類や検出目的の研究においてMLを利用するメリットが示されている.
3. 研究対象Fig. 3に主な研究対象を示した.最も多いのは,自閉症などの精神疾患に関するもの42–65,87,94,95,108,109,119)で,次に心肺・呼吸器関連疾病11,12,39,40,77,78,81,83–85,103,116–118,123,131–141),脳神経関連疾病14,15,23,73,79,80,86,88,89,92,93,112,114,115,142),腹部関連疾病13,17–22,25,33,82,91,106),感染34,35,69,70,72,98,113),代謝異常16,41,110,121,122)などが続き,その他に度数が1のものをまとめた66,68,74,75,97,102,107,111,120,125,127–129).精神疾患に関する研究例が多いのは,自閉症や注意欠陥障害に関するデータベース(ADHD-200144)やABIDE145))が整備され,その存在が研究を後押ししていると考えられた.
小児領域におけるAI/ML研究の主な研究対象
縦軸には論文数(左,棒)と成績(右,点),横軸には主な研究対象を示した.
成績には主にAUCを使用し,AUCがない場合にはAccuracyの値を用いた.
研究対象別の成績を見ると,多くのものは0.8をこえて高い成績を示しており,とくにアレルギー疾患7,10)で良い成績(AUC = 0.95)が報告されていたが,論文数が少ないため,これがエビデンスとはならず,報告例として取り扱われるところにコンセンサス形成の難しさがある.
4. データソースFig. 4に小児領域におけるAI/ML研究の主なデータソースとデータ数(a)およびデータソースと成績(b)の概要を示した.論文数としては,MRIを用いた研究9,17,25,43,46,49,54,56,58,61,65,66,79,80,86,89,92,100,104,108,112,115,134)が最も多く,臨床データ10,19,22,31,34,52,59,72,81,90,94,102,110,114,124,131,136,140,141),整備されたデータベース(DB)12,18,21,23,28,40,45,50,51,55,68,77,87,95,105,120,130,133),病院情報(EHR)6,8,11,15,24,41,70,74–76,78,98,121,127,129,137,139)の順になっている.これらのデータソースに対応するサンプル数は,数百から数万規模,多いものでは数十万のデータが機械学習の対象になっていた.
小児領域におけるAI/ML研究の主なデータソースとデータ数(a)およびデータソースと成績(b)の概要
(a)縦軸には論文数(左,棒)とデータ数(右,点),横軸には主なデータソースを示した.
(b)縦軸には論文数(左,棒)と成績(右,点),横軸には主なデータソースを示した.
成績には主にAUCを使用し,AUCがない場合にはAccuracyの値を用いた.
MRIを利用した研究の平均サンプル数は268であり,臨床データは858,DBでは平均21,892のサンプル数が用いられており,一般に多くのデータがMLに投入されている.裏を返せば,データ数が集められない疾病ではML研究が行われていないことになる.最も少ないデータ数はEEG14,57,60,84,85,103,118)の平均28であった.
データソース別の成績は,すべて0.8を超えていた.特に,心音などの信号データ29,30,116,117),スマートフォン82,106),放射線科レポートを用いた研究37,88)では,1.0に近づく非常に高い成績を報告している.
5. サンプル数Fig. 5に平均使用データ数と成績の関係を示した.一般的には,データ点数が多くなるほど成績が上がると予想されるが,調査範囲の結果としては,相関がみられなかった.同一の問題設定でデータ数を変えて成績との関係を調べることにより,必要サンプル数を決定できるかもしれない.MRIとMLを用いて統合失調症患者と健常者を分類する研究において,サンプルサイズが130を下回ると正しく分類できない割合が多くなることが報告されている146).しかしながら,この情報がすべてのケースに当てはまるわけではなく,データ数と種類が多く取り揃えられることがMLにおいて,よい成績を収めるポイントになる147).
平均使用データ数と成績の関係
縦軸には成績,データ数を示した.R2 = 0.0118,P = 0.488であり,相関関係は認められなかった.
Fig. 6に小児領域におけるAI/ML研究の主なML手法を示した.Support vector machine(SVM)を用いた研究14,17,25,27,30,34,36,37,42,45,46,49,57,60,62,66,69,72,79,80,83–85,88,91,102,103,108,112,114,115)がもっとも多く,次に様々な機械学習を組み合わせた研究(multi-ML)22,28,40,41,44,48,50–53,63,64,67,68,77,87,90,98,107,111,119,120,121,126,128–130,138)が多くなってる.Radom Forest8,13,15,16,18,20,26,32,33,35,61,70,93,96,97,134)とartificial neural network99,100,110,136), convolutional neural network23,38,54,74,105,113,125), deep neural network58,75)などneural network系の手法がそれらの次に続いている.
小児領域におけるAI/ML研究の主なML手法
縦軸には論文数(左,棒)と成績(右,点),横軸には主な機械学習の手法を示した.成績には主にAUCを使用し,AUCがない場合にはAccuracyの値を用いた.
ML手法別の成績では,Bayesian7,24,31,109,132,141)を除くすべての方法が0.8を超えており,SVM,Random Forest,neural network系で平均成績が同じ値(0.87)を示した.データや問題設定に応じてML手法が選択されるが,トップ3のML手法の平均成績が同等であることは,偶然かもしれないが発見でもある.
以上1.–6.の結果をまとめると,小児放射線領域では「予測・診断・鑑別」を目的に,「精神・心肺・脳神経疾患」を対象として,「MRI・臨床データ・大規模データベース」に対して「SVM・Random Forest・neural network系」などのMLを利用した研究が行われている.平均成績は,ROCカーブのAUCで,0.86(0.65–1.00)であった.
上述のML研究例は,平均成績として非常に高い数値が発表されていた.しかしながら,これらの研究例のすべてが小児領域の課題に回答を与えるものではなく,ごく一部のデータ数が揃った課題に対する成績を与えているに過ぎない.
137例の研究のなかで,放射線関係の機器をデータソースとして用いたものはMRIのみであった.すなわち,データベースとして整備されている症例以外に,MRIやCTなどで大きなデータセットを整備することは非常に大変な作業であることを示している.一方で,データ数を集めやすい電子カルテデータや生体信号データを利用する研究においては,入力データが多くなり,MLの精度検証なども行いやすくなっている.データセットの整備は,小児領域のみならず,すべての疾病に対する共通の課題である.この問題に対応するため,日本医用画像データベースプロジェクト(J-MID)が進行中である148).整備と利用の進展に期待したい.
また,MLがどのようなプロセスを経て結果に至ったのかを明らかにすることの重要性(信頼性の担保)は以前から指摘されており149),MLプロセスがどこに着目して結果を導出したかを示すことができるようになってきている150).しかしながら,医師が考える診断等のプロセスに沿った説明ができるMLシステムはいまだに存在していない.
世界的な潮流として,放射線医学領域においてはAIシステムに対する関心は非常に高い.様々な学会において多数のAI関連セッションが設けられ,結果の検討,議論が継続されている.また,AIおよびDLには,数学的・情報学的に複雑な内容が含まれてるが,放射線科医がこれまでに統計学を学んで役立ててきたように,これらを積極的に学ぶことも推奨されている151).日本放射線医学会総会では,DLの具体的な使用方法に関するセッションが大会期間中を通じて開催されるなど,積極的な教育活動を展開しており,放射線医学領域におけるコンピュータプログラミングに対する重要性が増している.コンピュータプログラミングに精通した放射線科医の活躍の場は益々増えてゆくものと思われる.
現在のAIブームは,ブームのまま終わるのか?それとも何がしかの礎を臨床現場に残すのか?AIとしては非常に狭い意味で用いられるべきMLがあたかもAIを代表するかのような意味合いで取り上げられているような現状では,一過性のブームで終わる可能性もある.医療側がAIの意味合いを正しく理解し,正しく利用できるように教育機会を設定しなければ,ブラックボックスによる診断結果が信じられないという理由で,MLを用いた医用機器の導入は排除される可能性もある.また,やみくもに受け入れてしまえば,これまで築き上げてきた医学の部分的崩壊にもつながる.新しいテクノロジーの正しい理解と利用は,いつの世においても間違えることが許されない課題の一つである.
放射線医学領域では,積極的なAIの研究開発と問題点の解決,臨床応用を目的とした教育にも力点が置かれており,人工知能時代への準備は着実に進められている.AIの積極的な導入は,放射線医学領域の診療および業務を効率化し,意思決定の高速化,診断および治療の品質保持,業務分担の最適化などの達成に寄与するものと期待される.
第55回を迎える日本小児放射線学会学術集会のシンポジウムにおきまして話題を提供させていただく機会を与えていただきました大会長の石蔵礼一先生並びに大会事務局長の安藤久美子先生に深く感謝申し上げます.本稿が小児放射線領域の研究を推進される先生方の何がしかのお役に立てば幸甚です.本会の更なる発展を祈念申し上げます.