YAKUGAKU ZASSHI
Online ISSN : 1347-5231
Print ISSN : 0031-6903
ISSN-L : 0031-6903
Symposium Reviews
Literacy for Appropriate Use of Medical Big Data and Artificial Intelligence
Takamasa Sakai
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2023 Volume 143 Issue 6 Pages 491-495

Details
Summary

Recent developments have enabled daily accumulated medical information to be converted into medical big data, and new evidence is expected to be created using databases and various open data sources. Database research using medical big data was actively conducted in the coronavirus disease 2019 (COVID-19) pandemic and created evidence for a new disease. Conversely, the new term “infodemic” has emerged and has become a social problem. Multiple posts on social networking services (SNS) overly stirred up safety concerns about the COVID-19 vaccines based on the analysis results of the Vaccine Adverse Event Reporting System (VAERS). Medical experts on SNS have attempted to correct these misunderstandings. Incidents where research papers about the COVID-19 treatment using medical big data were retracted due to the lack of reliability of the database also occurred. These topics of appropriate interpretation of results using spontaneous reporting databases and ensuring the reliability of databases are not new issues that emerged during the COVID-19 pandemic but issues that were present before. Thus, literacy regarding medical big data has become increasingly important. Research related to artificial intelligence (AI) is also progressing rapidly. Using medical big data is expected to accelerate AI development. However, as medical AI does not resolve all clinical setting problems, we also need to improve our medical AI literacy.

1. はじめに

近年,日々蓄積される医療情報の医療ビッグデータとしての構築が進展し,データベースや種々のオープンデータを活用した新たなエビデンスの創成が期待されている.コロナ禍においても医療情報を用いたデータベース研究は盛んに行われ,急遽流行した新たな疾患に対するエビデンスの蓄積に貢献している.その反面,不確かな情報(information)が感染症の流行のように拡散されてしまう現象(epidemic)からインフォデミック(infodemic)という言葉も同時に生まれ,社会問題となっている.世界保健機関(World Health Organization: WHO)はインフォデミックについて,“It causes confusion and risk-taking behaviours that can harm health. It also leads to mistrust in health authorities and undermines the public health response.”と記述しており,1個人レベルの問題だけではなく,公衆衛生上の問題であることを示唆している.また,日本における患者・消費者に向けた医療に関する情報公開について,日本医療研究開発機構(Japan Agency for Medical Research and Development: AMED)委託研究「患者・消費者向けの医薬品等情報の提供のあり方に関する研究」の一環で,医学領域関連学会に対するアンケート調査が行われている.その結果,「現状において国民向けに発信されているウェブサイトを通じての医療・医薬品情報の質は適切と思いますか」という問いに対し不適切という回答が55.4%と最多であり,2国民への適切な情報提供が行われていない可能性が危惧されている.

このような背景から,医療に関する情報を適切に伝達し,国民の適切な理解を促すことも医療専門家の役目の1つであり,データに関するリテラシーがますます重要になってきているといえる.ここでは,特に医療ビッグデータ・人工知能(artificial intelligence: AI)に関連するリテラシーとして医療専門家が知っておきたい事項について事例や具体例を基に述べる.

2. 医療ビッグデータの特性を踏まえた適切な活用

医療ビッグデータという用語が示す範囲は幅広く,多様なデータベースが利活用されている.それぞれに特性があり,本来は何の目的で集積されていて,どこから集積されているかをいかに正確に把握するかが重要となる.

2-1. 題材1. 自発報告データベースの解析結果に対する適切な解釈

医療従事者や患者からの有害事象の自発報告は,医薬品安全性監視の基盤ともいえる情報源である.日本では独立行政法人医薬品医療機器総合機構(Pharmaceuticals and Medical Devices Agency: PMDA)が医薬品副作用データベース(Japanese Adverse Drug Event Report database: JADER)を公開しており,米国では米国食品医薬品安全局(U.S. Food and Drug Administration: FDA)のFDA Adverse Events Reporting System(FAERS)やFDAと疾病予防管理センター(Centers for Disease Control and Prevention: CDC)が共同で管理するVaccine Adverse Event Reporting System(VAERS)が公開されている.こうして公開されたデータセットを解析することにより,医薬品安全性シグナルを見い出すことに利用される3,4など,身近な情報源となっている.一方で,誰でも利用可能な形で公開されていることから,不適切な利用も散見されている.特にコロナ禍で話題となっているのが新型コロナウイルスワクチンに関する利用である.Social networking service(SNS)で「VAERS死亡」「VAERS流産」などをキーワードとして検索すると,新型コロナウイルスワクチンの危険性を過度に主張する投稿が多数見受けられている.この現象は日本だけではなく,海外でも同様に反ワクチン団体による不安をあおる投稿は問題視されている.5これは,自発報告の集積は通常,医薬品安全性シグナルを検出し,仮説生成の役割を担うものであることなどが十分に理解されていないことが根底にあると考えられる.適切なリスクコミュニケーションのためにも医療専門家はリテラシーとして自発報告データベースの特性について理解しておく必要がある.

自発報告データベースには分母情報にあたる医薬品の投与人数がないなどの特性に由来する種々の限界がある.しかし,研究発表であってもその限界点が十分に考慮されず,時には不適切な利用が行われている.筆者は,こうした不適切な利用を回避し,また研究発表を参照する側が適切な解釈を行うことができるように,JADERを用いる際の留意点をまとめたチェックリストを作成し報告している.6,7また,国外においても,自発報告データベースを用いた研究におけるSpin(研究結果の曲解,印象操作)として,“Use of causal language”,“Talk about odds ratio (OR) instead of reporting odds ratio (ROR)”,“Claiming the treatment is safe”,“Comparison of drug safety profiles”といった代表例が示されている.8このように自発報告データベースを用いた研究に対する適切な理解を促し,リテラシーを高めようとする活動も行われている.

2-2. 題材2. 医療情報データベースの信頼性

医療現場における診療録やレセプト等の情報を蓄積した医療情報データベースは,日常業務において蓄積されたデータを二次利用することから新たにデータ収集を行う必要はなく,コロナ禍では治療効果を有する薬剤の効率的な探索にも貢献している.そうした中で,Surgisphereという会社の提供する医療情報データベースを用いてクロロキン,ヒドロキシクロロキンの使用について検討した論文がLancetに掲載されるも,データの信頼性に関する懸念から撤回されるという事態が発生した.9このほかにも,同データベースを使用してイベルメクチンの有用性を主張する論文も査読前論文として掲載されていたが,これも掲載が取り下げられることとなっている(掲載当時のURL: https://ssrn.com/abstract=3580524).この論文には,2020年1月1日から2020年3月31日までにcoronavirus disease 2019 (COVID-19)と診断された患者データを利用したとあるものの,イベルメクチンの新型コロナウイルスに対する有効性を示唆する基礎研究がオンライン掲載されたのが4月である.論文に示されたほど多数の患者が本当に実在するのか疑問を覚えるようなものであった.しかし,南米ペルーではこの論文を根拠の1つとしてイベルメクチンの使用が推進されてしまい,医療情報データベースの問題が,実際に提供される医療の内容に影響をもたらしていたと考えられる.

このような事例は頻繁に遭遇するものではないと思われるが,医療情報データベースを用いた研究成果を参照する際には,用いられた医療情報データベースについて確認することは結果を適切に解釈するうえで必要である.論文中のデータベースに関する記載の引用文献を確認したり,その特性がどのように結果の解釈に影響するのかを考えるべきという教訓となる事例である.なお,日本で臨床疫学や薬剤疫学に応用可能なデータベースは日本薬剤疫学会が掲載し,毎年8月頃に追加・更新を行っており,10医療情報データベースの基本的な情報を確認することができる.

3. 医療における人工知能の活用について

医療現場で発生する様々な医療情報の電子化が進むことによって,それらの情報を解析して臨床応用しようという動きも活発化している.この際,従来行われてきた仮説検定に基づく統計解析のみならず,AIの活用についても注目が集まっている.AIとは,人間の思考プロセスと同じような形で動作するプログラム,あるいは人間が知的と感じる情報処理・技術という幅広い概念11であり,その中で使われる手法の1つに機械学習(machine learning: ML)がある.また,深層学習(deep learning: DL)は,人間の神経細胞を模してモデル化された,多数の層から構成されているニューラルネットワークを用いて行うMLのことである.近年のAIブームの背景には,MLやDLの普及と発展がある.混同され易いこれらの用語の関係をFig. 1に示す.また,総務省の令和元年度 情報通信白書においてもAIに関してまとめられており,医薬品分野もAIによって成長するポテンシャルを持つ産業の1つであることに触れられている.11医療への応用例として,網膜眼底写真から糖尿病性網膜症を識別する深層学習モデルが開発されたという報告は当初注目を集め,12また,日本においてもAIを活用し開発された医療機器プログラムが多数承認されているなど,AIの導入が進んできている.その一方で,医療薬学領域におけるAI活用については限定的であることが指摘されており,13いまだ黎明期にあると考えられる.

Fig. 1. Relationship between Artificial Intelligence, Machine Learning, and Deep Learning

This figure was cited and reproduced from Ministry of Internal Affairs and Communications “WHITE PAPER 2019 Information and Communications in Japan.” (https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/html/nd113210.html)

そうした中で,筆者は医療薬学領域におけるAI活用として次のような検討を行っている.授乳中の女性が医薬品を服用した際の医薬品の乳汁移行性に関する情報は限られており,未知の医薬品の乳汁移行性に関する予測結果は医療現場において有用な情報と考えられる.そこで,医薬品の乳汁移行性の指標である乳汁中/血中濃度比(milk/plasma ratio: M/P比)の高低の予測について,MLを用いたモデル構築を試みた.その結果,従来報告されている線形回帰式による予測性能を上回り,良好な性能を有するモデルを構築することができた.これはM/P比の高低の推測は線形分離不可能な課題であり,線形分離不可能な課題に対しても適用できる手法を用いたMLがより優れた性能を示した可能性が考えられた.本研究の成果は実際のM/P比の測定結果が得られるまでの暫定的な情報源として活用できる可能性があると考えている.

4. 人工知能を適切に活用するために

ここまでに述べたように医療へのAI導入は進展している一方で,医療系学生や臨床系教員を対象とした調査ではAIリテラシーが限られていたという報告もある.14大規模にデータが蓄積された医療ビッグデータの存在はAIの活用を進展させることが期待されるが,AIを利用すればすべての問題が解決する訳ではない.その特徴と限界点を踏まえた活用を行うためには前述した医療ビッグデータに関するリテラシーのみならず,AIに関するリテラシーも身につける必要がある.一般的なAIに関する基礎知識を身につけるための教材は様々なものが公開されているが,医療分野に特化した資料は限られている.以下に医療へMLを取り入れようとする際に考えるべき事項について,筆者の考えを述べる.

医療情報を用いた検討においては,患者の疾患発症や死亡などのイベントを予測することが多いが,その場合,イベントの有無が極端な構成割合であり(不均衡データ),かつ,関心のあるイベントを起こした症例(陽性例)の方が少ないことが多い.この場合,何ら対処せずに学習を行うと少数の陽性例を見落とすこととなり,また,不適切な指標に基づいて性能を評価すると誤った解釈が行われてしまう.例えば,死亡率が1%の疾患における死亡患者を予測するAIを開発しようとするときに,どんな患者に対しても全員生存すると予測するAIモデルができたとしても正解率は99%を示してしまう.こうした不均衡データに対する予測時の対処は様々な方法が検討されており,データの前処理,学習アルゴリズム,評価指標などを工夫するアプローチがある.15

また,学習や性能評価に用いたデータセットの性質についても理解する必要がある.臨床試験や観察研究について外的妥当性を評価するのと同様に,AIを適用しようとする対象患者とデータセットの患者とを比べる必要がある.AI開発に用いた人種と適用しようとする人種が異なる場合などは,社会的な理由からもよく議論となるが,当然,その他の患者背景にも違いがあればAIの予測性能に影響を与える可能性があり,注意しておきたい.また,極端な例であるが,自発報告データを使って服用している薬から発生する副作用を予測するAIを構築した場合,自発報告データには基本的に何らかの副作用の発生が疑われた症例のみしか存在しないため,「副作用が発生しない」という予測結果は原理上起こり得ないことになる.

このほかにも,AIの予測をそのまま医療に適用できるとは限らない場合もあり,MLの学習結果を慎重に理解する必要がある.強化学習という手法で敗血症患者における輸液・昇圧剤の最適な時間・量を学習したAIを構築したという研究があり,その研究で構築されたAIは予後を良好にするために輸液・昇圧剤を早期に減らすような予測結果を示した.16しかしこれは,輸液・昇圧剤を必要としなくなるような予後がよい患者における治療をなぞっているだけであり,このAIをそのまま医療現場に適用すると患者に害をもたらすのではないかとして議論を呼んでいる.

一方で,MLを取り入れることによって医学の発展に寄与する可能性も示されている.網膜眼底写真のDLにより構築されたAIが男女の眼球を87%の正解率で識別できることが報告されたが,17臨床医も男女間の網膜の特徴の差異を把握できていないため,AIがどのような観点で性別を識別しているかに着目することで,これまで不確かであった性差に関する新たな発見が可能という展望が述べられている.深層学習によって構築されたAIモデルはブラックボックスであることはしばしばAIの限界点として指摘されているものの,AIモデルの予測理由を説明する,説明可能なAI(explainable AI: XAI)という概念が提唱され,そのための技術についても検討と実装が進められている.このように,人間がこれまでに気がつかなかった観点を提供する可能性もある.

5. まとめ

医療ビッグデータ,AIの利活用が急速に進展し,臨床現場への適用が期待されている.これらのトピックはデータの大きさや解析手法の複雑さに注目が集まりがちであるが,医療の発展に貢献するという本来の目的に適った活用を推進していくことが重要である.そのためには,医療専門家全体の医療ビッグデータ,AIに関するリテラシー向上が必要であり,本稿がその一助となれば幸いである.

謝辞

本総説執筆の機会を頂いた,本シンポジウムのオーガナイザーである百 賢二先生,武隈 洋先生に感謝申し上げます.

利益相反

開示すべき利益相反はない.

Notes

本総説は,日本薬学会第142年会シンポジウムS31で発表した内容を中心に記述したものである.

REFERENCES
 
© 2023 The Pharmaceutical Society of Japan
feedback
Top