Article ID: e09025
近年,リアルワールドデータ(RWD)を活用したデータベース研究の重要性が高まっている.しかし,RWDの特性や限界を理解せずに研究に応用すると,誤った結果や不適切な医療判断を招く恐れがある.薬剤師がRWDを用いて臨床課題に即したエビデンスを正しく創出し実臨床に還元するためには,適切な教育を受けたうえで実施する必要がある.そのために,RWDの構造的理解,課題設定力,適切な研究デザインの構築力,結果の解釈と応用力を身につける教育が求められるが,これら教育は断片的に行うのではなく,これらが有機的に繋がった包括的な教育が不可欠である.本稿では,臨床現場でデータベース研究を推進するために必要な教育として,「特徴の理解」「課題の理解」「限界の理解」という三つの視点に基づいた薬学教育の在り方について論ずる.
Database research using real-world data (RWD) is increasingly applied in clinical settings. However, applying RWD in database research without understanding its characteristics and limitations may lead to inaccurate results and inappropriate clinical decisions. To generate evidence aligned with clinical issues and translate it into practice, pharmacists must receive proper training that includes a structural understanding of RWD and the ability to define research questions, design appropriate studies, and interpret and apply findings. These components should not be taught in isolation but through a comprehensive and integrated educational approach. This paper discusses how pharmaceutical education should structure and promote database research in clinical settings, focusing on three key perspectives: understanding the characteristics of RWD, identifying clinical issues, and recognizing limitations.
近年,医療の現場ではデータに基づく意思決定がますます重要視されており,リアルワールドデータ(Real-World Data: RWD)を活用したデータベース研究が注目されている.特に,医薬品の適正使用や有害事象の把握など医療薬学領域では,医療ビッグデータを駆使したエビデンス創出が新たな潮流となりつつある.しかし,こうしたデータベース研究も,データベースそのものや解析手法の特性や限界を十分に理解しないまま実施すれば,誤った解釈や不適切な医療判断に繋がるリスクがある.したがって,薬剤師が臨床現場でデータベース研究を「武器」として活用するためには,解析手法のみならず,研究デザインの設計,データ構造などの断片的な教育ではなく,それらが有機的に繋がった包括的な教育が不可欠である.本稿では,臨床現場でのデータベース研究推進に求められる教育的視点を整理し,今後の薬学教育における課題について論じる.
データベース研究を実践するうえで前提として理解しておくべきなことは,「データベース研究は万能な解決手段(magic bullet)ではない」という姿勢である.目の前にデータがあるからといって,どのような問いでも適切に解決できるわけではない.むしろ,データの性質を正しく理解せずに研究利用すれば,不適切な結論や誤解を招く「毒」にもなりえる.薬剤師がデータベース研究を活用していくためには,こうした誤った思い込みに陥らず,基本的な視点を持つことが重要である.薬学領域で使用される各種データベースは,それぞれ異なる構造や収集方法,情報の粒度を持ち,特徴的な利点と限界を抱えている.したがって,研究を進める際には,個々のデータベースの特性を理解する視点が求められる.
一方で,研究成果の「結果」ばかりに注目が集まり,その背景にある研究プロセスが軽視される傾向もある.データベース研究では,結果の解釈に先立って「その結果がどのように導かれたのか」を確認することが不可欠である.実際に,交絡因子の不適切な制御や観察期間の設定ミスなどにより,結論が歪められたまま公表され,後の研究で否定されるケースも少なくない1).そのため,データベース研究を設計・評価する際には,対象集団の選定基準,観察期間,アウトカムの定義,バイアス制御,交絡因子の扱いなど,研究デザイン設計上の要素を総合的に検討する必要がある.薬学教育においても,研究結果そのものではなく,その結果が導かれるまでの過程に注目し,研究の全体構造に目を向ける力を養うことが求められる.
また,データベースの限界を無視して結果を誇張するような記述は,「Spin(スピン)」と呼ばれ,読み手に誤った印象を与える恐れがある2).こうしたスピンは,臨床判断のミスリードを招く恐れがある.データベース研究を真に臨床に活かすには,結果を批判的に読み解き,限界を踏まえてどのように臨床応用に結びつけるかを判断できる,実践的な視点の教育が不可欠である.
医療現場で用いられるRWDには,さまざまな種類がある.代表的なものとして,電子カルテ,診療報酬明細書(レセプト),健診データ,自発報告システム(SRS)等が挙げられる.これらのデータベースは,取得可能な情報の粒度,追跡可能性,収集の速さ,地域性,コストなどの面でそれぞれ特性が異なり,一長一短がある.例えば,レセプトデータは診療報酬の請求記録に基づくため,標準化された構造を持ち,患者の診療行為や薬剤投与,処置の履歴などを把握できる.また保険者ベースのレセプトデータの場合は対象集団の経時的な解析が可能である.一方で,レセプトデータには検査値や疾患重症度などの診療に関する情報が含まれておらず,曝露やアウトカム定義の正確性や臨床的重症度の情報粒度には限界がある.またSRSは,有害事象の自発的報告に基づいて構築されるデータベースであり,日本ではPMDAが提供するJADER,米国FDAが提供するFAERS,WHOが提供するVigibaseが活用されている.SRSの強みは,広域から集まる膨大な症例から新たな安全性シグナルを探索できる点にある.しかしSRSへの有害事象報告は自発的であるため,情報の欠如や重複,報告バイアスといった限界も併せ持ち,因果関係を証明することはできないという大きな欠点を有する3).このように,RWDにはそれぞれに特徴的な性質を有しており,この性質は機械学習といった複雑な解析手法を用いても打ち破ることはできない.RWDを用いたデータベース研究を開始するためには,これらデータの特徴を理解することが求められる.
これらのリアルワールドデータは,研究目的に応じて使い分ける必要がある.因果関係が不明な未知の副作用シグナルの早期検出にはSRSが適しており,医療費評価や長期的な治療パターンの把握にはレセプトデータが適している.薬学教育の現場では,こうしたデータの構造や収集背景,収載される情報の有無など,RWDの不完全さの視点に立った教育こそが,実践的なデータベース研究の基盤となる.
データベース研究において真に価値ある知見を得るためには,「何を解明したいのか」という臨床現場からの問いを出発点とすることが重要である.医療の現場では,ガイドラインや既存のエビデンスだけでは十分に対応できない場面に日常的に直面する.例えば,高齢者に対する新薬の使用経験が乏しい場合や,併用療法における安全性が明確でない場合など,臨床研究の不足による「エビデンスの空白地帯」は少なくない.こうした臨床疑問は,データベース研究によって解決すべき課題であり,教育においてもこのような問いを立てる力を養うことが重要である.一方で,近年の医療ビッグデータ整備や解析手法の進展により,「データがあるから使ってみる」といった “データベースドリブン” の研究も少なからず見られる.しかし,このようなアプローチでは,臨床的意義を持たない表面的な分析に終始し,研究が自己目的化する危険性がある.データベース研究において求められる姿勢は,現場で実際に生じている課題を的確に捉え,その解決に向けてデータの特徴を加味した最も適したRWDを選択し,研究を構築していく “臨床疑問ドリブン” の姿勢である.
この姿勢を確立するには,データベース研究のプロセス全体を理解する必要がある.上述の通り,各データベースは固有の構造や情報の粒度を持ち,その研究プロセスに問題を抱える場合が多い.例えば,SRSにおける副作用シグナルは定量的判断材料に使用することはできないにもかかわらず,副作用シグナルの絶対値を用いて薬剤同士の安全性を比較するような研究も散見される.また,レセプトデータは薬剤曝露や有害事象の定義が問題となることが起こりえる.例えばレセプトデータにおいて疾患や有害事象の発現はしばしばICD-10コードを用いて定義されるが,ICD-10コードは診療報酬請求を目的として付けられており,いわゆる「償還目的の仮病名」が含まれている場合がある.そのため,ICD-10コードのみを用いた定義では疾患定義の感度や特異度が低くなる可能性がある4).こうした問題に対応するために,処置コードや処方データと組み合わせて疾患を定義するなどの工夫が求められる.さらに,データベース研究ではバイアスの制御も極めて重要である.例えば「不死期間バイアス」は,治療群への割り付け前からフォローアップを開始する研究デザインにより,フォローアップから割り付け前の期間中には死亡などのアウトカムが発生しないことによって生じるバイアスである5).これは薬剤の有害事象と生存との関連を評価する研究において頻繁に問題となる.このように,レセプトデータの場合,データ定義の脆弱性やバイアスの影響により,研究手法の選択次第で結果が大きく変わる可能性がある.データベース研究を実施する前の段階で,それらRWDを用いた研究のプロセスを考え,問題点を把握し,適切な対応策を考えておくことで,どのような臨床疑問なら目の前のデータベースで解決できるのかを判断することができ,臨床疑問ドリブンなデータベース研究に繋がると考えられる.
このように,各RWDはそれぞれ異なる強みと限界を持っており,すべての臨床疑問に対して万能に応えるわけではない.そのため,我々はまず臨床上の課題を的確に言語化し,それに最も適したデータソースを選定し,得られる情報の範囲と限界を見極めたうえで,研究設計を行う必要がある.このような思考過程を教育の中で繰り返し訓練することによって,データベース研究は単なる技術や手法ではなく,臨床課題に立ち向かうための手段として活用できるようになる.
近年,スピンという概念が医療研究において注目されている.これは,研究結果を過度に肯定的に解釈し,得られた結果を過大解釈した印象を読者に与えるような記述を指す.SRSやレセプトといったリアルワールドデータには,構造的な欠損やバイアス,情報の網羅性の限界といった課題が常に付きまとう.そうした限界を無視し過大解釈した結論を導くことは,研究の本質を損なう可能性がある.例えば,探索的解析が主となるSRSを用いた研究では,統計的に有意な結果をあたかも因果関係を示すかのように記述する事例が報告されるなど,スピンを起こしやすいデータベース研究であることが示されている6).こうしたスピンは,臨床医や薬剤師などの医療従事者に誤ったメッセージを伝える可能性がある.データベース研究から得られる結果は,用いたデータの特性や研究デザイン,交絡因子の制御の程度といった前提条件のもとで導き出されたものであり,その限界を踏まえた慎重な解釈が求められる.
薬学教育の場では,学生が論文を読む立場としてだけでなく,将来研究を行う側となることを見据えて,スピンを避けるためのリテラシーを醸成することが重要である.仮説生成型の研究と因果推論型の研究の違いを理解し,結果の解釈にあたってはその証拠の強さと限界を自覚する必要がある.
臨床現場で薬剤師がデータベース研究を推進し,医療の質向上に貢献するためには,単なる統計解析スキルやツールの操作にとどまらず,データの本質を見極め,臨床と研究を橋渡しできる視座を育む教育が必要である.そのための基盤として,「特徴の理解」「課題の理解」「限界の理解」の3点の視点が重要であると考えられる.
まず,「特徴の理解」とは,各種データベースの構造や収集方法,情報の粒度,更新頻度,対象集団の特性など,データの持つ性質を的確に把握する力の醸成が必要である.どのような情報が得られ,どのような限界を含む可能性があるかを理解することは,研究デザイン設計と解釈の土台となる.
次に,「課題の理解」は,臨床現場における課題を適切に捉え,それに対してRWDを用いたアプローチが可能かどうかを見極める力である.データベースドリブンではなく臨床疑問ドリブンで研究課題を考え,その課題解決に適したRWDを選択する必要がある.さらに課題を解決するプロセスと結果の頑健性を事前に考え,適切な研究デザインを構築する柔軟性が求められる.
そして,「限界の理解」は,どのようなRWDであっても,構造的な欠損や交絡因子の制御困難性,収集目的に起因する制約などの限界を前提とした姿勢で研究を行う力である.データの限界を無視した解析は,研究結果の過度な一般化や誤った解釈を招き,臨床現場での応用において間違った臨床判断をとる原因となる.RWDの限界を認識したうえでの解釈が,信頼性のあるデータベース研究の基盤となる.
この3つの視点を軸とした薬学教育を通じて,薬剤師は単なるデータの読み手にとどまらず,自ら問いを立て,最適なデータを選び,臨床へ還元可能なエビデンスを創出する主体的な存在へと成長できると考えられる.
RWDを活用した研究の一例として,我々が実施した免疫チェックポイント阻害薬(immune checkpoint inhibitors: ICIs)とウイルス感染症の関連に関する解析を紹介する.ICIsは,がん細胞による免疫抑制の回避機構を解除し,自己の腫瘍免疫の賦活化により抗腫瘍効果を発揮する.近年,多くのがん種においてその有効性が認められ,がん治療の中核を担う薬剤となっている.一方で,ICIsの免疫活性化作用に起因する免疫関連有害事象が発現する.近年,ICIsにより活性化された免疫がウイルス感染症の再燃や顕在化を引き起こす可能性が指摘されており7),症例報告が散見されるものの,いまだその関連は不明であった.そこで我々は,SRSであるFAERSを用いて,ICIsとサイトメガロウイルス(cytomegalovirus: CMV)感染との関連性を解析した.その結果,イピリムマブとニボルマブの併用療法においては,患者の免疫抑制状態に関係なくCMV感染症との関連が見出された.一方,他のICIsでは,免疫抑制状態がある場合に限ってCMV感染症の発症が関連づけられた(図1).この結果は複数の感度分析によっても一貫性が見られており,SRSを用いて得られた結果の頑健性が示された8).

SRSを用いたICIsによるCMV感染症のシグナル解析.*はシグナル陽性を示す.ROR:reporting odds ratio
この結果はSRSによって得られたものであり,この結果をもってICIsとCMV感染症との因果関係を述べることはできない.そのため,次のアプローチとしてこれらの因果関係を解析する必要がある.しかし,ICIsによるCMV感染症の発症頻度は少なく,電子カルテを用いた因果解析の解析は困難である.そこで我々は現在,レセプトデータを用いて,ICIsとCMV感染症との因果関係や,ICIsによるCMV感染症がその後の予後に与える影響の解析に取り組んでいる.このように,RWDの欠点を相互に補完し合うために,複数のRWDを活用することは,解決するべき臨床課題の解決手段として有用であると考えられる.
医療のDX化が進展する中で,薬剤師にはデータ活用のスキルとともに,臨床ニーズに応じた課題解決力が強く求められている.データベース研究は,適切に行えば医療現場にとって極めて有用な「武器」となりうる.そのためには,単に解析手法を学ぶのではなく,データの特性や限界,解析上のバイアス,そして何よりも「何のためにそのデータを用いて研究を行うのか」という視点を育てる教育が重要である.
発表内容に関連し,開示すべき利益相反はない.