YAKUGAKU ZASSHI
Online ISSN : 1347-5231
Print ISSN : 0031-6903
ISSN-L : 0031-6903
誌上シンポジウム
レセプトデータベースを中心としたビッグデータの利活用
横山 聡 細見 光一
著者情報
ジャーナル フリー HTML

2023 年 143 巻 6 号 p. 497-500

詳細
Summary

With the development of information technology, patient information is stored as electronic data, and huge amounts of such data are collected every day. Such a collection compiled over the course of clinical practice is called real-world data and is expected to be used for evaluating drug efficacy and safety. Real-world data such as health insurance association-based administrative claims databases, pharmacy-based dispensing databases, and spontaneous reporting system databases are mainly used in pharmaceutical research. Among them, claims databases are used for various observational studies such as studies on nationwide prescription trends, pharmacovigilance studies, and studies on rare diseases due to their large sample size. Although the nature of omics data is different from that of real-world data, it has become accessible on cloud platforms and are being used to broaden the scope of research in recent years. In this paper, we introduce a method for generating and further testing hypotheses through integrated analysis of real-world data and omics data, with a focus on administrative claims databases.

1. はじめに

情報技術の発展に伴い,個々の患者の医療情報は電子データとして格納され,日々膨大な量の電子データが蓄積されている.このような,実臨床下で収集された各種電子データの集合体はリアルワールドデータと呼ばれ,医薬品の有効性や安全性を評価するための利活用が期待されている.

健康保険組合をベースとしたレセプトデータベースや保険薬局をベースとした調剤データベース,日本や米国等の有害事象自発報告データベースなどのリアルワールドデータが主に薬学研究に利用されている.中でもレセプトデータベースは,全国的な処方動向の調査研究やファーマコビジランスに関する研究,サンプル数が多いことから希少な疾患を対象にした研究など,様々な観察研究に用いられている.リアルワールドデータとは性質を異にするが,近年ではクラウドプラットフォーム上でゲノム・オミックス情報へのアクセスも可能となった.このような網羅的分子情報に関するデータベースも研究の幅を広げるために活用されている.本稿では,レセプトデータベースを中心に,リアルワールドデータやオミックス情報などのビッグデータを統合的に解析することで,仮説を生成し,更に検証する手法について紹介する.

2. レセプトデータベースの特性

レセプトデータベースは,診療報酬明細書であるレセプト情報やDPCデータなどの公的医療保険データを蓄積した保険者ベースのデータベースである.2022年4月時点,複数のレセプトデータベースが日本薬剤疫学会から報告されている(https://drive.google.com/file/d/1JAnjIcuNTBq6w-iyhIlIVt0-JFGTwjgV/view).われわれは,この中の株式会社JMDCが取り扱うレセプトデータベースを主に使用している.このレセプトデータベースを研究対象とするうえでのメリットとしては,まず,データがクリーニング済みであり,利用制限が特に設けられていないため,研究をすぐに実行に移すことが可能な点が挙げられる.また,データ対象が健康保険組合の加入者であるため,様々な年代や性別に対応した罹患率や有病率の調査が可能となる.1個々の加入者には,固有の識別番号が振られており,医療機関をまたいで当該加入者を長期間追跡できる点もメリットである.医療機関ベースのデータベース,例えば特定の医療機関の中での電子カルテ情報や検査値情報などのデータベースは,当該医療機関内でのみ完結できるようなアウトカム設定であれば有用なデータベースとなるが,数ヵ月あるいは数年にわたってアウトカムを追跡するような研究であれば,レセプトデータベースの方が有用であろう.一方,健康保険組合の加入者という条件のために65歳以上の加入者数が少ないという点や,診療報酬を請求するためのデータであることから,いわゆるレセプト病名と呼ばれるものが存在し,レセプト病名が治癒後もデータベース上に残存し得る点など,これらレセプトデータベース特有の性質を十分理解したうえで取り扱わなければならない.

3. 仮説を生成する研究手法

レセプトデータベースを使った仮説を生成する研究手法としてsequence symmetry analysisが挙げられる.2この手法は,経時的な情報を有するデータベースを使って,医薬品による未知の有害事象のシグナルを検出するためのファーマコビジランスツールとして活用されている.研究デザインとしては,アウトカムが発生した患者自身をコントロールとする自己対照デザインであり,調査対象患者の曝露とアウトカムがわかれば解析が可能である.曝露からアウトカムの順に発生した患者数を,アウトカムから曝露の順に発生した患者数で除することによって,曝露とアウトカムの関連性をシグナルによって評価する.自己対照デザインであるため時間非依存性交絡はコントロールできるが,一方,時間依存性の交絡はコントロールできないため,結果の解釈時にはこの点を考慮する必要がある.そのほかの仮説を生成する研究手法としては,有害事象自発報告データベースを用いたdisproportionality analysisが従来から汎用されている.3これは,ある医薬品のある有害事象の報告件数を,その他すべての医薬品の当該有害事象の報告件数と比較することでシグナルを検出し,未知の因果関係の仮説を生成するという手法である.この研究手法は様々なバイアスを含むことから,シグナルの検出=因果関係の成立とはならない点に留意しなければならない.4われわれは上記2種類の仮説生成手法を組み合わせることで医薬品と有害事象の関連性について報告してきたが,5,6これら解析手法は簡便に実行できるため,スクリーニングツールとして非常に有用であると考える.

リアルワールドデータから引き出された仮説は,あくまでも臨床現場の一現象をとらえたに過ぎない.その現象を裏づけるような分子情報を付加することができれば,仮説をより強固にできると考える.近年はヒトのゲノム・オミックス情報を始めとする網羅的分子情報に関するデータベースがクラウドプラットフォーム上で活用できるようになってきた.例えば,トランスクリプトームデータベースから医薬品や疾患に特異的な遺伝子発現プロファイルを引き出し,双方の発現プロファイルが同一パターンの場合,医薬品によって疾患が引き起こされる可能性があるという仮説を生成することができる.一方,発現プロファイルが逆のパターンを示すような場合,医薬品が疾患に対して有効性を示す可能性があるという仮説を生成することができる.7さらに,遺伝子発現プロファイルから得られた網羅的な発現変動遺伝子情報が,様々なシグナル伝達経路や代謝経路に及ぼす影響はパスウェイエンリッチメント解析によって検討できる.8医薬品と疾患に関連する網羅的分子情報をハンドリングして生み出される仮説が,新たな分子メカニズムの解明の足掛かりとなる.ビッグデータから仮説を生成する際は,単一のデータベースからの結果のみではなく,複数のデータベース,複数の解析アルゴリズムを用いることによって,仮説の頑健性を高めることが有用である.

4. 仮説を検証する研究手法

仮説を検証する研究手法として,臨床研究のゴールドスタンダードは介入研究であるランダム化比較試験とされてきた.これは,交絡を調整したうえで,対象集団を2群に割り付けて,例えば医薬品の有無による効果を評価するときなどに用いられる研究手法である.一方,レセプトデータベースなどのリアルワールドデータを使った仮説を検証する研究手法は分析的観察研究に分類され,コホート研究やケース・コントロール研究が挙げられる.

コホート研究は前向き観察研究として定義されるが,レセプトデータベースを使ったコホート研究では,ある時点までさかのぼってコホートを特定する点が通常のコホート研究と異なる.コホートを特定した後は,曝露群と非曝露群での観察が開始され,アウトカムが発生するまで,あるいは観察期間が終了するまで追跡するのは通常のコホート研究と同じである.いったん過去にさかのぼってコホートを特定するが,因果関係の方向が曝露からアウトカムの方へ向かうので前向きと考えられ,ヒストリカルコホート研究とも呼ばれる.ケース・コントロール研究はアウトカムが発生した群と発生しなかった群について,それら2群間での曝露の違いを過去にさかのぼって調査し,因果推論を行う研究手法である.アウトカムからさかのぼって曝露を調査することから後ろ向き観察研究と呼ばれる.近年では経時的情報を有するデータベースを用いたネステッド・ケース・コントロール研究が盛んに行われている.これはある特定のコホートを対象として,そのコホート内でケース・コントロールを行う研究手法である.ケースが発生した時点を基準として,その時点のリスク集団の中からコントロールを時点マッチングでサンプリングする.基準点からさかのぼって曝露を調査し,ケースとコントロールを比較する.条件付きロジスティック回帰分析によって得られたオッズ比は,時間依存性の曝露に対するCoxモデルから得られるハザード比に近似する.9現在,JMDCレセプトデータベース内の累積母集団数は約1400万人とされている(https://www.jmdc.co.jp/jmdc-claims-database/).これは,日本の総人口数の10%を超える.これまで単施設ではサンプル数が問題で実行できなかったような臨床研究でも,レセプトデータベースを活用することで実行が可能となり,新たな知見の創出につながると考える.

5. ビッグデータの活用例~ドラッグ・リポジショニング研究~

ビッグデータの活用例として,われわれが行ったドラッグ・リポジショニング研究について簡単に紹介する.抗精神病薬がサイトカインの血中レベルを変動させ,抗炎症効果を有する可能性がメタアナリシスによって報告されていた.10われわれは,免疫システムが疾患発症に関与する関節リウマチに着目し,抗精神病薬と関節リウマチの関連性についてビッグデータを用いた検討を行った.Sequence symmetry analysisやdisproportionality analysisは曝露とアウトカムの関連をシグナルによって評価する解析手法であり,閾値を有意に上回った場合にシグナルありと解釈する.一方,閾値を有意に下回った場合に,われわれはこれを逆シグナルあり,すなわち曝露がアウトカムを抑制する可能性ありと解釈することでドラッグ・リポジショニングに応用できる可能性をこれまでに報告している.11,12そこで,sequence symmetry analysisとdisproportionality analysisを実行した結果,双方で定型抗精神病薬であるハロペリドールと関節リウマチとの間に逆シグナルが認められた.さらに,トランスクリプトームデータベースから得られた情報を基に,関節リウマチによって亢進しているパスウェイ,例えばToll様受容体シグナル伝達経路やT細胞受容体シグナル伝達経路をハロペリドールが抑制する可能性をパスウェイエンリッチメント解析によって明らかにした.13現在は因果関係について詳細な検討を行っている.

6. おわりに

ビッグデータを活用した研究手法として,レセプトデータベースや有害事象自発報告データベースといったリアルワールドデータとオミックス情報を統合的に解析する際の研究デザインをFig. 1に示した.上述したドラッグ・リポジショニング研究に限らず,様々な薬学研究を実施するうえで,この研究デザインは汎用性に富んでいると考える.複数のビッグデータを活用することで仮説の生成から検証までを比較的短時間で一貫して実行できるというメリットは大きい.今後,このようなビッグデータを使った薬学研究がますます発展していくことを期待する.

Fig. 1. Research Flow Using Big Data
謝辞

本総説執筆の機会を与えて頂いた百 賢二先生,武隈 洋先生に深謝いたします.本研究はJSPS科研費JP19K16461の助成を受けたものです.

利益相反

開示すべき利益相反はない.

Notes

本総説は,日本薬学会第142年会シンポジウムS31で発表した内容を中心に記述したものである.

REFERENCES
 
© 2023 公益社団法人日本薬学会
feedback
Top