主催: 日本臨床薬理学会
【目的】近年の医薬品開発や臨床研究において,リアルワールドデータ(RWD)の利活用が期待されている.しかし,秘匿性が高いため複数の組織間でのデータ共有は困難であり,RWDを最大限活用できているとは言い難い.この課題に対して我々はRWDを基にした合成臨床データの生成および制御を行うことで,プライバシー情報開示のリスクを最小限に抑制でき,合成患者データの汎用的な利活用が可能となる.本研究では,大規模な医療データベースから患者属性が制御された合成患者データ生成が可能なAIの構築を目的としている.生成AIの一種である敵対的生成ネットワーク(GAN)を用いることでRWDにある年齢,性別,体重,腎機能のような患者属性間にある関係性が学習可能という仮説を立て,多種疾患医療情報を用いてGANを学習し合成患者の生成を試みた.【方法】GANの学習には,MDV(株)より購入した6疾患のデータを用いた.GANの生成器は,患者属性として性別,年齢,体重および身長,臨床検査値としてALT,ASTおよびSCRを生成するように構築した.また,GANには潜在変数と患者属性間の紐づけが可能な符号化器の要素を持つ機構を実装した.この機構により,任意の患者属性を持つ合成患者が生成可能となる.構築したGANによって,学習データであるRWDの特徴を考慮した合成患者データの生成を行った.妥当性の評価として,各属性の分布,相関,統計量,教師なし機械学習の次元削減法である主成分分析(PCA)とUMAPを用いており,制御精度の評価として平均絶対パーセント誤差(MAPE)を用いた.【結果・考察】全属性を制御した状態で学習データを再構成した結果,学習データと似た統計量を持つことが確認でき,各属性の分布や次元削減の結果も類似していた.全属性のMAPEは16.7%であり,例としてSCRのMAPEは8.9%であった.よって,全患者属性間の特徴や関係性の制御が可能になった.これは符号化器を取り入れたことで患者属性の関係性を学習できたためと考える.また,SCRのみ制御した状態で再構成した結果,MAPEは3.5%であり,単体の患者属性も制御可能であることが明らかとなった.【結論】生成AIに符号化器を取り入れたことによって,RWDの患者属性間の特徴や関係性を考慮した,患者属性を制御可能な合成患者データ生成が可能となった.